Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn

Khái niệm cơ bản (1/2)

• Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau

• Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi

• Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên

• Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc

hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi

thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y

tương ứng

• Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ

thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật

phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x)

• Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng

biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh

hưởng hoàn toàn đến sự biến đổi này

pdf 38 trang yennguyen 3480
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn

Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
v 1.1 - 04/2013
Phân tích hồi quy tương quan 
và dự báo kinh tế
1
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Nội dung
2
1. Hồi quy và tương quan
1.1. Phân tích tương quan
1.2. Phân tích hồi quy
2. Dự báo
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Hồi quy và tương quan
3
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Khái niệm cơ bản (1/2)
4
• Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau
• Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi
• Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên
• Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc 
hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi 
thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y 
tương ứng
• Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ 
thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật 
phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x)
• Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng 
biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh 
hưởng hoàn toàn đến sự biến đổi này
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Khái niệm cơ bản (2/2)
• Phân tích tương quan - đo mức độ kết hợp tuyến tính giữa hai 
biến
• Không có sự phân biệt giữa các biến
• Các biến có tính chất đối xứng
• Phân tích hồi quy - nghiên cứu mối liên hệ phụ thuộc của một 
biến với một hay nhiều biến khác
• Biến phụ thuộc
• Biến độc lập
5
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Phân tích tương quan
6
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Hệ số tương quan
7
• Hệ số tương quan - đo lường mức độ quan hệ tuyến tính giữa 
hai biến
• Quan hệ tuyến tính giữa hai biến không phân biệt biến này phụ thuộc vào 
biến kia
• Tính chất :
• Hệ số tương quan không có đơn vị, có tính hoán đổi và 
• dương - hai biến có quan hệ cùng chiều (đồng biến)
• - X và Y độc lập hoặc có quan hệ phi tuyến
• - X và Y có quan hệ tuyến tính
• - tương quan mạnh
• - tương quan TB
• - tương quan yếuρXY > 0.8
ρXY = 0.4 − 0.8
ρXY < 0.4
ρ = Corr(X,Y ) = Cov(X,Y )
σ xσ y
ρXY = ρYX ρXY ≤ 1
ρXY = 0
ρXY
ρXY = 1
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
CORREL Correlation
• Chức năng : tính hệ số tương quan của hai yếu tố
• Cú pháp
8
CORREL (array1, array2)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Correlation
9
Vùng địa chỉ dữ liệu 
cần tính độ tương 
quan
Dữ liệu theo hàng hay cộtVùng địa chỉ dữ liệu 
được chọn bao gồm 
cả nhãn ?
Nơi chứa kết quả tính được 
Bấm OK để thực hiện 
tính toán
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
10
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
11
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Đồng phương sai
• Là trung bình của tích các cặp sai lệch
• Dùng để xác định mối quan hệ giữa hai tập số liệu
• Giá trị không giới hạn trong [-1, 1]
• Hàm COVAR
12
Cov(x, y) = 1n (x j − µx )(yi − µy )i=1
n
∑
COVAR (array1, array2)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Covariance
13
Vùng địa chỉ dữ liệu 
cần tính đồng phương 
sai
Dữ liệu theo hàng hay cộtVùng địa chỉ dữ liệu 
được chọn bao gồm 
cả nhãn ?
Nơi chứa kết quả tính được 
Bấm OK để thực hiện 
tính toán
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
14
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
15
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Phân tích hồi quy
16
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Hồi quy tuyến tính đơn
17
• Dạng đơn giản nhất của một mô hình hồi qui chứa một biến 
phụ thuộc và một biến độc lập
• Hệ số r2 (phương sai mẫu) - đo độ phù hợp của mô hình hồi 
quy
Y = β0 + β1X
RSQ (known_y’s, known_x’s)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
SLOPE và INTERCEPT
• Intercept dùng để ước lượng hệ số góc của phương trình 
hồi quy tuyến tính đơn
• Slope dùng để ước lượng tung độ góc của phương trình hồi 
quy tuyến tính đơn
• Cú pháp
18
β0
β1
SLOPE (known_y’s, known_x’s)
INTERCEPT (known_y’s, known_x’s)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Regression
19
Vùng địa chỉ dữ liệu 
cho biến phụ thuộc
Chọn để loại bỏ hệ số góc
Vùng địa chỉ dữ liệu 
được chọn bao gồm 
cả nhãn ?
Nơi chứa kết quả tính được 
Bấm OK để thực hiện 
tính toánVùng địa chỉ dữ liệu 
cho các biến độc lập
Độ tin cậy
Các tuỳ chọn hiển thị 
sai số
Phân phối chuẩn
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
20
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
21
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Hồi quy tuyến tính bội
• Mô hình thể hiện mức độ phụ thuộc tuyến tính của biến phụ 
thuộc Y với các biến độc lập Xi
• Hàm LINEST
Trong đó
• const = 0/false - bỏ qua 
• stat = 1/true - tính toán các tham số thống kê
22
β0
Y = β0 + β1X1 + ..+ βk Xk
LINEST (known_y’s, [known_x’s], [const], [stat])
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
23
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Ví dụ
24
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Hồi quy phi tuyến
• Biến đổi các phương trình phi tuyến thành phương trình tuyến 
tính để dễ dàng hồi quy
• Phương trình hyperbol , đặt để đưa về 
• Phương trình parabol , đặt để 
đưa về phương trình hồi quy bội 
• Hàm sản xuất Cobb Douglas , ta có thể biến 
đổi bằng cách logarit hoá hai vế
25
y = a x y = az1x = z
y = ax2 + bx + c z1 = x2 , z2 = x
y = az1 + bz2 + c
y = Ax1b1 ..xibi ..xnbn
ln y = lnA + b1 ln x1 + bn ln xn
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Đường xu thế
26
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
TrendLine - Đường xu thế
• Là đường thể hiện sự phụ thuộc của một biến nghiên cứu vào 
biến thời gian
• Hàm hồi quy của Y phụ thuộc vào X (biến thời gian)
• Các giá trị của X bắt đầu từ 1 đến n
• Các bước thực hiện tìm đường xu thế :
• Vẽ đồ thị XY (Scatter) cho Y
• Nháy phải chuột lên một điểm bất kỳ trên đường đồ thị, chọn Add 
TrendLine...
• Chọn loại đường xu thế, đánh dấu hai nút Display Equation on Chart và 
Display R-squared value on chart
• Loại đường xu thế với R2 lớn nhất là đường thể hiện tốt nhất dữ liệu của 
biến Y
27
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
TrendLine - Đường xu thế
28
1. Chọn vùng địa chỉ C2:C16
2. Vẽ đồ thị XY(Scatter)
3. Nháy phải chuột lên một điểm trên đường 
đồ thị, chọn Add TrendLine...
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Format TrendLine
29
Cho hiển thị phương trình 
và giá trị R2 trên đồ thị
Đặt tên cho đường xu thế
Thiết lập hệ số góc
Các kiểu đường xu thế
Hàm e mũHàm tuyến tính
Hàm đa thức (có thể xác 
định bậc đa thức)
Hàm log
Hàm mũ
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Đường xu thế
30
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Dự báo
31
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Dự báo
32
• Dự báo là phán đoán những sự kiện sẽ xảy ra trong tương lai 
trên cơ sở phân tích khoa học các dữ liệu của quá khứ và hiện 
tại nhờ một số mô hình toán học
• Theo tầm của dự báo
• Dự báo dài hạn
• Dự báo trung hạn
• Dự báo ngắn hạn
• Theo kết quả
• Dự báo định tính
• Dự báo định lượng
• Dự báo dựa trên hàm hồi qui tương quan
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Dự báo nhờ hàm hồi quy
• Sau khi xác định được mô hình hồi qui, người ta thay các giá trị 
của các biến độc lập vào phương trình hồi qui để dự báo
• Ví dụ : dự báo số xe bán được khi giá xăng là 2$/gallon và dân 
số tăng 70 nghìn
Phương trình hồi quy sau khi đã kiểm định
Thay các giá trị vào phương trình
Kết quả 
33
y = 57.41x1 + 0.53x2
y = 152.17
x1 = 2, x2 = 70
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
Dự báo nhờ đường xu thế
• Sau khi xác định được phương trình của đường xu thế, chúng ta 
gán giá trị thời gian vào các biến X để tính được giá trị dự báo 
của biến Y
• Ví dụ : dự báo đầu tư cho công nghiệp năm 2014
Phương trình đường xu thế
Thay giá trị vào phương trình trên
Kết quả
34
y = −7.6675x4 + 250.15x3 − 2343.5x2 + 9410.6x +18012
x = 20
y = 43224
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
FORECAST 
• Chức năng : dự báo theo phương pháp hồi quy tuyến tính đơn
• Cú pháp
35
FORECAST (x, known_y’s, known_x’s)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
TREND
• Chức năng : dự báo theo phương pháp hồi qui tuyến tính bội
• Cú pháp
36
TREND (known_y’s, known_x’s, new_x, [const])
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo
GROWTH
• Chức năng : dự báo theo hàm mũ
• Cú pháp
37
GROWTH (known_y’s, known_x’s, new_x, [const])
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn
Cảm ơn sự chú ý
Câu hỏi ?
Phân tích hồi quy và dự báo38
Wednesday, May 8, 13

File đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_nang_cao_chuong_10_phan_tich_hoi.pdf