Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn
Khái niệm cơ bản (1/2)
• Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau
• Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi
• Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên
• Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc
hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi
thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y
tương ứng
• Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ
thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật
phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x)
• Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng
biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh
hưởng hoàn toàn đến sự biến đổi này
Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng nâng cao - Chương 10: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo v 1.1 - 04/2013 Phân tích hồi quy tương quan và dự báo kinh tế 1 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Nội dung 2 1. Hồi quy và tương quan 1.1. Phân tích tương quan 1.2. Phân tích hồi quy 2. Dự báo Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Hồi quy và tương quan 3 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Khái niệm cơ bản (1/2) 4 • Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau • Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi • Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên • Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y tương ứng • Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x) • Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh hưởng hoàn toàn đến sự biến đổi này Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Khái niệm cơ bản (2/2) • Phân tích tương quan - đo mức độ kết hợp tuyến tính giữa hai biến • Không có sự phân biệt giữa các biến • Các biến có tính chất đối xứng • Phân tích hồi quy - nghiên cứu mối liên hệ phụ thuộc của một biến với một hay nhiều biến khác • Biến phụ thuộc • Biến độc lập 5 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Phân tích tương quan 6 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Hệ số tương quan 7 • Hệ số tương quan - đo lường mức độ quan hệ tuyến tính giữa hai biến • Quan hệ tuyến tính giữa hai biến không phân biệt biến này phụ thuộc vào biến kia • Tính chất : • Hệ số tương quan không có đơn vị, có tính hoán đổi và • dương - hai biến có quan hệ cùng chiều (đồng biến) • - X và Y độc lập hoặc có quan hệ phi tuyến • - X và Y có quan hệ tuyến tính • - tương quan mạnh • - tương quan TB • - tương quan yếuρXY > 0.8 ρXY = 0.4 − 0.8 ρXY < 0.4 ρ = Corr(X,Y ) = Cov(X,Y ) σ xσ y ρXY = ρYX ρXY ≤ 1 ρXY = 0 ρXY ρXY = 1 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo CORREL Correlation • Chức năng : tính hệ số tương quan của hai yếu tố • Cú pháp 8 CORREL (array1, array2) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Correlation 9 Vùng địa chỉ dữ liệu cần tính độ tương quan Dữ liệu theo hàng hay cộtVùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Bấm OK để thực hiện tính toán Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 10 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 11 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Đồng phương sai • Là trung bình của tích các cặp sai lệch • Dùng để xác định mối quan hệ giữa hai tập số liệu • Giá trị không giới hạn trong [-1, 1] • Hàm COVAR 12 Cov(x, y) = 1n (x j − µx )(yi − µy )i=1 n ∑ COVAR (array1, array2) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Covariance 13 Vùng địa chỉ dữ liệu cần tính đồng phương sai Dữ liệu theo hàng hay cộtVùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Bấm OK để thực hiện tính toán Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 14 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 15 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Phân tích hồi quy 16 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Hồi quy tuyến tính đơn 17 • Dạng đơn giản nhất của một mô hình hồi qui chứa một biến phụ thuộc và một biến độc lập • Hệ số r2 (phương sai mẫu) - đo độ phù hợp của mô hình hồi quy Y = β0 + β1X RSQ (known_y’s, known_x’s) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo SLOPE và INTERCEPT • Intercept dùng để ước lượng hệ số góc của phương trình hồi quy tuyến tính đơn • Slope dùng để ước lượng tung độ góc của phương trình hồi quy tuyến tính đơn • Cú pháp 18 β0 β1 SLOPE (known_y’s, known_x’s) INTERCEPT (known_y’s, known_x’s) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Regression 19 Vùng địa chỉ dữ liệu cho biến phụ thuộc Chọn để loại bỏ hệ số góc Vùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Bấm OK để thực hiện tính toánVùng địa chỉ dữ liệu cho các biến độc lập Độ tin cậy Các tuỳ chọn hiển thị sai số Phân phối chuẩn Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 20 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 21 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Hồi quy tuyến tính bội • Mô hình thể hiện mức độ phụ thuộc tuyến tính của biến phụ thuộc Y với các biến độc lập Xi • Hàm LINEST Trong đó • const = 0/false - bỏ qua • stat = 1/true - tính toán các tham số thống kê 22 β0 Y = β0 + β1X1 + ..+ βk Xk LINEST (known_y’s, [known_x’s], [const], [stat]) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 23 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Ví dụ 24 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Hồi quy phi tuyến • Biến đổi các phương trình phi tuyến thành phương trình tuyến tính để dễ dàng hồi quy • Phương trình hyperbol , đặt để đưa về • Phương trình parabol , đặt để đưa về phương trình hồi quy bội • Hàm sản xuất Cobb Douglas , ta có thể biến đổi bằng cách logarit hoá hai vế 25 y = a x y = az1x = z y = ax2 + bx + c z1 = x2 , z2 = x y = az1 + bz2 + c y = Ax1b1 ..xibi ..xnbn ln y = lnA + b1 ln x1 + bn ln xn Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Đường xu thế 26 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo TrendLine - Đường xu thế • Là đường thể hiện sự phụ thuộc của một biến nghiên cứu vào biến thời gian • Hàm hồi quy của Y phụ thuộc vào X (biến thời gian) • Các giá trị của X bắt đầu từ 1 đến n • Các bước thực hiện tìm đường xu thế : • Vẽ đồ thị XY (Scatter) cho Y • Nháy phải chuột lên một điểm bất kỳ trên đường đồ thị, chọn Add TrendLine... • Chọn loại đường xu thế, đánh dấu hai nút Display Equation on Chart và Display R-squared value on chart • Loại đường xu thế với R2 lớn nhất là đường thể hiện tốt nhất dữ liệu của biến Y 27 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo TrendLine - Đường xu thế 28 1. Chọn vùng địa chỉ C2:C16 2. Vẽ đồ thị XY(Scatter) 3. Nháy phải chuột lên một điểm trên đường đồ thị, chọn Add TrendLine... Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Format TrendLine 29 Cho hiển thị phương trình và giá trị R2 trên đồ thị Đặt tên cho đường xu thế Thiết lập hệ số góc Các kiểu đường xu thế Hàm e mũHàm tuyến tính Hàm đa thức (có thể xác định bậc đa thức) Hàm log Hàm mũ Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Đường xu thế 30 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Dự báo 31 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Dự báo 32 • Dự báo là phán đoán những sự kiện sẽ xảy ra trong tương lai trên cơ sở phân tích khoa học các dữ liệu của quá khứ và hiện tại nhờ một số mô hình toán học • Theo tầm của dự báo • Dự báo dài hạn • Dự báo trung hạn • Dự báo ngắn hạn • Theo kết quả • Dự báo định tính • Dự báo định lượng • Dự báo dựa trên hàm hồi qui tương quan Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Dự báo nhờ hàm hồi quy • Sau khi xác định được mô hình hồi qui, người ta thay các giá trị của các biến độc lập vào phương trình hồi qui để dự báo • Ví dụ : dự báo số xe bán được khi giá xăng là 2$/gallon và dân số tăng 70 nghìn Phương trình hồi quy sau khi đã kiểm định Thay các giá trị vào phương trình Kết quả 33 y = 57.41x1 + 0.53x2 y = 152.17 x1 = 2, x2 = 70 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo Dự báo nhờ đường xu thế • Sau khi xác định được phương trình của đường xu thế, chúng ta gán giá trị thời gian vào các biến X để tính được giá trị dự báo của biến Y • Ví dụ : dự báo đầu tư cho công nghiệp năm 2014 Phương trình đường xu thế Thay giá trị vào phương trình trên Kết quả 34 y = −7.6675x4 + 250.15x3 − 2343.5x2 + 9410.6x +18012 x = 20 y = 43224 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo FORECAST • Chức năng : dự báo theo phương pháp hồi quy tuyến tính đơn • Cú pháp 35 FORECAST (x, known_y’s, known_x’s) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo TREND • Chức năng : dự báo theo phương pháp hồi qui tuyến tính bội • Cú pháp 36 TREND (known_y’s, known_x’s, new_x, [const]) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích hồi quy và dự báo GROWTH • Chức năng : dự báo theo hàm mũ • Cú pháp 37 GROWTH (known_y’s, known_x’s, new_x, [const]) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Cảm ơn sự chú ý Câu hỏi ? Phân tích hồi quy và dự báo38 Wednesday, May 8, 13
File đính kèm:
- bai_giang_tin_hoc_ung_dung_nang_cao_chuong_10_phan_tich_hoi.pdf