Bài giảng Kinh tế lượng - Cao Tấn Bình

Chƣơng 1 KHÁI QUÁT VỀ KINH TẾ LƢỢNG

1.1 Giới thiệu về môn học kinh tế lƣợng

Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A. K

Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930.

Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong

thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính

nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng

kinh tế và phân tích các chính sách kinh tế.

Nền tảng của kinh tế lượng:

 Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính.

Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công

nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và

chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có,

 Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế

dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những

mô hình toán học này có đúng đắn về mặt thực nghiệm hay không.

 Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số

liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng.

Mục đích của kinh tế lượng

 Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối

quan hệ giữa các biến số kinh tế với nhau.

 Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số.

 Kiểm định giả thuyết.

 Đưa ra dự báo và mô phỏng hiện tượng kinh tế.

 Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh

tế lượng.

pdf 131 trang yennguyen 7080
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Cao Tấn Bình", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Kinh tế lượng - Cao Tấn Bình

Bài giảng Kinh tế lượng - Cao Tấn Bình
1 
TRƢỜNG ĐẠI HỌC QUY NHƠN 
KHOA KINH TẾ & KẾ TOÁN 
CAO TẤN BÌNH 
BÀI GIẢNG KINH TẾ LƢỢNG 
Quy Nhơn, 9/2017 
2 
Chƣơng 1 KHÁI QUÁT VỀ KINH TẾ LƢỢNG 
1.1 Giới thiệu về môn học kinh tế lƣợng 
Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A. K 
Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930. 
Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong 
thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính 
nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng 
kinh tế và phân tích các chính sách kinh tế. 
Nền tảng của kinh tế lượng: 
 Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính. 
Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công 
nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và 
chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có, 
 Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế 
dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những 
mô hình toán học này có đúng đắn về mặt thực nghiệm hay không. 
 Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số 
liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng. 
Mục đích của kinh tế lượng 
 Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối 
quan hệ giữa các biến số kinh tế với nhau. 
 Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số. 
 Kiểm định giả thuyết. 
 Đưa ra dự báo và mô phỏng hiện tượng kinh tế. 
 Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh 
tế lượng. 
1.2 Phƣơng pháp luận nghiên cứu của kinh tế lƣợng 
 Nêu vấn đề nghiên cứu và các giả thuyết: Nghiên cứu quan hệ giữa thu nhập và 
tiêu dùng, mức lãi suất thay đổi và cầu về tiền, năng suất lao động với vốn, lao 
động và khoa học công nghệ, 
 Thiết lập mô hình: Dựa vào lý thuyết kinh tế để định dạng các mô hình cụ thể cho 
các bài toán cụ thể. Chẳng hạn, người ta có thể sử dụng hàm tuyến tính để mô tả 
mối quan hệ giữa thu nhập Y và tiêu dùng X như sau: 
3 
Y X  
Tuy nhiên trong thực tế, với cùng một mức thu nhập thì chi tiêu tiêu dùng có thể 
khác nhau. Do vậy mô hình toán học thuần túy như trên chưa phản ánh được tình 
huống kinh tế này. Mô hình kinh tế lượng được đề xuất một cách hợp lý với nhiễu 
ngẫu nhiên U như sau: 
Y X U  
 Thu thập và xử lý số liệu: Quan tâm đến số liệu của mẫu và số liệu của tổng thể. 
 Ước lượng các tham số của mô hình: Sử dụng các phương pháp như phương pháp 
bình phương tối thiểu OLS (Ordinary Least Squares), phương pháp ước lượng 
hàm hợp lý tối đa MLE (Maximum Likelihood Estimation), Chẳng hạn, phương 
trình mô tả quan hệ giữa tiêu dùng Y và thu nhập X từ chuỗi số liệu của Mỹ giai 
đoạn 1982-1996 bằng phương pháp OLS là: 
184.078 0.706408Y X 
Nhìn vào kết quả hồi quy này, ta thấy xu hướng tiêu dùng cận biên của nền kinh tế 
Mỹ giai đoạn 1982-1996 là 2 0.706408 . 
 Kiểm định mô hình: Mục đích của kiểm định là kiểm chứng lại mô hình hoặc lý 
thuyết kinh tế. Theo ví dụ trên, ta có trị số về xu hướng tiêu dùng cận biên là 
2 0.706408 0 phù hợp với lý thuyết kinh tế của Keynes về Thu nhập-Tiêu 
dùng. Tuy nhiên, ta cũng cần xác định thêm giá trị này có thỏa mãn 20 1 với 
ý nghĩa thống kê hay không. 
 Dự báo và sử dụng mô hình để quyết định chính sách: Dựa vào kết quả của mô 
hình trên, có thể dự báo tác động của chính sách kinh tế. Ngoài ra, kết quả hồi quy 
này có thể giúp ích cho Chính phủ trong việc phân tích chính sách đầu tư, chính 
sách thuế (giảm thuế -> tăng thu nhập khả dụng -> tăng tiêu dùng -> tăng tổng 
cầu). 
1.3 Số liệu cho nghiên cứu kinh tế lƣợng 
Có ba dạng dữ liệu kinh tế có bản: Dữ liệu theo thời gian (Time Series Data), dữ liệu theo 
không gian (dữ liệu chéo) (Cross Data) và dữ liệu hỗn hợp (dữ liệu bảng) (Panel Data). 
Nguồn số liệu: 
 Các cơ quan nhà nước: Tổng cục thống kê, Uỷ ban Nhân dân thành phố, 
 Các cơ quan quốc tế: Ngân hàng thế giới (WB), Qũy tiền tệ thế giới (IMF), 
4 
 Các cơ quan và tổ chức tư nhân. 
 Wedsite. 
1.4 Chất lƣợng của số liệu 
Chất lượng của số liệu kinh tế-xã hội thường không tốt bởi các nguyên nhân sau đây: 
 Bỏ sót số liệu. 
 Sai sót về kỹ thuật thu thập thông tin (bảng câu hỏi không phù hợp, nội dung câu 
hỏi không chính xác,). 
 Nhầm lẫn khi quan sát, ghi nhận thông tin. 
 Sai số do dụng cụ đo lường. 
 Sai số khi chọn mẫu không có tính đại diện cao. 
 Mức độ tổng hợp và bảo mật của số liệu sử dụng. 
 Đối tượng cung cấp thông tin thiếu trung thực, không đầy đủ hoặc từ chối trả lời. 
1.5 Vai trò của máy vi tính và phần mềm chuyên dụng 
Hầu hết các bài toán trong kinh tế lượng liên quan đến việc xử lý một khối lượng số liệu 
rất lớn, do đó cần đến sự trợ giúp của máy vi tính và các chương trình hỗ trợ tính toán, 
chẳng hạn như: Excel, EVIEWS, SPSS, STATA, R, 
5 
Chƣơng 2 MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN 
2.1 Mô hình và một số khái niệm 
2.1.1 Mô hình hồi quy 
Mô hình hồi quy tuyến tính hai biến: 
1 2Y X U  (2.1.1) 
 Y: Biến phụ thuộc hay biến được giải thích (explained variable) 
 X: Biến độc lập hay biến giải thích (explanatory variable) 
 U: Sai số ngẫu nhiên, giả thiết ( | ) 0E U X 
1 2,  : Các hằng số 
2.1.2 Hàm hồi quy tổng thể 
Khi ( | ) 0E U X , từ (2.1.1) ta có 
1 2( | )E Y X X  (2.1.2) 
Phương trình (2.1.2) được gọi là hàm hồi quy tổng thể PRF (Population Regression 
Function). 
1 : Hệ số chặn, bằng giá trị trung bình của biến Y khi X = 0. 
2 : Hệ số góc, thể hiện quan hệ giữa X và ( | )E Y X . 
2 0 : Khi X tăng (giảm) một đơn vị thì ( | )E Y X tăng (giảm) 2 đơn vị. 
2 0 : Khi X tăng (giảm) một đơn vị thì ( | )E Y X giảm (tăng) 2 đơn vị. 
2.1.3 Hàm hồi quy mẫu 
Để phản ánh hàm hồi quy tổng thể cho tổng thể, cần xây dựng hàm hồi quy mẫu trên 
mẫu. Nếu hàm hồi quy tổng thể mô tả xu thế biến động về mặt trung bình của biến phụ 
thuộc theo biến độc lập trong tổng thể, thì hàm hàm hồi quy mẫu là hàm số mô tả xu thế 
biến động đó nhưng trong mẫu. Vì hàm hồi quy mẫu dùng để phản ánh cho hàm hồi quy 
tổng thể nên phải có dạng giống hàm hồi quy tổng thể. 
Giả sử ( , ), 1,i iX Y i n là mẫu ngẫu nhiên kích thước n của ( , )X Y . Khi đó ta có biểu diễn 
dưới đây được gọi là hàm hồi quy mẫu SRF (Sample Regression Function) 
1 2Y X  (2.1.3) 
6 
Trong đó 1 , 2 được gọi là các hệ số số hồi quy mẫu hay hệ số ước lượng, là các ước 
lượng điểm lần lượt của 
1 , 2 thông qua mẫu kích thước n ở trên. 
Dạng hàm hồi quy mẫu cho từng quan sát: 
1 2i iY X  (2.1.4) 
Dạng ngẫu nhiên: 
1 2Y X U  (2.1.5) 
1 2i i iY X U  (2.1.6) 
Nhận xét: Hàm hồi quy mẫu có các tính chất sau đây 
1
0
n
i
i
U
  
 cov( , ) 0X U 
 cov( , ) 0Y U 
 Y Y 
 Đường hồi quy mẫu đi qua điểm ,X Y 
2.1.4 Tính tuyến tính trong mô hình hồi quy 
Tính tuyến tính của mô hình hồi quy được hiểu là tuyến tính theo tham số. Dưới đây là 
một số mô hình hồi quy dạng tuyến tính thường gặp: 
 2
1 2Y X U  1 2
1
Y U
X
  
1 2 lnY X U  1 2ln lnY X U  
1 2lnY X U  1 2
1
lnY U
X
  
Ví dụ về dạng không tuyến tính (phi tuyến): 
 1 2XY e U  21
UY X e
 
7 
 2
1
1
Y X U

 0
1 2
1
Y U
X

 
Trong một số trường hợp, sử dụng phép biến đổi phù hợp, ta có thể biến đổi mô hình hồi 
quy phi tuyến về mô hình hồi quy tuyến tính. 
2.2 Phƣơng pháp ƣớc lƣợng OLS (Ordinary Least Squares) 
Xét mô hình hồi quy tổng thể: 
1 2Y X U  (2.2.1) 
Để ước lượng các hệ số 
1 2,  ta cần rút ra một mẫu ngẫu nhiên kích thước n từ tổng thể: 
( , ), 1,i iX Y i n . Khi đó ta có 
1 2i i iY X U  (2.2.2) 
1 2i iY X  (2.2.3) 
Ký hiệu phần dư (Residuals): 
i i iU Y Y (2.2.4) 
Chúng ta muốn xác định 1 , 2 sao cho tổng bình phương các phần dư là bé nhất, có 
nghĩa là 
2 2 2
1 2 1 2
1 1 1
,
n n n
i i i i i
i i i
f U Y Y Y X Min   
    
Đây là bài toán cực trị hai biến không có điều kiện ràng buộc, do đó 1 , 2 sẽ là nghiệm 
của hệ phương trình sau: 
1 2
1
1 2
2
,
0
,
0
f
f
 

 

 
  
 
 
1 1
2
2 2
2
1 1
1 2
i
n n
i i i i
i i
n n
i
i i
X X Y Y X Y nXY
X X X n X
Y X

 
 
  
với 
8 
1 1,
n n
i i
i i
X Y
X Y
n n
 
Ví dụ 2.2.1: Xét mẫu số liệu sau đây 
Thu nhập 
(triệu đồng/tháng) 
8 9 10 11 12 15 15 16 17 20 
Chi tiêu 
(triệu đồng/tháng) 
7 8 9 9 10 12 11 13 14 15 
Dependent Variable: CHITIEU 
Method: Least Squares 
Date: Time: 09:51 
Sample: 1 10 
Included observations: 10 
 Variable Coefficient Std. Error t-Statistic Prob. 
 THUNHAP 0.673035 0.042320 15.90340 0.0000 
C 1.848641 0.584110 3.164883 0.0133 
 R-squared 0.969339 Mean dependent var 10.80000 
Adjusted R-squared 0.965506 S.D. dependent var 2.658320 
S.E. of regression 0.493715 Akaike info criterion 1.603140 
Sum squared resid 1.950037 Schwarz criterion 1.663657 
Log likelihood -6.015701 Hannan-Quinn criter. 1.536753 
F-statistic 252.9182 Durbin-Watson stat 2.400147 
Prob(F-statistic) 0.000000 
Ta có kết quả hồi quy 1.848641 0.673035i iY X . 
Ý nghĩa các hệ số ước lượng: 
 1 1.848641 : Chi tiêu dự định trung bình của mẫu gồm 10 hộ gia đình khi không 
có thu nhập. 
 2 0.673035 : Khuynh hướng tiêu dùng trung bình bằng 0.673035 , có nghĩa là 
khi thu nhập tăng thêm 1 triệu đồng thì chi tiêu trung bình tăng thêm khoảng 
0.673035 triệu đồng. 
9 
2.3 Tính không chệch và độ chính xác của ƣớc lƣợng OLS 
2.3.1 Các giả thiết của phƣơng pháp OLS 
Xét mô hình hồi quy tuyến tính hai biến (2.1.1): 
1 2Y X U  
thỏa mãn các giả thiết sau đây: 
Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên 
 ( , ), 1,i iX Y i n 
Giả thiết 2: Kỳ vọng có điều kiện bằng 0 
( | ) 0, 1,iE U X i n  
Giả thiết 3: Phương sai có điều kiện không đổi 
2ar( | ) , 1,iV U X i n  
2.3.2 Tính không chệch 
Giả sử mô hình hồi quy tuyến tính hai biến (2.1.1) có hàm hồi quy mẫu là 
1 2Y X  
Ta có định lý sau đây: 
Định lý: Khi giả thiết 2 được thỏa mãn thì các ước lượng điểm 1 , 2 lần lượt là các 
ước lượng không chệch của 1 , 2 , có nghĩa là 
 1 1 2 2,E E    
2.3.3 Độ chính xác của các ƣớc lƣợng 
Độ chính xác của các ước lượng được đo bởi phương sai của các ước lượng đó. Khi 
phương sai càng bé thì độ chính xác của ước lượng càng cao. Phương sai của các ước 
lượng được thể hiện qua định lý dưới đây. 
10 
Định lý: Khi các giả thiết 1, giả thiết 2 và giả thiết 3 được thỏa mãn thì phương sai của 
các hệ số ước lượng được xác định bởi 
2
21
1
2
1
n
i
i
n
i
i
X
Var
n X X
  


2
2
2
1
n
i
i
Var
X X


 
Trong thực tế ta thường không biết 2 , do đó ta thay 2 bởi ước lượng điểm không 
chệch, tốt nhất 2 của nó trong các công thức ở trên: 
2
2 1
2
n
i
i
U
n
 

Như vậy các sai số chuẩn (Standard error) của 1 , 2 là 
2
21
1 1
2
1
n
i
i
n
i
i
X
Se Var
n X X
   


2
2 2
2
1
n
i
i
Se Var
X X

 
 
Trở lại ví dụ 2.2.1, ta có 
2
1
1.950036738
n
i
i
U
  , 2
1.950036738
0.243754592
10 - 2
 , 
2
1
136.1
n
i
i
X X
  
2
2
2
1
0.243754592
0.001790996
136.1
n
i
i
Var
X X


 
11 
2
21
1
2
1
190.5 0.001790996 0.341184789
n
i
i
n
i
i
X
Var
n X X
  


Do đó 
 1 1 = 0.341184789 0.584110254Se Var  
 2 2 0.001790996=0.04232Se Var  . 
2.4 Độ phù hợp của hàm hồi quy mẫu 
Hàm SRF được gọi là phù hợp tốt với số liệu mẫu quan sát nếu iY gần iY . 
Quan sát hai hình vẽ dưới đây, nhận thấy rằng hàm hồi quy mẫu trong Hình 2.4.1 tốt hơn 
so với hàm hồi quy mẫu trong Hình 2.4.2. 
 Hình 2.4.1 Hình 2.4.2 
Ký hiệu 
2
1
n
i
i
TSS Y Y
  (Total sum of squares) 
2
1
n
i
i
ESS Y Y
  (Explained sum of squares) 
2
1
n
i i
i
RSS Y Y
  (Residual sum of squares) 
12 
Ta có TSS ESS RSS 
Với một mẫu cụ thể và sử dụng phương pháp OLS, TSS là giá trị cố định, nhưng ESS và 
RSS có giá trị thay đổi tùy thuộc vào dạng hàm hồi quy. 
Ký hiệu 
2
2 1
2
1
1 1
n
i
i
n
i
i
U
ESS RSS
R
TSS TSS
Y Y


 20 1R 
2R được gọi là hệ số xác định (Coefficient of determination) của hàm hồi quy. 
Vì 20 1R nên thường đổi thành tỷ lệ % cho thuận tiện trong phân tích. Chẳng hạn, 
khi tính được hệ số xác định bằng 0,8 thì có thể nói rằng mô hình và biến độc lập giải 
thích được 80% sự biến động của biến phụ thuộc và 20% là do yếu tố ngẫu nhiên khác 
giải thích. 
Nhận xét: 
 Nếu hàm hồi quy mẫu thích hợp tốt với số liệu quan sát thì ESS càng lớn hơn RSS 
( iY càng gần iY ), có nghĩa là 
2R càng gần 1. 
 Nếu hàm hồi quy mẫu kém thích hợp với số liệu quan sát thì ESS càng nhỏ hơn 
RSS ( iY càng xa iY ), có nghĩa là 
2R càng gần 0. 
 Nếu 2 1R , tức là RSS=0 ,i iY Y i  thì đường hồi quy thích hợp hoàn hảo, 
biến độc lập giải thích toàn bộ cho biến phụ thuộc, không còn yếu tố ngẫu nhiên. 
13 
 Nếu 2 0R , tức là RSS=TSS ,iY Y i  thì SRP không thích hợp, biến độc lập 
không giải thích được cho biến phụ thuộc. 
 Trong thực tế rất hiếm khi 2 1R hay
2 0R mà chỉ có 
2R gần 0 hay gần 1. 
 Theo kinh nghiệm, với số liệu chuỗi thời gian thì 2 0,9R được xem là tốt, với số 
liệu chéo thì 2 0,7R được xem là tốt. Để xem xét một mô hình tốt hay không ta 
không nên chỉ căn cứ vào 2R mà còn dựa trên các yếu tố khác như: dấu của hệ số 
hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác, 
 Đối với hai mô hình hồi quy tuyến tính hai biến, mô hình nào có hệ số xác định 
lớn hơn sẽ được coi là tốt hơn. 
Xét ví dụ 2.2.1, ta có 
2
1
1.950036738
n
i
i
U
  , 
2
1
63.6
n
i
i
Y Y
  
Như vậy 
2
2 1
2
1
1.950036738
1 1 1 0.969339
63.6
n
i
i
n
i
i
U
ESS RSS
R
TSS TSS
Y Y


Vì chuỗi số liệu thời gian đang xét có 2 0.969339 0.9R nên mô hình được sử dụng là 
tốt. 
2.5 Mô hình hồi quy qua gốc tọa độ 
Khi 
1 0 , mô hình hồi quy tổng thể (2.1.1) 
1 2Y X U  
trở thành 
2Y X U (2.5.1) 
và được gọi là mô hình hồi quy qua gốc tọa độ. 
Khi đó, các hàm hồi quy tổng thể, hàm hồi quy mẫu được viết lại như sau: 
2( | )E Y X X (2.5.2) 
14 
2Y X (2.5.3) 
Sử dụng phương pháp OLS, ta tính được 
1
2
2
1
n
i i
i
n
i
i
X Y
X
 


, 
2
2
2
1
n
i
i
Var
X



, 
2
2 1
1 1
n
i
i
U
RSS
n n
 

Đối với mô hình hồi quy qua gốc tọa độ, nếu áp dụng công thức tính hệ số xác định 
2 1
RSS
R
TSS
thì 2R hay có thể âm, không có ý nghĩa. Do vậy người ta đưa ra các hệ số mới, chẳng hạn 
2
12
ô
2 2
1 1
n
i i
i
th n n
i i
i i
X Y
R
X Y

 
để thay thế cho 2R mà vẫn thỏa mãn điều kiện 
20 1R . 
Thông thường người ta hay sử dụng mô hình hồi quy có hệ số chặn, sau đó kiểm định hệ 
số chặn. 
Ví dụ 2.5.1: Trong lý thuyết danh mục đầu tư hiện đại, mô hình định giá tài sản vốn 
(CAPM-Capital Asset Pricing Model) có dạng mô hình hồi quy tuyến tính qua gốc tọa 
độ: 
 i f i m fER r ER r 
Trong đó 
iER là suất sinh lợi kỳ vọng của chứng khoán i, iER là suất sinh lợi của danh 
mục đầu tư thị trường, fr là suất sinh lợi của đầu tư không rủi ro, i là hệ số Beta, công 
cụ đo lường rủi ro có tính  ...  after adjustments 
 Variable Coefficient Std. Error t-Statistic Prob. 
 X 0.421166 0.123316 3.415330 0.0015 
X(-1) -0.312189 0.150227 -2.078109 0.0443 
Y(-1) 0.829531 0.070515 11.76395 0.0000 
C 6.426753 2.141585 3.000933 0.0047 
 R-squared 0.995699 Mean dependent var 88.36279 
Adjusted R-squared 0.995369 S.D. dependent var 13.68950 
S.E. of regression 0.931627 Akaike info criterion 2.784640 
Sum squared resid 33.84923 Schwarz criterion 2.948472 
Log likelihood -55.86975 Hannan-Quinn criter. 2.845056 
F-statistic 3009.867 Durbin-Watson stat 1.613401 
106 
Prob(F-statistic) 0.000000 
Từ kết quả trên, ta được 0.829531 . 
7.3 Phƣơng sai của nhiễu thay đổi 
7.3.1 Nguyên nhân 
Một trong những giả định của mô hình hồi quy tuyến tính cổ điển là phương sai của nhiễu 
không đổi qua các quan sát (phương sai thuần hay phương sai đồng nhất): 
2 2 2 ,i i i iVar U X E X E U E U i  . 
Trong những bài toán thực tế, i iVar U X có thể thay đổi theo sự thay đổi của iX : 
 2i i iVar U X  . 
Sau đây là một số nguyên nhân dẫn đến phương sai không đồng nhất: 
 Do bản chất của hiện tượng kinh tế: Chẳng hạn như trong mô hình hồi quy của tiết 
kiệm hay chi tiêu theo thu nhập thấy có phương sai không đồng nhất. 
 Do sai số đo lường và sai số tính toán ngày càng được cải thiện dần. 
 Do tích lũy kinh nghiệm và sai số theo thời gian ngày càng giảm: Chẳng hạn như 
khi số giờ tác nghiệp của một thợ học việc càng lớn thì số phế phẩm làm ra sẽ 
càng ít dần bởi thao tác của người thợ này ngày một hoàn hảo hơn. 
 Do trong mẫu xuất hiện các giá trị rất nhỏ hoặc rất lớn so với các giá trị quan sát 
khác (outlier): Chẳng hạn như khi điều tra trên một mẫu nhỏ về thu nhập và chi 
tiêu, đôi khi có những quan sát rất khác biệt: thu nhập thấp nhưng chi tiêu rất cao 
hoặc ngược lại. 
 Do xác định sai dạng mô hình hồi quy: Chẳng hạn như xác định sai dạng hàm, bỏ 
sót biến quan trọng. 
 Phương sai không đồng nhất thường xuất hiện trong các dữ liệu chéo và dữ liệu 
bảng. 
7.3.2 Hậu quả 
 Ước lượng OLS không cho phương sai bé nhất (không còn là ước lượng hiệu quả). 
 Phương sai và hiệp phương sai của các ước lượng OLS bị chệch. 
 Việc sử dụng thống kê t và F để kiểm định giả thuyết không còn đáng tin cậy nữa. 
107 
 Kết quả dự báo không còn hiệu quả khi sử dụng các ước lượng OLS có phương sai 
không bé nhất. 
7.3.3 Cách phát hiện 
Việc phát hiện phương sai thay đổi không hề dễ dàng bởi một số lý do sau đây: 
 Không biết tất cả các giá trị của biến phụ thuộc ứng với từng giá trị của biến độc 
lập. Do đó không thể ước lượng phương sai của nhiễu từ những giá trị riêng biệt 
này. 
 Công cụ được sử dụng để phát hiện phương sai thay đổi thường là đồ thị của các 
phần dư iU . Khi cỡ mẫu càng lớn, iU là ước lượng tốt của iU . 
Phương pháp định tính: 
+ Dựa vào kinh nghiệm từ những cuộc nghiên cứu trước đó hoặc do suy đoán hoặc dựa 
vào bản chất của hiện tượng nghiên cứu. 
+ Dựa vào việc xem xét đồ thị của phần dư: Nếu không có thông tin tiên nghiệm nào cho 
thấy có phương sai thay đổi, có thể tiến hành phân tích hồi quy với giả định phương sai 
đồng đều để xác định phần dư 
2
iU , sau đó khảo sát đồ thị của nó để xem xét 
2
iU thay đổi 
có tính hệ thống hay không. Chẳng hạn ta có một số dạng biến thiên của 
2
iU dưới đây: 
+ Để củng cố thêm nhận định về hiện tượng phương sai thay đổi, người ta thường kết hợp 
phương pháp định tính với các phương pháp định lượng. 
108 
Phương pháp định lượng: 
+ Kiểm định Park: 
 Park giả định rằng phương sai của nhiễu thay đổi dưới dạng hàm mũ như sau: 
22 2 2 2
2. . ln ln ln
iV
i i i i iX e X V
     . 
 Vì chưa biết 2
i nên ta sử dụng ước lượng 
2
iU để thay thế và tiến hành theo các 
bước sau đây: 
Bước 1: Hồi quy mô hình gốc 1 2i i iY X U  để ước lượng iU và iY . 
Bước 2: Hồi quy mô hình 
2
1 2ln lni i iU X V . 
Bước 3: Kiểm định giả thuyết 
0 2
1 2
: 0
: 0
H
H
Chú ý: Hạn chế của kiểm định Park là việc giả sử các nhiễu iV thỏa mãn các giả 
thiết cổ điển. Nếu iV vi phạm giả thiết này thì kết quả kiểm định ở bước 3 không 
còn đáng tin cậy nữa. 
+ Kiểm định Glejser: Thực hiện tương tự như kiểm định Park nhưng sử dụng các dạng 
hàm sau: 
 1 2i i iU X V 
 1 2i i iU X V 
 1 2
1
i i
i
U V
X
 1 2
1
i i
i
U V
X
 1 2i i iU X V 
 21 2i i iU X V 
Hạn chế của kiểm định Glejser: 
 iV có thể không thỏa mãn các giả thiết cổ điển. 
109 
 Mô hình 1 2i i iU X V và 
2
1 2i i iU X V không có dạng tuyến tính, 
do đó không thể áp dụng phương pháp OLS. 
 Ngoại trừ mô hình 1 2i i iU X V , các mô hình còn lại được đòi hỏi điều kiện 
về biến độc lập iX để biểu thức được xác định (biểu thức dưới mẫu khác 0 hoặc biểu 
thức trong căn bậc hai phải không âm). 
+ Kiểm định Goldfeld-Quandt: Kiểm định này giả thiết rằng phương sai của 2
i tương 
quan thuận với biến độc X nào đó. Giả sử rằng 2 2 2
i iX  (
2 : hằng số). 
Bước 1: Sắp xếp mẫu theo thứ tự tăng dần của biến X . 
Bước 2: Loại bỏ c quan sát ở giữa, n-c quan sát còn lại được chia làm hai nhóm, 
mỗi nhóm chứa (n-c)/2 quan sát. 
Bước 3: Thực hiện hồi quy OLS cho 1 2i i iY X U  với (n-c)/2 quan sát thu 
được phương sai 2RSS . Mỗi 2RSS có bậc tự do là df = (n-c-2k)/2, k: tham số trong 
mô hình. 
Bước 4: Thực hiện kiểm định F cho giả thuyết 0H : Phương sai không đổi. 
Xét thống kê 
2
1
/
/
RSS df
F
RSS df
Nếu ( , )F F df df thì bác bỏ 0H . 
Hạn chế của kiểm định Goldfeld-Quandt: 
 Không có nguyên tắc chung để xác định số quan sát bị loại bỏ, độ tin cậy phụ 
thuộc vào số quan sát bị loại bỏ này. Theo kinh nghiệm, với cỡ mẫu khoảng 30 thì 
chọn c = 4 hoặc c = 8; với cỡ mẫu khoảng 60 thì chọn c = 10 hoặc c = 16. 
 Kiểm định Goldfeld-Quandt thích hợp cho những mẫu cỡ nhỏ. 
+ Kiểm định White: Kiểm định này khảo sát phần dư 
2
iU theo biến độc lập. 
Xét mô hình hồi quy gốc: 
1 2 2 3 3i i i iY X X U   
110 
 Bước 1: Hồi quy mô hình gốc trên, thu được iU . 
Bước 2: Hồi quy mô hình phụ 
2
2 2
1 2 2 3 3 4 2 5 3 6 2 3i i i i i i i iU X X X X X X U 
có được hệ số xác định 2
auxR . 
Bước 3: Thực hiện kiểm định 2 cho giả thuyết 0H : Phương sai không đổi. 
0 2 3 4 5 6: 0H 
Ta có 2 2 ( )auxnR df  . Nếu 
2 2 ( )auxnR df  thì bác bỏ 0H . 
7.3.4 Biện pháp khắc phục 
+ Trường hợp đã biết phương sai của thổng thể: 
Khi có thông tin về phương sai thay đổi, ta có thể sử dụng phương pháp GLS (thực chất 
là phương pháp OLS áp dụng cho các biến đã được biến đổi từ một mô hình vi phạm giả 
thiết cổ điển thành mô hình mới thỏa mãn các giả thiết này) để thực hiện hồi quy. Các 
tham số ước lượng được từ mô hình mới có tính chất BLUE. 
Xét mô hình 
1 2 1 0 2
0 1,
i i i i i i
i
Y X U X X U
X i
    
  
với 2i iVar U  . 
Suy ra 
* * * *0
1 2 1 0 2
i i i i
i i i i
i i i i
Y X X U
Y X X U   
   
với * 1,iVar U i  . 
+ Trường hợp chưa biết phương sai của tổng thể: 
Cũng sử dụng phương pháp GLS nhưng cần đòi hỏi thêm một số giả thiết về phương sai 
của tổng thể như sau: 
111 
 Giả thiết 1: Phương sai của tổng thể tỷ lệ với bình phương của biến độc lập: 
 2 2i iVar U X 
 Giả thiết 2: Phương sai của tổng thể tỷ lệ với biến độc lập: 
 2i iVar U X 
 Giả thiết 3: Có thể sử dụng phép biến đổi logarit 
1 2ln lni i iY X V  
7.3.5 Các ví dụ 
Ví dụ 7.3.5.1: Khảo sát số liệu về chi phí cho việc nghiên cứu và phát triển của 18 ngành 
công nghiệp ở Mỹ trong năm 1988 như sau: 
Nhóm ngành 
công nghiệp 
Doanh thu 
(X2) 
Đầu tư cho nghiên cứu 
và phát triển (Y) 
Lợi nhuận 
1 6375.3 62.5 185.1 
2 11626.4 92.9 1569.5 
3 14655.1 178.3 276.8 
4 21869.2 258.4 2828.1 
5 26408.3 494.7 2225.9 
6 32405.6 1083 3751.9 
7 35107.7 1620.6 2884.1 
8 40295.4 421.7 4645.7 
9 70761.6 509.2 5036.4 
10 80552.8 6620.1 13869.9 
11 95294.0 3918.6 4487.8 
12 101314.1 1595.3 10278.9 
13 116141.3 6107.5 8787.3 
14 122315.7 4454.1 16438.8 
15 141649.9 3163.8 9761.4 
16 175025.8 13210.7 19774.5 
17 241434.8 1703.8 23168.5 
18 293543.0 9528.2 18415.4 
Để xem xét tác động của doanh thu lên đầu tư cho nghiên cứu và phát triển, ta ước lượng 
mô hình: 
1 2 2Y X U  
112 
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
0 100,000 200,000 300,000
X2
Y
Nhìn vào biểu đồ phân tán của biến doanh thu và biến khoản đầu tư cho nghiên cứu và 
phát triển, nhận thấy hai biến này có quan hệ cùng chiều phù hợp với cơ sở kinh tế học, 
kỳ vọng rằng khi doanh thu tăng thì khoản đầu tư cho nghiên cứu và phát triển cũng sẽ 
tăng vì việc nghiên cứu và phát triển tác động tích cực tới các nhóm ngành công nghiệp, 
làm tăng lợi nhuận. 
Ngoài ra khi biến 2X có giá trị càng lớn thì các điểm phân tán càn rộng. Điều này cho 
thấy có dấu hiệu phương sai thay đổi. Để có nhìn nhận chính xác hơn về hiện tượng này, 
ta khảo sát biểu đồ phần dư: 
Dependent Variable: Y 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 X2 0.030878 0.008346 3.699582 0.0019 
C 266.1917 1002.961 0.265406 0.7941 
 R-squared 0.461042 Mean dependent var 3056.856 
Adjusted R-squared 0.427357 S.D. dependent var 3705.973 
S.E. of regression 2804.428 Akaike info criterion 18.82023 
Sum squared resid 1.26E+08 Schwarz criterion 18.91916 
Log likelihood -167.3820 Hannan-Quinn criter. 18.83387 
F-statistic 13.68690 Durbin-Watson stat 3.020747 
Prob(F-statistic) 0.001944 
113 
-8,000
-6,000
-4,000
-2,000
0
2,000
4,000
6,000
8,000
0 100,000 200,000 300,000
X2
P
H
A
N
D
U
0
10,000,000
20,000,000
30,000,000
40,000,000
50,000,000
60,000,000
0 100,000 200,000 300,000
X2
P
H
A
N
D
U
B
IN
H
P
H
U
O
N
G
Nhìn vào hai đồ thị trên về phần dư, ta nhận thấy có hiện tượng phương sai sai số thay 
đổi về mẫu số liệu quan sát. 
Sử dụng phương pháp định lượng để kiểm chứng hiện tượng trên: 
114 
 Kiểm định Park: 
Dependent Variable: LOG(PHANDUBINHPHUONG) 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 LOG(X2) 0.937739 0.452026 2.074524 0.0545 
C 3.411791 4.972480 0.686135 0.5025 
 R-squared 0.211964 Mean dependent var 13.67970 
Adjusted R-squared 0.162712 S.D. dependent var 2.212710 
S.E. of regression 2.024705 Akaike info criterion 4.353165 
Sum squared resid 65.59091 Schwarz criterion 4.452095 
Log likelihood -37.17848 Hannan-Quinn criter. 4.366806 
F-statistic 4.303650 Durbin-Watson stat 1.661072 
Prob(F-statistic) 0.054525 
Nhận thấy p-value cho biến LOG(X2) bằng 0.0545 > 0.05 nên chấp nhận giả 
thuyết rằng phương sai không đổi ứng với mức ý nghĩa 5%. 
 Kiểm định Glejser: Sử dụng một số dạng hàm hồi quy mà Glejser đề xuất 
Dependent Variable: ABS(PHANDU) 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 X2 0.012405 0.005606 2.212694 0.0418 
C 573.4053 673.6986 0.851130 0.4073 
 R-squared 0.234304 Mean dependent var 1694.540 
Adjusted R-squared 0.186448 S.D. dependent var 2088.493 
S.E. of regression 1883.761 Akaike info criterion 18.02437 
Sum squared resid 56776901 Schwarz criterion 18.12330 
Log likelihood -160.2193 Hannan-Quinn criter. 18.03801 
F-statistic 4.896013 Durbin-Watson stat 1.764230 
Prob(F-statistic) 0.041804 
Thu được 2573.4053+0.012405XiU , 
2 0.234304R . 
115 
Dependent Variable: ABSPHANDU 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 SQR(X2) 8.174684 3.338921 2.448301 0.0263 
C -522.8336 1003.769 -0.520870 0.6096 
 R-squared 0.272535 Mean dependent var 1694.540 
Adjusted R-squared 0.227068 S.D. dependent var 2088.493 
S.E. of regression 1836.131 Akaike info criterion 17.97315 
Sum squared resid 53942043 Schwarz criterion 18.07208 
Log likelihood -159.7583 Hannan-Quinn criter. 17.98679 
F-statistic 5.994177 Durbin-Watson stat 1.797692 
Prob(F-statistic) 0.026262 
Thu được 2-522.8336+8.174684 XiU , 
2 0.272535R . 
Dependent Variable: ABSPHANDU 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 1/X2 -19862635 12455985 -1.594626 0.1304 
C 2315.658 611.4543 3.787132 0.0016 
 R-squared 0.137133 Mean dependent var 1694.540 
Adjusted R-squared 0.083204 S.D. dependent var 2088.493 
S.E. of regression 1999.722 Akaike info criterion 18.14384 
Sum squared resid 63982185 Schwarz criterion 18.24277 
Log likelihood -161.2946 Hannan-Quinn criter. 18.15748 
F-statistic 2.542831 Durbin-Watson stat 1.495854 
Prob(F-statistic) 0.130356 
Thu được 
2
1
2315.658-19862635.
X
iU , 2 0.137133R . 
Các hệ số góc trong kết quả kiểm định Glejser ở mô hình 1 và 2 đều có ý nghĩa 
thống kê với mức ý nghĩa 5%, còn mô hình 3 không có ý nghĩa thống kê với cùng 
mức ý nghĩa này. Với cỡ mẫu không phải là lớn n = 18 sử dụng cho kiểm định 
Glejser, ta cần phải thận trọng trong việc nhận định về hiện tượng phương sai thay 
đổi. 
116 
 Kiểm định White: 
Heteroskedasticity Test: White 
 F-statistic 3.024901 Prob. F(2,15) 0.0788 
Obs*R-squared 5.173276 Prob. Chi-Square(2) 0.0753 
Scaled explained SS 9.164166 Prob. Chi-Square(2) 0.0102 
Test Equation: 
Dependent Variable: RESID^2 
Method: Least Squares 
Date: Time: 
Sample: 1 18 
Included observations: 18 
 Variable Coefficient Std. Error t-Statistic Prob. 
 C -6096911. 6717947. -0.907556 0.3785 
X2^2 -0.000498 0.000464 -1.073878 0.2998 
X2 224.3497 131.4379 1.706887 0.1085 
 R-squared 0.287404 Mean dependent var 6990948. 
Adjusted R-squared 0.192391 S.D. dependent var 15232775 
S.E. of regression 13689244 Akaike info criterion 35.85313 
Sum squared resid 2.81E+15 Schwarz criterion 36.00153 
Log likelihood -319.6782 Hannan-Quinn criter. 35.87359 
F-statistic 3.024901 Durbin-Watson stat 1.705242 
Prob(F-statistic) 0.078763 
Kết quả kiểm định White cho thấy p-value = 0.0753 >0.05 nên chưa có cơ sở để 
bác bỏ giả thuyết phương sai đồng nhất. 
Ngoài các khuyết tật như đã trình bày ở trên, mô hình hồi quy có thể còn có những 
khuyết tật khác như: Kỳ vọng của sai số ngẫu nhiên khác không (vi phạm giả thiết 2 
trong các giả thiết cổ điển của phương pháp OLS), nhiễu ngẫu nhiên không U không 
tuân theo quy luật chuẩn (vi phạm giả thiết 5 trong các giả thiết cổ điển của phương pháp 
OLS). 
117 
Tài liệu tham khảo 
[1] GS.TS. Nguyễn Quang Dong, TS. Nguyễn Thị Minh, Giáo trình Kinh tế lượng, NXB Đại học 
kinh tế Quốc dân, 2012. 
[2] ThS. Phạm Trí Cao, ThS. Vũ Minh Châu, Kinh tế lượng ứng dụng, NXB Thống kê Thành phố 
Hồ Chí Minh, 2010. 
[3] PGS.TS. Nguyễn Cao Văn (chủ biên), Giáo trình lý thuyết xác suất và thống kê toán, NXB 
Đại học kinh tế Quốc Dân, 2012. 
[4] Damodar, N. Basic econometrics. The Mc-Graw Hill, 2004. 
[5] Kennedy, Peter. A guide to econometrics. MIT press, 2003. 
118 
PHỤ LỤC 
Bảng phân phối chuẩn 
119 
Bảng phân phối t-student 
120 
Bảng phân phối Fisher 
121 
122 
123 
124 
125 
126 
Bảng phân phối Chi-bình phƣơng 
127 
128 
Bảng thống kê d (Durbin-Watson) với mức ý nghĩa 0.05 
129 
130 
Bảng thống kê d (Durbin-Watson) với mức ý nghĩa 0.01 
131 

File đính kèm:

  • pdfbai_giang_kinh_te_luong_cao_tan_binh.pdf