Bài giảng Nguyên lý thống kê kinh tế
Chương 1
TỔNG QUAN VỀ THỐNG KÊ HỌC
1.1 Khái niệm thống kê học
Trong đời sống hàng ngày, chúng ta thường bắt gặp thuật ngữ “Thống kê” trên các
phương tiện thông tin đại chúng như báo chí, phát thanh, truyền hình Thuật ngữ
“Thống kê” có thể được hiểu theo hai nghĩa như sau:
Thống kê là các số liệu được thu thập để phản ánh các hiện tượng tự nhiên, kỹ
thuật, kinh tế, xã hội. Ví dụ sản lượng của một công ty, lượng mưa trong năm
của một khu vực địa lý, tốc độ tăng trưởng kinh tế của một quốc gia, dân số,
lao động, nhiệt độ
Thống kê cũng được hiểu là hệ thống các phương pháp để nghiên cứu (thu
thập, tổng hợp, phân tích) các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội.
Xét theo quá trình hình thành và phát triển, có thể thấy thống kê là một bộ phận
của khoa học xã hội. Tuy nhiên nó có những đặc thù riêng cho phép nó trở thành một
ngành khoa học riêng biệt. Đặc thù thứ nhất là nó chỉ nghiên cứu mặt lượng của các
hiện tượng kinh tế xã hội. Đặc thù thứ hai là thống kê học chủ yếu nghiên cứu các hiện
tượng số lớn. Đặc thù thứ ba là nó không chỉ nghiên cứu các hiện tượng trong trạng
thái tĩnh mà còn nghiên cứu trong cả trạng thái động. Đặc thù thứ tư là nghiên cứu
trong điều kiện thời gian và không gian cụ thể. Từ những điều vừa trình bày trên, ta có
thể đi đến định nghĩa thống kê như sau:
Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số
(mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có
của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể.
1.2 Một số khái niệm thường dùng trong thống kê
1.2.1 Tổng thể thống kê
Tổng thể thống kê là tập hợp các đơn vị hay phần tử thuộc hiện tượng nghiên cứu
mà ta cần quan sát, thu thập và phân tích.
Ví dụ: Tổng thể các hộ gia đình ở thành phố Quy Nhơn.
Các đơn vị cấu thành tổng thể thống kê gọi là đơn vị tổng thể. Đơn vị tổng thể là
căn cứ quan trọng để xác định các phương pháp điều tra thích hợp, để tiến hành tổng
hợp và áp dụng những công thức tính toán khi phân tích thống kê.
Phân loại tổng thể thống kê:
Tổng thể bộc lộ: là tổng thể mà ta có thể quan sát trực tiếp hoặc nhận biết được các
đơn vị của nó. Ví dụ như số sinh viên của một trường đại học tại một thời điểm nào đó,
hoặc số lượng hàng hóa bán ra trong một kỳ nào đó.2
Tổng thể tiềm ẩn: là các đơn vị tổng thể thường không thể trực tiếp quan sát hoặc nhận
biết được. Ví dụ: tổng thể những người ủng hộ chính sách kinh tế nào đó, hoặc tổng
thể những người hâm mộ bóng đá.
Tổng thể đồng nhất: là các đơn vị giống nhau ở một hay một số đặc điểm chủ yếu có
liên quan đến mục đích nghiên cứu, và ngược lại gọi là tổng thể không đồng chất. Ví
dụ như đối với việc nghiên cứu tình hình thu nhập của người lao động tại các ngân
hàng thương mại cổ phần trên địa bàn thành phố Hà Nội thì tổng thể gồm các ngân
hàng thương mại cổ phần trên địa bàn thành phố Hà Nội là tổng thể đồng chất, nhưng
tổng thế gồm các ngân hàng trên địa bàn thành phố Hà Nội là tổng thể không đồng
chất. Cần lưu ý thêm rằng tổng thể thống kê có thể là hữu hạn hoặc vô hạn.
Tóm tắt nội dung tài liệu: Bài giảng Nguyên lý thống kê kinh tế
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) Bình Định, 06/2016 i BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) SỐ TÍN CHỈ: 3 (LÝ THUYẾT: 45) Bình Định, 06/2016 ii MỤC LỤC Chương 1: Tổng quan về thống kê học 1 1.1. Khái niệm thống kê học 1 1.2. Một số khái niệm thường dùng trong thống kê 1 1.2.1. Tổng thể thống kê 1 1.2.2. Tổng thể mẫu 2 1.2.3. Tiêu thức thống kê 2 1.2.4. Chỉ tiêu thống kê 3 1.2.5. Thang đo trong thống kê 3 1.2.5.1. Thang đo định danh 4 1.2.5.2. Thang đo thứ bậc 4 1.2.5.3. Thang đo khoảng 4 1.2.5.4. Thang đo tỷ lệ 4 1.2.5.5. Một số kỹ thuật thiết kế thang đo 5 1.2.6. Bảng câu hỏi (phiếu điều tra) 7 1.2.7. Dữ liệu thống kê 9 1.3. Các phương pháp thống kê 10 Câu hỏi ôn tập 12 Chương 2: Điều tra thống kê (Thu thập dữ liệu thống kê) 13 2.1. Khái niệm về điều tra thống kê 13 2.2. Các loại điều tra thống kê 14 2.2.1. Điều tra thường xuyên 14 2.2.2. Điều tra không thường xuyên 14 2.2.3. Điều tra toàn bộ 15 2.2.4. Điều tra không toàn bộ 15 2.3. Hình thức tổ chức thu thập thông tin 15 2.3.1. Báo cáo thống kê định kỳ 16 2.3.2. Điều tra chuyên môn 18 2.4. Phương pháp thu thập thông tin thống kê 18 2.4.1. Phương pháp trực tiếp 18 2.4.2. Phương pháp gián tiếp 19 Câu hỏi ôn tập 21 iii Chương 3: Tổng hợp và trình bày dữ liệu thống kê 22 3.1. Phân tổ thống kê 22 3.1.1. Khái niệm 22 3.1.2. Các loại phân tổ thống kê 22 3.1.3. Tiêu thức phân tổ 25 3.1.4. Bảng phân phối tần số 25 3.1.5. Cách phân tổ thống kê 26 3.2. Bảng thống kê 29 3.2.1. Khái niệm 29 3.2.2. Cấu trúc bảng thống kê 29 3.2.3. Yêu cầu và quy ước của việc xây dựng bảng thống kê 30 3.3. Tổng hợp bằng đồ thị và biểu đồ thống kê 32 Câu hỏi ôn tập 34 Chương 4: Đo lường các mức độ của hiện tượng kinh tế-xã hội 36 4.1. Số tuyệt đối 36 4.1.1. Khái niệm 36 4.1.2. Phân loại số tuyệt đối 36 4.2. Số tương đối 36 4.2.1. Khái niệm 36 4.2.2. Ý nghĩa của số tương đối 37 4.2.3. Đặc điểm của số tương đối 37 4.2.4. Phân loại số tương đối 38 4.3. Các đặc trưng đo lường khuynh hướng tập trung 40 4.3.1. Số bình quân (trung bình) 40 4.3.2. Số trung vị 43 4.3.3. Giá trị mốt 45 4.4. Các đặc trưng đo lường mức độ phân tán 47 4.4.1. Khoảng biến thiên 47 4.4.2. Độ lệch tuyệt đối bình quân 47 4.4.3. Phương sai 48 4.4.4. Độ lệch chuẩn 48 4.4.5. Hệ số biến thiên 48 Câu hỏi ôn tập 49 iv Chương 5: Ðiều tra chọn mẫu 53 5.1. Giới thiệu chung về điều tra chọn mẫu 53 5.1.1. Khái niệm điều tra chọn mẫu 53 5.1.2. Ưu, nhược điểm của điều tra chọn mẫu 53 5.1.3. Sự cần thiết của điều tra chọn mẫu 53 5.2. Các giai đoạn của điều tra chọn mẫu 54 5.2.1. Xác định mục đích nghiên cứu 54 5.2.2. Xác định tổng thể nghiên cứu 54 5.2.3. Xác định kích thước mẫu 54 5.2.4. Lựa chọn phương pháp thu thập dữ liệu 54 5.2.5. Sử dụng các thông tin từ mẫu để suy luận thống kê 55 5.2.6. Kết luận về tổng thể nghiên cứu 55 5.3. Sai số chọn mẫu 55 5.4. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng 56 5.4.1. Chọn mẫu ngẫu nhiên đơn giản 56 5.4.2. Chọn mẫu phân tổ (phân loại) 61 5.4.3. Chọn mẫu cả khối (chọn mẫu chùm) 64 5.4.4. Chọn mẫu nhiều cấp (chọn mẫu phân tầng) 67 Câu hỏi ôn tập 68 Chương 6: Phân tích hồi quy và tương quan 70 6.1. Mối liên hệ tương quan và nhiệm vụ của phân tích hồi quy 70 6.1.1. Quan hệ tương quan 70 6.1.2. Nhiệm vụ phân tích hồi quy và tương quan 70 6.1.3. Ý nghĩa của phân tích hồi quy và tương quan 70 6.2. Hồi quy và tương quan tuyến tính giữa hai tiêu thức số lượng 70 6.2.1. Bài toán đặt vấn đề 70 6.2.2. Hệ số tương quan 72 6.3. Hồi quy và tương quan tuyến tính bội 72 6.3.1. Hệ số tương quan bội 72 6.3.2. Hệ số tương quan chuẩn hóa 73 6.3.4. Hệ số tương quan riêng phần 73 6.4. Hồi quy và tương quan phi tuyến giữa hai tiêu thức số lượng 74 6.4.1. Hàm parabol 74 v 6.4.2. Hàm Hyperbol 74 6.4.3. Hàm mũ 74 6.4.4. Tỷ số tương quan 74 6.5. Tương quan hạng và tương quan giữa hai tiêu thức thuộc tính 76 6.5.1. Tương quan hạng 76 6.5.2. Tương quan giữa hai tiêu thức thuộc tính 76 Câu hỏi ôn tập 77 Chương 7: Dãy số thời gian 79 7.1. Khái niệm và phân loại dãy số thời gian 79 7.2. Các thành phần của dãy số thời gian 80 7.2.1. Yếu tố xu thế 80 7.2.2. Yếu tố thời vụ 80 7.2.3. Yếu tố chu kỳ 80 7.2.4. Yếu tố ngẫu nhiên 80 7.3. Các chỉ tiêu phân tích dãy số thời gian 80 7.3.1. Mức độ bình quân theo thời gian 80 7.3.2. Lượng tăng (giảm) tuyệt đối 81 7.3.3. Tốc độ phát triển 83 7.3.4. Tốc độ tăng (giảm) 84 7.3.5. Giá trị tuyệt đối 1% tăng (giảm) liên hoàn 85 7.4. Các phương pháp biểu hiện xu hướng biến động của dãy số thời gian 85 7.4.1. Phương pháp bình quân trượt 85 7.4.2. Phương pháp hồi quy 86 7.5. Các phương pháp dự báo biến động của dãy số thời gian 89 7.5.1. Dự báo dự vào lượng tăng (giảm) tuyệt đối bình quân 89 7.5.2. Dự báo dựa vào tốc độ phát triển bình quân 89 7.5.3. Dự báo theo phương trình hồi quy tuyến tính 90 7.5.4. Dự báo theo mô hình nhân 93 Câu hỏi ôn tập 94 Chương 8: Phương pháp chỉ số 97 8.1. Khái niệm chỉ số thống kê 97 8.2. Các loại chỉ số trong thống kê 97 8.2.1. Chỉ số phát triển 97 vi 8.2.2. Chỉ số không gian 100 8.2.3. Chỉ số kế hoạch 101 8.3. Hệ thống chỉ số 101 8.3.1. Phương pháp xây dựng hệ thống chỉ số 105 8.3.2. Hệ thống chỉ số phân tích biến động chỉ tiêu trung bình 105 8.3.3. Hệ thống chỉ số phân tích biến động tổng lượng biến tiêu thức 107 Câu hỏi ôn tập 109 Chương 9: Kiểm định giả thuyết thống kê 113 9.1. Kiểm định tham số 113 9.1.1. Kiểm định giả thuyết về giá trị trung bình của tổng thể chung 113 9.1.2. Kiểm định giả thuyết về phương sai của tổng thể chung 119 9.1.3. Kiểm định giả thuyết về tham số p của phân phối không – một 122 9.2. Kiểm định phi ttham số 125 9.2.1. Kiểm định giả thuyết về tính độc lập của hai dấu hiệu định tính 125 9.2.2. Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên 126 9.3. Kiểm định mô hình hồi quy 128 9.3.1. Kiểm định ý nghĩa của các hệ số bêta 128 9.3.2. Kiểm định ý nghĩa của hệ số tương quan 129 9.3.3. Kiểm định sự phù hợp của phương trình 130 TÀI LIỆU THAM KHẢO 131 PHỤ LỤC CÁC BẢNG SỐ 132 1 Chương 1 TỔNG QUAN VỀ THỐNG KÊ HỌC 1.1 Khái niệm thống kê học Trong đời sống hàng ngày, chúng ta thường bắt gặp thuật ngữ “Thống kê” trên các phương tiện thông tin đại chúng như báo chí, phát thanh, truyền hình Thuật ngữ “Thống kê” có thể được hiểu theo hai nghĩa như sau: Thống kê là các số liệu được thu thập để phản ánh các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Ví dụ sản lượng của một công ty, lượng mưa trong năm của một khu vực địa lý, tốc độ tăng trưởng kinh tế của một quốc gia, dân số, lao động, nhiệt độ Thống kê cũng được hiểu là hệ thống các phương pháp để nghiên cứu (thu thập, tổng hợp, phân tích) các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Xét theo quá trình hình thành và phát triển, có thể thấy thống kê là một bộ phận của khoa học xã hội. Tuy nhiên nó có những đặc thù riêng cho phép nó trở thành một ngành khoa học riêng biệt. Đặc thù thứ nhất là nó chỉ nghiên cứu mặt lượng của các hiện tượng kinh tế xã hội. Đặc thù thứ hai là thống kê học chủ yếu nghiên cứu các hiện tượng số lớn. Đặc thù thứ ba là nó không chỉ nghiên cứu các hiện tượng trong trạng thái tĩnh mà còn nghiên cứu trong cả trạng thái động. Đặc thù thứ tư là nghiên cứu trong điều kiện thời gian và không gian cụ thể. Từ những điều vừa trình bày trên, ta có thể đi đến định nghĩa thống kê như sau: Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. 1.2 Một số khái niệm thường dùng trong thống kê 1.2.1 Tổng thể thống kê Tổng thể thống kê là tập hợp các đơn vị hay phần tử thuộc hiện tượng nghiên cứu mà ta cần quan sát, thu thập và phân tích. Ví dụ: Tổng thể các hộ gia đình ở thành phố Quy Nhơn. Các đơn vị cấu thành tổng thể thống kê gọi là đơn vị tổng thể. Đơn vị tổng thể là căn cứ quan trọng để xác định các phương pháp điều tra thích hợp, để tiến hành tổng hợp và áp dụng những công thức tính toán khi phân tích thống kê. Phân loại tổng thể thống kê: Tổng thể bộc lộ: là tổng thể mà ta có thể quan sát trực tiếp hoặc nhận biết được các đơn vị của nó. Ví dụ như số sinh viên của một trường đại học tại một thời điểm nào đó, hoặc số lượng hàng hóa bán ra trong một kỳ nào đó. 2 Tổng thể tiềm ẩn: là các đơn vị tổng thể thường không thể trực tiếp quan sát hoặc nhận biết được. Ví dụ: tổng thể những người ủng hộ chính sách kinh tế nào đó, hoặc tổng thể những người hâm mộ bóng đá. Tổng thể đồng nhất: là các đơn vị giống nhau ở một hay một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu, và ngược lại gọi là tổng thể không đồng chất. Ví dụ như đối với việc nghiên cứu tình hình thu nhập của người lao động tại các ngân hàng thương mại cổ phần trên địa bàn thành phố Hà Nội thì tổng thể gồm các ngân hàng thương mại cổ phần trên địa bàn thành phố Hà Nội là tổng thể đồng chất, nhưng tổng thế gồm các ngân hàng trên địa bàn thành phố Hà Nội là tổng thể không đồng chất. Cần lưu ý thêm rằng tổng thể thống kê có thể là hữu hạn hoặc vô hạn. 1.2.2 Tổng thể mẫu (mẫu) Trong nhiều tình huống thực tế, khi phân tích các hiện tượng kinh tế - xã hội, chúng ta không thể nghiên cứu cũng như thu thập số liệu của tổng thể chung do chúng quá lớn gây ra chi phí cao, tốn nhiều thời gian và có thể dẫn đến sai số đáng kể trong quá trình thu thập dữ liệu và nghiên cứu, hoặc do không thể xác định được quy mô tổng thể chung, hoặc cũng có thể là khi nghiên cứu toàn bộ tổng thể chung sẽ làm phá vỡ hay ảnh hưởng hưởng đến việc nghiên cứu các tính chất của tổng thể chung. Chẳng hạn như doanh nghiệp cần nghiên cứu thông tin phản hồi về chất lượng sản phẩm từ phía khách hàng tiêu dùng, rõ ràng rằng doanh nghiệp không thể nào biết hết được số lượng khách hàng của doanh nghiệp để tiến hành thu thập thông tin phân tích. Khi đó người ta thường sử dụng một số phương pháp chọn mẫu thích hợp nào đó (chọn lặp, chọn không lặp, chọn theo khối, chọn hệ thống...) để chọn một số phần tử từ tổng thể chung để nghiên cứu. Những phần tử được chọn ra như thế được gọi là tổng thể mẫu. 1.2.3 Tiêu thức thống kê Là khái niệm dùng để chỉ các đặc điểm đặc trưng của đơn vị tổng thể. Ví dụ khi nghiên cứu nhân khẩu, mỗi nhân khẩu có các tiêu thức như: giới tính, độ tuổi, trình độ học vấn, nghề nghiệp, dân tộc, tôn giáo Khi nghiên cứu các doanh nghiệp, mỗi doanh nghiệp có các tiêu thức như: số lượng công nhân, giá trị tài sản cố định, giá trị máy móc thiết bị, vốn đầu tư, doanh thu tiêu thụ sản phẩm, lợi nhuận Tiêu thức thống kê có thể chia làm hai loại: Tiêu thức thuộc tính: là tiêu thức phản ánh tính chất hay loại hình của đơn vị tổng thể, không biểu hiện trực tiếp bằng các con số. Ví dụ như tiêu thức giới tính, nghề nghiệp, tình trạng hôn nhân, dân tộc, thành phần kinh tế, nhóm sản phẩmTiêu thức thuộc tính còn được gọi là chất lượng hay tiêu thức phi số lượng. Tiêu thức số lượng: là tiêu thức biểu hiện trực tiếp bằng các con số. Ví dụ như chiều cao, trọng lượng con người, năng suất lao động, doanh số bán hàng, mức lương, kim ngạch xuất-nhập khẩu Các trị số cụ thể khác nhau 3 của tiêu thức số lượng gọi là lượng biến. Lượng biến có thể phân thành hai loại là lượng biến rời rạc và lượng biến liên tục. 1.2.4 Chỉ tiêu thống kê Là chỉ sự biểu hiện một cách tổng hợp đặc điểm về mặt lượng trong sự thống nhất mật thiết với mặt chất của tổng thể thống kê trong điều kiện thời gian và không gian cụ thể. Một chỉ tiêu thống kê luôn có hai mặt: Khái niệm và mức độ. Khái niệm bao gồm định nghĩa và giới hạn về thực thể, chỉ rõ nội dung kinh tế xã hội của chỉ tiêu thống kê. Mức độ phản ánh quy mô hoặc cường độ của hiện tượng. Ví dụ: Tốc độ tăng trưởng kinh tế Việt Nam năm 2015 là 6,68%. Theo Nghị định số 56/2009/NĐ-CP ngày 30/6/2009 của Chính phủ, doanh nghiệp nhỏ và vừa là cơ sở kinh doanh đã đăng ký kinh doanh theo quy định pháp luật, được chia thành ba cấp như sau: Doanh nghiệp siêu nhỏ Doanh nghiệp nhỏ Doanh nghiệp vừa Số lao động Tổng nguồn vốn Số lao động Tổng nguồn vốn Số lao động I. Nông, lâm nghiệp và thuỷ sản <10 người 20 tỷ đồng trở xuống 10 – 200 người 20 – 100 tỷ đồng 200 – 300 người II. Công nghiệp và xây dựng < 10 người 20 tỷ đồng trở xuống 10 – 200 người 20 – 100 tỷ đồng 200 – 300 người III.Thương mại và dịch vụ < 10 người 10 tỷ đồng trở xuống 10 – 50 người 10 – 50 tỷ đồng 50 – 100 người Chỉ tiêu thống kê được phân thành hai loại: Chỉ tiêu khối lượng: là các chỉ tiêu biểu hiện quy mô của tổng thể. Ví dụ như số doanh nghiệp quốc doanh, tổng sản phẩm quốc nội, số sinh viên đại học, số diện tích gieo trồng... Chỉ tiêu khối lượng có ý nghĩa rất lớn đối với thực tiễn như trong tiêu dùng, phân phối sản phẩm, kiểm tra tình hình thực hiện kế hoạch... Chỉ tiêu chất lượng: biểu hiện tính chất, trình độ phổ biến quan hệ so sánh trong tổng thể, chẳng hạn như tốc độ phát triển kinh tế, mật độ dân số, giá thành đơn vị sản phẩm, năng suất lao động, năng suất cây trồng... 1.2.5 Thang đo thống kê 4 Nói chung, thống kê dùng 4 loại thang đo cơ bản dưới đây: 1.2.5.1 Thang đo định danh (Nominal scale) Là thang đo đánh số các biểu hiện cùng loại của tiêu thức thuộc tính. Loại thang đo này thường được dùng với các tiêu thức thuộc tính mà các biểu hiện của nó là một hệ thống các loại khác nhau không theo một trật tự xác định, chẳng hạn như: giới tính, khu vực địa lý, nghề nghiệp, tôn giáo, sắc tộc...Người ta đánh số (mã hóa) hoặc dùng ký tự để chỉ định cho từng loại, ví dụ như đối với tiêu thức giới tính ta có hai loại nam và nữ, hơn nữa không có trật tự nào giữa hai loại này, biểu hiện nam được đánh số 1 và nữ được đánh số 2. Các con số không có quan hệ hơn kém, không thực hiện được các phép tính đại số, chỉ dùng để mã hóa và đếm tần số. 1.2.5.2 Thang đo thứ bậc (Ordinal scale) Là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém. Thường dùng để đo các tiêu thức thuộc tính mà các biểu hiện có quan hệ thứ tự như đo thái độ đối với một hành vi nào đó (hoàn toàn đồng ý, đồng ý, chưa quyết định, hoàn toàn không đồng ý) hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ... Trong một số trường hợp thang đo thứ bậc có thể kết hợp với thang đo định danh để hiểu rõ được khái niệm hơn. Chẳng hạn, để đánh số các biểu hiện của tiêu thức tôn giáo có thể dùng thang đo định danh (1. Phật giáo, 2. Thiên chúa giáo, ... h 2 2 1 1 1 1 k i i i k i i n S S n . Khi 0H đúng thì thống kê Bartlett 2 2 1 1 2.303 .lg .lg 1 1 1 1 3( 1) n i i i k i i h S h S G k h h với 1 k i i h h và 1i ih n tuân theo quy luật phân phối khi bình phương 2 1k , 3in . Với mức ý nghĩa cho trước, nếu 2 ( 1)qsG k thì ta bác bỏ 0H . Ngược lại, ta chưa có cơ sở để bác bỏ 0H , tạm thời vẫn chấp nhận giả thuyết này đối với mẫu đang xét. Ví dụ: Từ bốn mẫu độc lập với kích thước 10, 13, 15 và 16 được lấy ra từ các tổng thể phân phối chuẩn và tìm được các phương sai mẫu tương ứng là 0.25, 0.4, 0.36, 0.46. Với mức ý nghĩa 5%, hãy kiểm định xem phương sai của các tổng thể có bằng nhau hay không? 122 Trường hợp 2: Nếu các kích thước mẫu 1, , kn n bằng nhau, việc kiểm định thông qua tiêu chuẩn kiểm định Bartlett không còn đáng tin cậy nữa. Khi đó người ta sử dụng tiêu chuẩn kiểm định Cochran 2 max 2 2 2 1 2 k s G s s s để kiểm định 0H . Với mức ý nghĩa cho trước, nếu 2 1,max 2 2 2 1 2 n k k s G g s s s với 1 kn n n thì ta bác bỏ 0H . Ngược lại, ta chưa có cơ sở để bác bỏ 0H , tạm thời vẫn chấp nhận giả thuyết này đối với mẫu đang xét. Ví dụ: Từ bốn mẫu độc lập kích thước như nhau và bằng 17 được lấy ra từ các tổng thể phân phối chuẩn và tìm được các phương sai mẫu tương ứng là 0.26, 0.36, 0.40 và 0.42. Với mức ý nghĩa 5%, hãy kiểm định sự bằng nhau của các phương sai của tổng thể. 9.1.3 Kiểm định giả thuyết về tham số p phương sai của biến ngẫu nhiên phân phối không-một Trường hợp một tham số: Giả sử lượng biến của tiêu thức X trong tổng thể chung tuân theo quy luật phân phối không-một. Ta chưa biết p nhưng nếu có cơ sở để cho rằng nó bằng 0p , ta đưa ra giả thuyết 0 0:H p p . Nếu n và p thỏa mãn điều kiện 1 5, 0.3 1 p p n n p p thì khi 0H đúng, thống kê 0 0 0 . 1 F p G n p p tuân theo quy luật chuẩn hóa 0,1N . Khi đó ta quyết định bác bỏ hay thừa nhận 0H phụ thuộc vào việc so sánh giá trị quan sát 0 0 0 . 1 qs f p G n p p với giá trị tới hạn của 0,1N dựa vào giả thuyết đối 1H tương tự như đã làm cho việc kiểm định giả thuyết về một kỳ vọng toán của tổng thể chung. Ví dụ: Tỷ lệ khách hàng tiêu dùng một loại sản phẩm tại một địa phương là 60%. Sau một chiến dịch quảng cáo người ta muốn đánh giá xem chiến dịch quảng cáo này có thật sự mang lại hiệu quả hay không. Để làm điều đó người ta phỏng vấn ngẫu nhiên 400 khách hàng thì thấy có 250 người tiêu dùng loại sản phẩm nói trên. Với mức ý nghĩa 0.05 , hãy kết luận về hiệu quả của chiến dịch quảng cáo đó. Trường hợp hai tham số: Giả sử có hai tổng thể chung, tổng thể thứ nhất có lượng biến của tiêu thức 1X tuân theo quy luật phân phối không-một 1A p và tổng thể thứ 123 hai có lượng biến của tiêu thức 2X tuân theo quy luật phân phối không-một 2A p . Nếu 1p và 2p chưa biết nhưng có cơ sở để giả định rằng giá trị của chúng bằng nhau ta có giả thuyết gốc là 0 1 2:H p p . Từ hai tổng thể trên có thể rút ra hai mẫu độc lập 11 11 12 1 , ,..., nW X X X và 22 21 22 2, ,..., nW X X X . Khi 0H đúng thì thống kê 1 2 1 2 1 1 2 2 1 2 1 1 F F p p G p p p p n n trở thành 1 2 1 2 1 1 1 F F G p p n n và tuân theo quy luật 0,1N khi 1 230, 30n n . Thông thường p chưa biết nên nó được thay bởi 1 1 2 2 1 2 n f n f f n n . Do đó việc quyết định bác bỏ hay thừa nhận 0H phụ thuộc vào việc so sánh giá trị quan sát 1 2 1 2 1 1 1 qs f f G f f n n với giá trị tới hạn của 0,1N dựa vào giả thuyết đối 1H tương tự như đã làm cho việc kiểm định giả thuyết về hai kỳ vọng toán của tổng thể chung. Ví dụ: Hiện tượng học sinh bỏ học là vấn đề đang được đặc biệt quan tâm, nhất là ở các vùng nông thôn. Tại hai trường trung học ở hai vùng nông thôn M và N trong năm học 2011-2012 có các số liệu sau: Trường Số học sinh Số học sinh bỏ học M 1900 175 N 2600 325 Với mức ý nghĩa 0.05 , có thể cho rằng tình trạng bỏ học ở trường N là nghiêm trọng hơn ở trường M hay không? Trường hợp nhiều hơn hai tham số:Giả sử có k tổng thể nghiên cứu trong đó các biến ngẫu nhiên , ( 1, )iX i k tuân theo quy luật phân không-một iA p . Các tỷ lệ ip chưa biết nhưng nếu có cơ sở để giả định rằng tất cả chúng bằng nhau, khi đó ta có thể đưa ra giả thuyết gốc 0 1 2: kH p p p p . Để kiểm định giả thuyêt này, từ các tổng thể chung lấy ra k mẫu ngẫu nhiên, độc lập nhau, với kích thước tương ứng là 1, , kn n và các số liệu được trình bày dưới dạng bảng sau: 124 Mẫu Số lần xuất hiện biến cố Số lần không xuât hiện biến cố Tổng số in 1 11X 12X 1n I 1iX 2iX in K 1kX 2kX kn Tổng số jm 1m 2m in n Nếu 50,in i thì thống kê toán 1 0,1 1 i i i i i i i X n p U N n p p , 1,i k và thống kê toán 2 2 1 k i i G U k . Khi 0H đúng thì thống kê 2 1 1 1 k i i i i X n p G n p p . Thông thường p chưa biết nên nó được thay bởi xấp xỉ của nó 11 21 1 1 2 k k x x x f n n n và 2 1 1 1 k i i i i X n p G n p p trở thành 2 22 1 2 1 1 1 1 1 1 k k i i ij i i j i ji X n f X G n k n mn p f . Với mức ý nghĩa cho trước, nếu 22 2 1 1 1 1 k ij qs i j i j x G n k n m thì bác bỏ 0H . Ngược lại, ta chưa có cơ sở để bác bỏ 0H , tạm thời vẫn chấp nhận giả thuyết này đối với mẫu đang xét. Lưu ý: Để sử dụng tiêu chuẩn kiểm định trên thì số lần xuất hiện biến cố trong mỗi mẫu ít nhất là 5 lần. Ví dụ: Trước khi đưa ra thị trường một loại sản phẩm với màu sơn mới, người ta muốn xem xét các lứa tuổi khác nhau phản ứng như thế nào với màu sắc sản phẩm đó. Một cuộc điều tra theo những nhóm lứa tuổi khác nhau về phản ứng của họ đối với màu sắc của sản phẩm mà doanh nghiệp sản xuất thu được kết quả như sau: Thích Không thích Tổng Dưới 25 tuổi 104 21 125 Từ 25 đến 35 122 28 150 Từ 36 đến 45 68 32 100 Từ 46 trở lên 41 34 75 Tổng 335 115 450 125 Với mức ý nghĩa 0.05 , có thể cho rằng tỷ lệ những người thích màu sắc đó của sản phẩm là như nhau đối với mọi lứa tuổi hay không? 9.2 Kiểm định phi tham số 9.2.1 Kiểm định giả thuyết về tính độc lập của hai dấu hiệu định tính: Giả sử cần nghiên cứu đồng thời hai dấu hiệu định tính A và B trên cùng một tổng thể. Dấu hiệu A có các phạm trù là 1 2, , , kA A A và dấu hiệu B có các phạm trù là 1 2, , , lB B B . Nếu có cơ sở để giả thuyết rằng A và B độc lập nhau, ta đưa ra cặp giả thuyết thống kê như sau: 0H : A và B độc lập nhau, 1H : A và B không độc lập nhau. Để kiểm định giả thuyết trên ta lập mẫu kích thước n và trình bày các số liệu mẫu dưới dạng bảng như sau: 1B 2B jB lB Tổng số in 1A 11n 12n 1 jn 1ln 1n 2A 21n 22n 2 jn 2ln 2n iA 1in 2in ijn iln in kA 1kn 2kn kjn kln kn Tổng số jm 1m 2kn jm lm n Trong đó ijn là tần số ứng với các phần tử đồng thời mang dấu hiệu iA và jB . Với n khá lớn thì theo định nghĩa thống kê về xác suất ta có: iji j n P A B n , ii n P A n và jj m P B n . Nếu 0H đúng có nghĩa là A và B độc lập nhau. Khi đó .ij jii j i j n mn P AB P A P B n n n và thống kê ij ij 2 1 1 1 1 . 1 1 1 . . ji k l k l ji j i ji i j n mn nn n n G n n k l mn n m n n . Với mức ý nghĩa cho trước và nếu ij 2 1 1 1 1 1 . k l qs i j i j n G n k l n m 126 thì bác bỏ 0H . Ngược lại, ta chưa có cơ sở để bác bỏ 0H , tạm thời vẫn chấp nhận giả thuyết này đối với mẫu đang xét. Ví dụ: Để lập kế hoạch sản xuất, một công tuy đã làm một cuộc điều tra về sở thích của khách hàng về ba loại mẫu hàng khác nhau là A, B, C của cùng một loại hàng và thu được kết quả như sau: A B C Tổng Thích 43 30 42 115 Không thích 35 53 39 127 Không có ý kiến 22 17 19 58 Tổng 100 100 100 300 Có hay không sự phân biệt về sở thích của khách hàng đối với ba loại mẫu nói trên? Cho kết luận với mức ý nghĩa 5%. 9.2.2 Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên: Giả sử chưa biết quy luật phân phối xác suất của biến ngẫu nhiên gốc X trong tổng thể nghiên cứu nhưng nếu có cơ sở để giả định rằng X tuân theo quy luật phân phối A nào đó. Khi đó ta đưa ra cặp giả thuyết thống kê sau: 0H : X tuân theo quy luật phân phối xác suất A 1H : X không tuân theo quy luật phân phối xác suất A Trường hợp 1: X là biến ngẫu nhiên rời rạc Từ tổng thể, thực hiện một mẫu kích thước nvới bảng phân phối thực nghiệm như sau: Giá trị X có thể nhận 1x 2x kx Số lần xuất hiện ix 1m 2m km Với 1 k i i m n . Nếu 0H đúng có nghĩa là X tuân theo quy luật phân phối xác suất A thì về mặt lý thuyết ta tính được các giá trị xác suất tương ứng với ix bằng , 1,i ip P X x i k . Khi đó tần số lý thuyết là , 1,i in np i k . Xét tiêu chuẩn kiểm định 2 2 1 1 k i i i i m n G k r n trong đó r là tham số cần ước lượng của quy luật cần kiểm định bằng phương pháp ước lượng điểm hợp lý tối đa. Với mức ý nghĩa cho trước, nếu 2 2 1 1 k i i qs i i m n G k r n thì bác bỏ 0H . Ngược lại, ta chưa có cơ sở để bác bỏ 0H , tạm thời vẫn chấp nhận giả thuyết này đối với mẫu đang xét. 127 Ví dụ: Số con của 2000 phụ nữ thủ đô dưới 25 tuổi với số liệu như sau: Số con X 0 1 2 3 4 Số phụ nữ 1090 650 220 30 10 Với mức ý nghĩa 0.05 , có thể xem X tuân theo quy luật phân phối Poisson được không? Trường hợp 2: X là biến ngẫu nhiên liên tục Từ tổng thể, thực hiện một mẫu kích thước nvới bảng phân phối thực nghiệm dưới dạng ghép lớp như sau: 1i ix x 0 1x x 1 2x x 1k kx x Số lần xuất hiện 1m 2m km Nếu 0H đúng thì về mặt lý thuyết ta tính được 1 , 1,i i ip P x X x i k và tần số lý thuyết là , 1,i in np i k . Các bước kiểm định tiếp theo ta tiến hành tương tự như trường hợp X là biến rời rạc ở trên. Xét trường hợp cụ thể đối với việc kiểm định giả thuyết về dạng phân phối chuẩn. Khi đó 11 0 0i ii i i x x p P x X x . Thông thường ta chưa biết và nên chúng được thay bằng các ước lượng điểm hợp lý tối đa tương ứng là xvà ms với 2 1 1 . k i i i ms x x m n Khi đó 1 0 0 i i i x x x x p ms ms . Ví dụ: Gặt 200 thửa ruộng của một vùng thu được các số liệu sau: Năng suất (tạ/ha) Số thửa ruộng tương ứng 4-6 15 6-8 26 8-10 25 10-12 30 12-14 26 14-16 21 16-18 24 18-20 20 20-22 13 n=200 128 Với mức ý nghĩa 0.05 , có thể xem năng suất lúa của vùng đó tuân theo quy luật phân phối chuẩn hay không? 9.3 Kiểm định mô hình hồi quy Hàm hồi quy tổng thể chung là hàm tuyến tính mô tả đường thẳng đi qua các giá trị trung bình của Y ứng với các giá trị khác nhau của X . Phương trình tổng thể chung và phương trình hồi quy mẫu tương ứng có dạng 0 1i i iE Y X X và 0 1i iY b b X Trong đó iY là ước lượng của iE Y X , 0b là ước lượng của 0 , 1b là ước lượng của 1 . 9.3.1 Kiểm định ý nghĩa của các hệ số i : Giả sử giả thuyết gốc 0 : 0iH . Xét thống kê toán i i i b G Se , với 2 2 1 0 2 1 . n i i n i i x Se n x x là sai số chuẩn của 0b 2 1 2 1 n i i Se x x , 2 2 1 2 2 n i i i y y SSE n n Khi 0H đúng thì 2 i i i b G T n Se và việc kiểm định được tiến hành như trong phần kiểm định giả thuyết thống kê đối với tham số đã trình bày ở phần trước. Ví dụ: Có kết quả điều tra về doanh số bán hàng và tiền lương trong tháng của 10 nhân viên kinh doanh tại một doanh nghiệp như sau: Nhân viên Doanh số bán hàng (triệu đồng) Tiền lương nhân viên (triệu đồng) 1 300 4.0 2 350 6.0 3 420 6.5 4 480 7.0 5 530 7.2 6 580 7.6 7 620 8.0 8 650 8.2 9 700 8.5 10 720 9.0 Với mức ý nghĩa 0.05 , có tồn tại mối liên hệ giữa doanh số bán hàng với tiền lương nhân viên trong doanh nghiệp không? 129 9.3.2 Kiểm định ý nghĩa của hệ số tương quan: Hệ số tương quan của mô hình hồi quy đơn 0 1i i iE Y X X và 0 1i iY b b X là 1 . . . x x y y xy x y r b Hệ số tương quan này có được dựa trên số liệu mẫu được điều tra, do vậy có những trường hợp r tính được khá gần 1 nhưng chưa chắc hệ số tương quan tổng thể chung ( ) ( ). ( ) .X Y E XY E X E Y cũng khá gần 1 thậm chí có thể khá gần 0, có nghĩa là không có mối liên hệ tương quan tuyến tính. Chính lý do đó, chúng ta cần phải kiểm định hệ số hồi quy cho tổng thể. Trong trường hợp này ta sử dụng thống kê toán 21 2 r G r n Xét cặp giả thuyết thống kê 0 : 0H và 1 : 0H . Khi giả thuyết gốc 0H đúng thì 2G T n , ta so sánh giá trị quan sát qsG với ( 2) /2 nt . Nếu ( 2)/ 2 n qsG t thì bác bỏ 0H và ngược lại. Ví dụ: Trở lại ví dụ trước, Có kết quả điều tra về doanh số bán hàng và tiền lương trong tháng của 10 nhân viên kinh doanh tại một doanh nghiệp như sau: Nhân viên Doanh số bán hàng (triệu đồng) Tiền lương nhân viên (triệu đồng) 1 300 4.0 2 350 6.0 3 420 6.5 4 480 7.0 5 530 7.2 6 580 7.6 7 620 8.0 8 650 8.2 9 700 8.5 10 720 9.0 Với mức ý nghĩa 0.05 , thì có thực sự tồn tại mối liên hệ tương quan tuyến tính giữa doanh số bán hàng và tiền lương nhân viên kinh doanh của doanh nghiệp này? 130 9.3.3 Kiểm định sự phù hợp của phương trình:Để đánh giá mức độ phù hợp của phương trình hồi quy, nói cách khác xem biến độc lập giải thích được bao nhiêu % sự biến động của biến phụ thuộc thông qua hệ số xác định 2 2 1 2 2 1 1 1 n i i n n i i i i i Y Y R Y Y Y Y Trong trường hợp mô hình hồi quy đang xét là đơn thì 2 2R r . Kiểm định sự phù hợp của phương trình hồi quy đơn thông qua mẫu đồng nghĩa với việc kiểm định cặp giả thuyết: 20 : 0H R và 2 1 : 0H R vì 20 1R . Xét thống kê 2 2 2 1, 2 1 R n G F n R .Vậy nếu 1, 2nqsG f thì bác bỏ 0H và ngược lại. Ví dụ: Cũng ví dụ trên,với mức ý nghĩa 0.05 , thì phương trình hồi quy mẫu có phù hợp không? 131 TÀI LIỆU THAM KHẢO [1] Phạm Ngọc Kiểm, Nguyễn Duy Thục (2009), Giáo trình nguyên lý thống kê kinh tế, NXB Đại học Quang Trung. [2] Trần Thị Kim Thu (2013), Giáo trình lý thuyết thống kê, NXB Đại học Kinh tế Quốc dân. [3] Trần Thị Kỳ, Nguyễn Văn Phúc (2011), Nguyên lý thống kê, NXB Lao Động. [4] Nguyễn Thị Kim Thúy (2012), Nguyên lý thống kê, NXB Lao Động Xã hội. [5] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ (2012), Giáo trình lý thuyết xác suất và thống kê toán, NXB Đại học Kinh tế Quốc dân. [6] Nguyễn Quang Dong, Nguyễn Thị Minh (2012), Giáo trình kinh tế lượng, NXB Đại học Kinh tế Quốc dân. [7] Nguyễn Bích lâm (chủ biên) (2016), Từ điển thống kê, NXB Thống Kê. [8] Trang web của tổng cục thống kê: [9] Tổng cục Thống kê (2016), Tài liệu hướng dẫn điều tra doanh nghiệp, NXB Thống Kê. [10] David R. Anderson, Dennis J. Sweeney, Thomas A. Williams (2011), Statistics for Business and Economics, South-Western Cengage Learning. 132 PHỤ LỤC CÁC BẢNG SỐ Giá trị tới hạn chuẩn 133 134 Giá trị tới hạn Student df 135 df 136 df 137 Giá trị tới hạn khi bình phương df df 138 Giá trị tới hạn Fisher-Snedecor 1df 2df 139 140 Phân phối Poisson 141 142 143 144 145
File đính kèm:
- bai_giang_nguyen_ly_thong_ke_kinh_te.pdf