Bài giảng Xác suất thống kê - Chương tổng kết: Ôn tập phần thống kê - Phạm Trí Cao

KHẮC CỐT GHI TÂM

? Một câu hỏi về Thống kê thường chỉ thuộc 1 trong 2

dạng: ước lượng hoặc kiểm định.

? Nếu là ước lượng: UL trung bình hay UL tỷ lệ . UL

điểm (không cho độ tin cậy) hay UL khoảng (có cho

độ tin cậy).

? Xem thuộc dạng toán nào trong 3 dạng toán đã học (có

3 tham số; biết 2 tham số, tìm 1 tham số còn lại). UL tỷ

lệ thêm 2 dạng toán (biết M tìm N, biết N tìm M).

? Nếu là UL trung bình thì xem biết ? hay chưa biết ?.

? Nếu là UL tỷ lệ thì mẫu phải lớn

 

pdf 8 trang yennguyen 1200
Bạn đang xem tài liệu "Bài giảng Xác suất thống kê - Chương tổng kết: Ôn tập phần thống kê - Phạm Trí Cao", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê - Chương tổng kết: Ôn tập phần thống kê - Phạm Trí Cao

Bài giảng Xác suất thống kê - Chương tổng kết: Ôn tập phần thống kê - Phạm Trí Cao
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
1
1
ÔN TẬP PHẦN THỐNG KÊ
 Phần này chỉ ôn lại một số dạng
toán cơ bản thường gặp.
 Các dạng toán còn lại sinh viên/
học viên tự xem trong quyển bài
tập XSTK.
KHẮC CỐT GHI TÂM
 Một câu hỏi về Thống kê thường chỉ thuộc 1 trong 2
dạng: ước lượng hoặc kiểm định.
 Nếu là ước lượng: UL trung bình hay UL tỷ lệ. UL
điểm (không cho độ tin cậy) hay UL khoảng (có cho
độ tin cậy).
 Xem thuộc dạng toán nào trong 3 dạng toán đã học (có
3 tham số; biết 2 tham số, tìm 1 tham số còn lại). UL tỷ
lệ thêm 2 dạng toán (biết M tìm N, biết N tìm M).
 Nếu là UL trung bình thì xem biết  hay chưa biết .
 Nếu là UL tỷ lệ thì mẫu phải lớn.
2
KHẮC CỐT GHI TÂM (tt)
 Nếu là kiểm định: KĐ trung bình hay KĐ tỷ lệ.
 Xem con số cần kiểm định là con số nào.
 Xem kiểm định 2 phía hay 1 phía.
 Nếu là KĐ trung bình thì xem biết  hay chưa biết .
 Nếu là KĐ tỷ lệ thì mẫu phải lớn.
 Làm toán về thống kê phải chú ý là đưa về cùng
đơn vị tính/ đo.
3 4
BÀI 1: 
Nhà trường muốn đánh giá số giờ tự học của sinh 
viên trong tuần. Để biết điều này, phòng đào tạo 
chọn ngẫu nhiên 25 sinh viên và được kết quả sau: 
 9 8 7 6 7 
 8 9 4 7 6 
 6 4 11 5 4 
 3 7 8 8 7 
 6 2 2 8 6 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
2
5
1) Ước lượng số giờ tự học trung bình của sinh 
viên trong tuần? 
2) Ước lượng số giờ tự học trung bình của sinh 
viên trong tuần, với độ tin cậy 95%? (Giả 
thiết số giờ tự học của sinh viên trong tuần 
tuân theo luật phân phối chuẩn) 
3) Một báo cáo trong quá khứ nói rằng: số giờ 
tự học trung bình của sinh viên trong tuần là 
8. Với mức ý nghĩa 5%, hãy so sánh kết quả 
mới điều tra này với kết quả trong quá khứ? 6
Hướng dẫn : 
Số giờ tự học 2 3 4 5 6 7 8 9 11 
Số sinh viên 2 1 3 1 5 5 5 2 1 
n = 25 , nixi = 158 , nixi2= 1118 , x =  ixinn
1 = 158/25 = 6,32 
s2=  
)2)(.2(
1
1 xn
i
x
i
n
n
= (1118–25(6,32)2)/24 = 4,9767 
s = 2s = 2,2309 
1) Gọi  là số giờ tự học trung bình của sinh viên trong tuần của 
toàn trường. Ta dùng x để ước lượng  
Vậy số giờ tự học trung bình trong tuần của sinh viên là 6,32 giờ. 
7
2) chưa biết  
= 95% = 1– = 5% t /2(n–1) = t0,025(24) = 2,064 
 = t /2 (n–1)
n
s = (2,064)(2,2309)/ 25 = 0,9209 
Khoảng tin cậy là (5,3991 ; 7,2409) 
Vậy số giờ tự học TB của SV là (5,3991 giờ ; 7,2409 giờ ) 
3) Lập giả thiết H0 :  = 8 ; H1:  8 
 : số giờ tự học TB của SV trong tuần hiện nay 
0 = 8: số giờ tự học TB của SV trong tuần trong quá khứ 
 = 5% t0,025(24) = 2,064 
s
nx
t
)
0
(  
 = (6,32 – 8) 25 / 2,2309 = 3,7653 
Ta có: |t| > t0,025(24) : bác bỏ H0 
Vậy số giờ tự học TB của sinh viên trong tuần hiện nay 
 ít hơn trong quá khứ ( do x = 6,32 < 0 = 8) 
8
BÀI 2 
Số liệu thống kê về doanh số bán của 1 siêu thị trong 
một số ngày cho ở bảng sau: 
Doanh số (triệu đ/ ngày) Số ngày 
24 5 
30 12 
36 25 
42 35 
48 24 
54 15 
60 12 
65 10 
70 6 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
3
1) Ước lượng doanh số bán trung bình trong 1 ngày
của siêu thị, với độ tin cậy 95%?
2) Những ngày có doanh số bán từ 60 triệu đ trở lên
là những ngày "bán đắt hàng". Hãy ước lượng tỷ lệ
những ngày bán đắt hàng của siêu thị?
3) Ước lượng tỷ lệ những ngày "bán đắt hàng" của
siêu thị, với độ tin cậy 99%?
4) Ước lượng doanh số bán trung bình của 1 ngày
"bán đắt hàng" ở siêu thị, với độ tin cậy 95%? (Giả
thiết doanh số bán của những ngày bán đắt hàng là
đại lượng ngẫu nhiên phân phối theo quy luật chuẩn)

9
5) Trước đây doanh số bán trung bình của siêu thị
là 35 triệu đ/ngày. Số liệu ở bảng trên được thu
thập sau khi siêu thị áp dụng 1 phương thức bán
hàng mới. Hãy cho nhận xét về phương thức bán
hàng mới, với mức ý nghĩa 5%?
10
11
Hướng dẫn : 
Ta có n = 144 , nixi = 6602 , nixi2 = 321706, 
 x = 45,8472 , s2 = 133,0275 , s = 11,5338 
1) Gọi  là doanh số bán trung bình trong 1 ngày của siêu thị 
  = 95% t0,025(143) = 1,96 
  = 
(143).
0,025
t s
n
 = (1,96).(11,5338) / 144 = 1,8839 
 Khoảng tin cậy (43,9633 <  < 47,7311) 
2) Tỷ lệ những ngày bán đắt hàng theo mẫu: 
f = (12+10+6)/ 144 = 0,1944 
 Gọi p là tỷ lệ những ngày bán đắt hàng của siêu thị 
 Vậy tỷ lệ những ngày bán đắt hàng của siêu thị là 19,44% 
12
3)  = 99% z /2 = 2,575 
= 
(1 )
/2
z f f
n
 = (2,575) )1944,01()1944,0( / 144 
 = 0,0849 
KTC là (0,1095 ; 0,2793) 
4) Lập bảng sau: 
Doanh số 60 65 70 
Số ngày 12 10 6 
Ta có n = 28 , nixi = 1790 , nixi2 = 114850, 
x = 1790/28 = 63,9286 ; s = 3,9335 
s2 = (114850–28(63,9286)2) / 27 = 15,4724 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
4
13
4) Gọi ’ là doanh số bán TB trong 1 ngày bán đắt hàng của siêu thị 
t0,025(27) = 2,052 
  = (2,052).(3,9335)/ 28 = 1,5254 
 Khoảng tin cậy (62,4032 < ’ < 65,454) 
5) Lập giả thiết H0 :  = 35 ; H1 :  35 
  : doanh số bán trung bình hiện nay 
 0 = 35 : doanh số bán trung bình trước đây 
 = 5% t0,025(143) = 1,96 
 t = (45,8472–35) 144 / 11,5338 = 11,2856 
 Ta có |t| > t0,025(143): bác bỏ H0 
Vậy phương thức bán hàng mới tốt hơn (do x = 45,8472 > 0 = 35) 
14
BÀI 3 
Cho X là năng suất lúa ở 1 khu vực (đơn vị tính 
tạ/ha). Điều tra ở 1 số thửa ruộng ta có: 
X 30 – 35 35 – 40 40 – 45 45 – 50 50 – 55 
N 6 18 28 40 16 
N: số thửa ruộng. 
Ví dụ: có 18 thửa ruộng, năng suất của mỗi thửa 
là (35 – 40) tạ/ha 
1) Hãy ước lượng năng suất lúa trung bình của toàn
vùng, với độ tin cậy 96%?
2) Những thửa ruộng đạt năng suất trên 45 tạ/ha là
những thửa ruộng đạt năng suất cao. Hãy ước lượng tỷ lệ
những thửa ruộng đạt năng suất cao của vùng này, với
độ tin cậy 95%?
3) Nếu muốn ước lượng năng suất lúa trung bình của
toàn vùng đạt được độ chính xác là 1,4 tạ /ha thì độ tin
cậy là bao nhiêu?
4) Người ta nhận định: tỷ lệ những thửa ruộng đạt năng
suất cao lớn hơn 50%. Theo bạn nhận định đó đúng
không, = 5%?

15
5) Nếu muốn ước lượng năng suất lúa trung bình với độ
chính xác 0,5 tạ/ha và độ tin cậy 99% dựa trên mẫu đã
cho thì phải điều tra thêm bao nhiêu thửa ruộng nữa?
16
Hướng dẫn : 
1) Lập bảng sau: 
X 32,5 37,5 42,5 47,5 52,5 
N 6 18 28 40 16 
 n = 108, nixi = 4800, nixi2 = 216575 
 x = 44,4444 , s2 = 30,2999 , s = 5,5045 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
5
17
Hướng dẫn : 
1)  = 96% t0,02 (107) = 2,079 
  = (2,079) (5,5045) / 108 = 1,1012 
 Khoảng tin cậy (43,3432 ; 45,5456) 
2) Tỷ lệ thửa ruộng đạt năng suất cao theo mẫu: 
 f = (40+16)/108 = 0,5185 
 Gọi p là tỷ lệ thửa ruộng đạt năng suất cao của vùng 
  = (1,96) )5185,01()5185,0( / 108 = 0,0942 
 Khoảng tin cậy (0,4243 < p < 0,6127) 
3) t /2(n-1) = s
n = (1,4) 108 /5,5045 = 2,643 2,623 
 Tra bảng H, dòng k = 107, cột = 0,005. 
 Vậy = 2(0,005) = 0,01. Do đó  = 0,99 = 99% 
18
4) Lập giả thiết H0 : p = 0,5 ; H1: p > 0,5 
p : tỷ lệ thửa ruộng đạt năng suất cao thực tế 
p0 = 0,5: tỷ lệ thửa ruộng đạt năng suất cao theo nhận định 
 = 5% z = 1,645 
z =
)1(
)(
opop
nopf
 = (0,5185–0,5) 108 / )5,01()5,0( = 0,3845 
Ta có z < z : chấp nhận H0 . 
Vậy nhận định trên sai 
5) n 
.
2
/2
2
z s

 = (2,575 5,5045)2 / (0,5)2 = 803,619 804 
Vậy cần điều tra thêm 804–108 = 696 thửa ruộng nữa 
 BÀI 4.
 Để thăm dò nhu cầu về một loại hàng ở một TP,
người ta đã tiến hành phỏng vấn 500 hộ gia đình thì
thấy có 200 hộ có nhu cầu về loại hàng này.
 1) Hãy ước lượng số hộ gia đình có nhu cầu về mặt
hàng này ở thành phố, với độ tin cậy 96%? (Biết tổng
số hộ gia đình của thành phố là 20 000 hộ)
 2) Nếu muốn ước lượng tỷ lệ hộ gia đình có nhu cầu
về mặt hàng này đạt được độ chính xác 4% thì độ tin
cậy là bao nhiêu?
 3) Nếu muốn ước lượng tỷ lệ hộ gia đình có nhu cầu
về mặt hàng này đạt được độ chính xác 5% và độ tin
cậy 99% thì cần điều tra bao nhiêu hộ? 19 20
Hướng dẫn : 
1) Tỷ lệ hộ có nhu cầu về loại hàng này theo mẫu 
 f = 200/500 = 0,4 
 Gọi p là tỷ lệ hộ có nhu cầu về loại hàng này ở TP 
  = 2,05 )4,01(4,0 / 500 = 0,045 
 Vậy 0,355 < p < 0,445 
 Số hộ gia đình có nhu cầu về loại hàng này ở TP là: 
 0,355 20 000 < Số hộ < 0,445 20 000 
2) z /2 = 0,04 500 / )4,01(4,0 = 1,83 
 (z /2) = 0,4664  = 2(z /2) = 0,9328 
3) n = (2,575)2(0,4)(1–0,4) / (0,05)2 = 636,54 637 hộ 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
6
21
BÀI 5: Kết quả quan sát về hàm lượng Vitamin C 
của một loại trái cây cho ở bảng sau: 
Hàm lượng 
Vitamin C (%) 
3 - 7 8 - 10 11 - 13 14 - 16 17 - 19 20 - 24 
Số trái 5 10 20 35 25 5 
1) Nếu nói hàm lượng Vitamin C trung bình trong 1 
trái nhỏ hơn 16% thì tin được không, với = 4%? 
2) Qui ước những trái có hàm lượng Vitamin C từ 
17% trở lên là trái loại I. Nếu muốn độ chính xác khi 
ước lượng trung bình hàm lượng vitamin C là 0,5% và 
độ chính xác khi ước lượng tỷ lệ trái loại I là 5%, với 
cùng độ tin cậy 95% thì cần mẫu có kích thước 
tối thiểu là bao nhiêu? 
22
Hướng dẫn: 
1) H0: µ = 16 ; H1: µ < 16 
µ: hàm lượng Vitamin C TB trong 1 trái thực tế 
µ0 = 16: hàm lượng Vitamin C TB trong 1 trái 
 theo nhận định 
n = 100 , x = 14,4 , s = 3,8586 
(14,4 16). 100 4,1466
3,8586
t 
α = 4% t0,04(99) = 1,769 
Ta có t = -4,1466 < -t0,04(99) = -1,769 : bác bỏ H0 
Vậy nhận định trên tin được. 
23
2) Ước lượng trung bình: 
2
1,9 6 * 3 ,8 5 8 61 2 2 9
0 , 5
n
Ước lượng tỷ lệ: 
Tỷ lệ mẫu f = (25+5)/100 = 0,3 
2
1, 9 62 * 0 , 3 * 0 , 7 3 2 3
0 , 0 5
n
Cỡ mẫu n = max{229, 323} = 323 
Vậy cần khảo sát tối thiểu 323 trái. 24
BÀI 6. (MẪU 2 CHIỀU) 
X(%) và Y(kg/mm2) là 2 chỉ tiêu chất lượng của 1 
loại sản phẩm. Điều tra ở 1 số sản phẩm về (X,Y) 
ta có kết quả: 
(2,5) (8,15) (4,15) (4,10) (2,10) (8,25) 
(2,5) (6,10) (4,10) (8,20) (6,10) (8,15) 
(6,10) (6,15) (4,15) (6,15) (8,20) (6,15) 
(6,20) (6,10) (6,20) (6,15) (6,25) (8,20) 
(6,15) (6,20) (8,15) (6,15) (8,25) (8,15) 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
7
25
1) Ước lượng trung bình chỉ tiêu Y, với độ tin cậy 98%? 
2) Có tài liệu nói: Trung bình chỉ tiêu X là 6,5% . 
Cho nhận xét với mức ý nghĩa 5%? 
3) Quy ước: Sản phẩm có chỉ tiêu Y <= 15(kg/mm2) và 
X <= 6(%) là sản phẩm loại A. Ước lượng trung bình chỉ 
tiêu Y của sản phẩm loại A, với độ tin cậy 99%? 
(Biết rằng chỉ tiêu Y có quy luật phân phối chuẩn) 
4) Ước lượng tỷ lệ sản phẩm loại A, với = 5%? 26
Hướng dẫn : 
1) Lập bảng sau: 
 Y 
X 
5 
10 
15 
20 
25 
2 2 1 
4 2 2 
6 4 6 3 1 
8 4 3 2 
Bảng tần số quan sát của X và Y như sau: 
X 2 4 6 8 Y 5 10 15 20 25 
n 3 4 14 9 n 2 7 12 6 3 
27
1) n = 30 , nyy = 455 , nyy2 = 7725 , y = 15,1667 
sy2 = 
1
1
 n
[nyy2–n( y )2 ] = 28,4185 , sy = 5,3309 
 = 98% t0,01(29) = 2,462 
 = 
(29).
0,01
t sy
n
 = 2,462 5,3309 / 30 = 2,3962 
Vậy khoảng tin cậy y± là (12,7705 ; 17,5629) 
2) n = 30 , nxx = 178 , nxx2 = 1156 , x = 5,9333 
sx2 = 
1
1
 n
[nxx2 – n (x)2 ] = 3,4441 , sx = 1,8558 
28
2) Lập giả thiết H0 :  = 6,5 ; H1 :  6,5 
 : trung bình chỉ tiêu X thực tế 
0 = 6,5 : trung bình chỉ tiêu X theo nhận định 
 = 5% t0,025(29) = 2,045 
t = (5,9333 – 6,5) 30 / 1,8558 = 1,6726 
|t| < t0,025(29): chấp nhận H0 
3) Lập bảng sau: 
 Y 
X 
5 
10 
15 
2 2 1 
4 2 2 
6 4 6 
ThS. Phạm Trí Cao * Chương TK (Ôn phần thống kê) 17-02-2019
8
29
3) n = 17 , nyy = 200 , nyy2 = 2550 , 
 y = 11,7647 , sy2 = 12,3163 , sy = 3,5095 
= 99% = 1% t0,005(16) = 2,921 
 = 2,921 3,5095/ 17 = 2,4863 
Vậy khoảng tin cậy y ± là (9,2784 ; 14,251) 
4) Tỷ lệ sản phẩm loại A theo mẫu: f = 17/30 = 0,5667 
 = 5% z /2 = 1,96 
  = 1,96 )5667,01(5667,0 / 30 = 0,1773 
 Khoảng tin cậy f± là (0,3894 ; 0,744) 
VD7:
 Chiều cao của 1 loại cây A có quy luật phân
phối chuẩn với độ lệch chuẩn là 5 cm. Trước
đây chiều cao trung bình của loại cây A là
38 cm.
 Sau khi áp dụng một loại phân bón mới,
khảo sát 25 cây thấy chiều cao trung bình là
40 cm, độ lệch chuẩn mẫu là 4,6 cm.
 Có phải loại phân bón mới có tác dụng làm
tăng chiều cao của cây trồng, với mức ý
nghĩa 4%?
30
31
Giải: 
H0:  = 38 ; H1:  > 38 
 : chiều cao trung bình của loại cây A hiện nay 
0 = 38 : chiều cao trung bình của loại cây A trước đây 
Trường hợp biết  
 = 4% z = 1,75 
(40 38). 25
2
5
z
Ta cĩ: z = 2 > z = 1,75 : bác bỏ H0 
Vậy loại phân bĩn mới cĩ tác dụng làm tăng chiều cao 
của cây trồng 
Mời ghé thăm trang web:
32
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/

File đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_tong_ket_on_tap_phan_thon.pdf