Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn

Khái niệm cơ bản (1/2)

• Tổng thể (Populations) - toàn bộ các quan sát có thể có của

một biến với một phân bố xác suất xác định. Số phần tử của

tổng thế ký hiệu là N.

• Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ

thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết

quy luật phân bố xác suất. Mẫu gồm hữu hạn n phần tử. Số n

được gọi là cỡ mẫu.

• Tần số (Frequency) - Gọi xi là các giá trị quan sát được của

biến ngẫu nhiên X (i = 1, 2,.n). Số lần xuất hiện của giá trị xi

trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi

pdf 21 trang yennguyen 3040
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn

Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
v 1.1 - 04/2013
Phân tích dữ liệu thống kê
1
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Nội dung
2
1. Thống kê mô tả
2. Bảng tần suất
3. Xếp hạng và phần trăm theo nhóm
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Thống kê mô tả
Descriptive Statistics
3
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Khái niệm cơ bản (1/2)
4
• Tổng thể (Populations) - toàn bộ các quan sát có thể có của 
một biến với một phân bố xác suất xác định. Số phần tử của 
tổng thế ký hiệu là N.
• Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ 
thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết 
quy luật phân bố xác suất. Mẫu gồm hữu hạn n phần tử. Số n 
được gọi là cỡ mẫu.
• Tần số (Frequency) - Gọi xi là các giá trị quan sát được của 
biến ngẫu nhiên X (i = 1, 2,...n). Số lần xuất hiện của giá trị xi 
trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi. 
Ta có 
fi =
i=1
l
∑ n
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Khái niệm cơ bản (2/2)
• Tần số tích luỹ (Cumulative Frequency) - Tần số tích luỹ của 
một giá trị xi là tổng số tần số của giá trị này với tần số của các 
giá trị nhỏ hơn xi.
• Số định tâm (Measure of Central Tendency) - Số định tâm của 
nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể 
hiện vai trò trung tâm của nhóm dữ liệu.
• Số phân tán (Measure of Dispersion) - Số phần tán dùng để 
thể hiện sự khác biệt giữa các số trong khối dữ liệu đối với số 
định tâm
5
• Số trung bình (Mean)
• Trung bình trọng số (Weighted mean)
• Số trung vị (Median)
• Số yếu vị (Mode)
• Hàng số (Khoảng) (Range)
• Độ lệch chuẩn (Standard deviation)
• Phương sai (Variance)
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Thông số thống kê (1/4)
6
Thông số Hàm Excel Giải thích
Số trung bình AVERAGE(number1, number2,...) Tính trung bình của các tham số 
của nó
Số trung vị MEDIAN(number1, number2,...) Là số mà phân nửa giá trị quan 
sát được của khối dữ liệu nhỏ hơn 
nó và phân nữa còn lại lớn hơn nó
Số yếu vị MODE(number1, number2,...) Là số có tần số lớn nhất
Phương sai mẫu VAR(number1, number2,...) Là số trung bình số học của bình 
phương các độ lệch giữa các 
lượng biến và số trung bình số 
học của các lượng biến đó
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Thông số thống kê (2/4)
7
Thông số Hàm Excel Giải thích
Độ lệch chuẩn STDEV(number1, number2,...) Là căn bậc 2 của phương sai
Hàng số Range = XMax - XMin Là sai biệt giữa lượng biến lớn 
nhất và lượng biến nhỏ nhất của 
dãy số
Giá trị nhỏ nhất MIN(number1, number2,...) Giá trị nhỏ nhất của lượng biến
Giá trị lớn nhất MAX(number1, number2,...) Giá trị lớn nhất của lượng biến
Số phần tử COUNT(value1, value2,...) Số phần tử trong mẫu
Thứ hạng RANK(number, ref, order)
order=0 danh sách giảm dần
order≠0 danh sách tăng dần
Trả về thứ hạng của một số trong 
danh sách
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Thông số thống kê (3/4)
8
Thông số Hàm Excel Giải thích
Độ bất đối xứng SKEW(number1, number2,...) Độ bất đối xứng được tính bằng 
cách lấy moment thứ ba của trị 
trung bình chia cho độ lệch chuẩn 
luỹ thừa ba
Độ nhọn KURT(number1, number2,...) Độ nhọn được tính bằng cách lấy 
moment thứ tư của trị trung bình 
chia cho độ lệch chuẩn luỹ thừa 
bốn
Tìm giá trị nhỏ thứ 
k trong mẫu
SMALL(array, k)
SMALL(array, 1) → Số Min
SMALL(array, n) → Số Max
Hàm trả về lượng biến nhỏ thứ k 
trong mẫu có n lượng biến
Tìm giá trị lớn thứ 
k trong mẫu
LARGE(array, k)
LARGE(array, 1) → Số Max
LARGE(array, n) → Số Min
Hàm trả về lượng biến lớn thứ k 
trong mẫu có n lượng biến
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Thông số thống kê (4/4)
9
Thông số Hàm Excel Giải thích
Tần số xuất hiện 
của các giá trị 
trong mẫu
FREQUENCY(data_array, 
bins_array)
Data_array : tập số liệu
Bins_array : các nhóm trong tập số liệu
Trả về tần số xuất hiện các biến 
cố trong các khoảng cho trước
Nhóm theo phần 
trăm
PERCENTILE(array, k)
array : tập số liệu
k : nhóm phần trăm (0..1)
Trả về nhóm tính theo phần trăm 
của giá trị trong tập số liệu
Xếp hạng theo 
phần trăm
PERCENTRANK(array, x, 
significance)
array : tập số liệu
x : giá trị cần biết hạng
significance : số lẻ cần thiết
Trả về hạng của một giá trị trong 
tập số liệu theo phần trăm trong 
tập số liệu
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Descriptive Statistics
10
Vùng địa chỉ dữ liệu cần 
thống kê
Dữ liệu theo hàng hay cột
Vùng địa chỉ dữ liệu được 
chọn bao gồm cả nhãn ?
Nơi chứa kết quả tính được 
Phải chọn ít nhất 1 trong 
4 mục này Độ tin cậy của giá trị trung 
bình
Bấm OK để thực hiện 
tính toán
Trị quan sát lớn/nhỏ thứ k
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
11
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
12
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Bảng tần suất
Histogram
13
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Histogram
14
• Mô tả số lần xuất hiện của một mẫu thông tin trong một tập dữ liệu
• Mỗi mẫu thông tin gọi là bin, mỗi lần số bin lặp lại được hiểu là tần suất xuất 
hiện của nó
Vùng địa chỉ dữ liệu cần 
thống kê
Vùng địa chỉ các bin
Vùng địa chỉ dữ liệu được 
chọn bao gồm cả nhãn ?
Nơi chứa kết quả tính được 
Tính phần trăm tích luỹ
Thêm một bảng kết quả 
trong đó, kết quả phần trăm 
tích luỹ sẽ được sắp xếp 
giảm dần
Bấm OK để thực hiện 
tính toán
Thêm đồ thị tần suất
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
15
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
16
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Xếp hạng và phần trăm 
theo nhóm
Rank and Percentile
17
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Rank and Percentile
18
Vùng địa chỉ dữ liệu cần 
thống kê
Vùng địa chỉ dữ liệu 
được chọn bao gồm cả 
nhãn ?
Nơi chứa kết quả tính được 
Bấm OK để thực hiện 
tính toán
Dữ liệu theo hàng hay cột
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
19
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê
Ví dụ
20
Wednesday, May 8, 13
Lê Viết Mẫn - lvman@hce.edu.vn
Cảm ơn sự chú ý
Câu hỏi ?
Phân tích dữ liệu thống kê21
Wednesday, May 8, 13

File đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_nang_cao_chuong_9_phan_tich_du_li.pdf