Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn
Khái niệm cơ bản (1/2)
• Tổng thể (Populations) - toàn bộ các quan sát có thể có của
một biến với một phân bố xác suất xác định. Số phần tử của
tổng thế ký hiệu là N.
• Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ
thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết
quy luật phân bố xác suất. Mẫu gồm hữu hạn n phần tử. Số n
được gọi là cỡ mẫu.
• Tần số (Frequency) - Gọi xi là các giá trị quan sát được của
biến ngẫu nhiên X (i = 1, 2,.n). Số lần xuất hiện của giá trị xi
trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng nâng cao - Chương 9: Phân tích dữ liệu thống kê - Lê Viết Mẫn
Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê v 1.1 - 04/2013 Phân tích dữ liệu thống kê 1 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Nội dung 2 1. Thống kê mô tả 2. Bảng tần suất 3. Xếp hạng và phần trăm theo nhóm Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Thống kê mô tả Descriptive Statistics 3 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Khái niệm cơ bản (1/2) 4 • Tổng thể (Populations) - toàn bộ các quan sát có thể có của một biến với một phân bố xác suất xác định. Số phần tử của tổng thế ký hiệu là N. • Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết quy luật phân bố xác suất. Mẫu gồm hữu hạn n phần tử. Số n được gọi là cỡ mẫu. • Tần số (Frequency) - Gọi xi là các giá trị quan sát được của biến ngẫu nhiên X (i = 1, 2,...n). Số lần xuất hiện của giá trị xi trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi. Ta có fi = i=1 l ∑ n Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Khái niệm cơ bản (2/2) • Tần số tích luỹ (Cumulative Frequency) - Tần số tích luỹ của một giá trị xi là tổng số tần số của giá trị này với tần số của các giá trị nhỏ hơn xi. • Số định tâm (Measure of Central Tendency) - Số định tâm của nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò trung tâm của nhóm dữ liệu. • Số phân tán (Measure of Dispersion) - Số phần tán dùng để thể hiện sự khác biệt giữa các số trong khối dữ liệu đối với số định tâm 5 • Số trung bình (Mean) • Trung bình trọng số (Weighted mean) • Số trung vị (Median) • Số yếu vị (Mode) • Hàng số (Khoảng) (Range) • Độ lệch chuẩn (Standard deviation) • Phương sai (Variance) Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Thông số thống kê (1/4) 6 Thông số Hàm Excel Giải thích Số trung bình AVERAGE(number1, number2,...) Tính trung bình của các tham số của nó Số trung vị MEDIAN(number1, number2,...) Là số mà phân nửa giá trị quan sát được của khối dữ liệu nhỏ hơn nó và phân nữa còn lại lớn hơn nó Số yếu vị MODE(number1, number2,...) Là số có tần số lớn nhất Phương sai mẫu VAR(number1, number2,...) Là số trung bình số học của bình phương các độ lệch giữa các lượng biến và số trung bình số học của các lượng biến đó Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Thông số thống kê (2/4) 7 Thông số Hàm Excel Giải thích Độ lệch chuẩn STDEV(number1, number2,...) Là căn bậc 2 của phương sai Hàng số Range = XMax - XMin Là sai biệt giữa lượng biến lớn nhất và lượng biến nhỏ nhất của dãy số Giá trị nhỏ nhất MIN(number1, number2,...) Giá trị nhỏ nhất của lượng biến Giá trị lớn nhất MAX(number1, number2,...) Giá trị lớn nhất của lượng biến Số phần tử COUNT(value1, value2,...) Số phần tử trong mẫu Thứ hạng RANK(number, ref, order) order=0 danh sách giảm dần order≠0 danh sách tăng dần Trả về thứ hạng của một số trong danh sách Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Thông số thống kê (3/4) 8 Thông số Hàm Excel Giải thích Độ bất đối xứng SKEW(number1, number2,...) Độ bất đối xứng được tính bằng cách lấy moment thứ ba của trị trung bình chia cho độ lệch chuẩn luỹ thừa ba Độ nhọn KURT(number1, number2,...) Độ nhọn được tính bằng cách lấy moment thứ tư của trị trung bình chia cho độ lệch chuẩn luỹ thừa bốn Tìm giá trị nhỏ thứ k trong mẫu SMALL(array, k) SMALL(array, 1) → Số Min SMALL(array, n) → Số Max Hàm trả về lượng biến nhỏ thứ k trong mẫu có n lượng biến Tìm giá trị lớn thứ k trong mẫu LARGE(array, k) LARGE(array, 1) → Số Max LARGE(array, n) → Số Min Hàm trả về lượng biến lớn thứ k trong mẫu có n lượng biến Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Thông số thống kê (4/4) 9 Thông số Hàm Excel Giải thích Tần số xuất hiện của các giá trị trong mẫu FREQUENCY(data_array, bins_array) Data_array : tập số liệu Bins_array : các nhóm trong tập số liệu Trả về tần số xuất hiện các biến cố trong các khoảng cho trước Nhóm theo phần trăm PERCENTILE(array, k) array : tập số liệu k : nhóm phần trăm (0..1) Trả về nhóm tính theo phần trăm của giá trị trong tập số liệu Xếp hạng theo phần trăm PERCENTRANK(array, x, significance) array : tập số liệu x : giá trị cần biết hạng significance : số lẻ cần thiết Trả về hạng của một giá trị trong tập số liệu theo phần trăm trong tập số liệu Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Descriptive Statistics 10 Vùng địa chỉ dữ liệu cần thống kê Dữ liệu theo hàng hay cột Vùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Phải chọn ít nhất 1 trong 4 mục này Độ tin cậy của giá trị trung bình Bấm OK để thực hiện tính toán Trị quan sát lớn/nhỏ thứ k Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 11 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 12 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Bảng tần suất Histogram 13 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Histogram 14 • Mô tả số lần xuất hiện của một mẫu thông tin trong một tập dữ liệu • Mỗi mẫu thông tin gọi là bin, mỗi lần số bin lặp lại được hiểu là tần suất xuất hiện của nó Vùng địa chỉ dữ liệu cần thống kê Vùng địa chỉ các bin Vùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Tính phần trăm tích luỹ Thêm một bảng kết quả trong đó, kết quả phần trăm tích luỹ sẽ được sắp xếp giảm dần Bấm OK để thực hiện tính toán Thêm đồ thị tần suất Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 15 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 16 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Xếp hạng và phần trăm theo nhóm Rank and Percentile 17 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Rank and Percentile 18 Vùng địa chỉ dữ liệu cần thống kê Vùng địa chỉ dữ liệu được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Bấm OK để thực hiện tính toán Dữ liệu theo hàng hay cột Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 19 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Phân tích dữ liệu thống kê Ví dụ 20 Wednesday, May 8, 13 Lê Viết Mẫn - lvman@hce.edu.vn Cảm ơn sự chú ý Câu hỏi ? Phân tích dữ liệu thống kê21 Wednesday, May 8, 13
File đính kèm:
- bai_giang_tin_hoc_ung_dung_nang_cao_chuong_9_phan_tich_du_li.pdf