Ứng dụng phương pháp kiểm định giả thuyết thống kê trong đánh giá kết quả đào tạo sinh viên trường Đại học Quảng Nam
Tóm tắt: Điểm số tuyển sinh đầu vào và điểm số kết quả quá trình đào tạo là một
khía cạnh để đánh giá chất lượng giáo dục tại các cơ sở giáo dục đại học. Khi dữ liệu
này được sưu tập đầy đủ và tin cậy là cơ sở để đưa ra những kết luận về chất lượng
đào tạo có ý nghĩa về mặt thống kê. Ngoài ra bài báo nghiên cứu khoa học này trình
bày một cách có hệ thống tất cả các loại kiểm định giả thuyết tương ứng với những
nhận định đó.
Bạn đang xem tài liệu "Ứng dụng phương pháp kiểm định giả thuyết thống kê trong đánh giá kết quả đào tạo sinh viên trường Đại học Quảng Nam", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Ứng dụng phương pháp kiểm định giả thuyết thống kê trong đánh giá kết quả đào tạo sinh viên trường Đại học Quảng Nam
1 ỨNG DỤNG PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ TRONG ĐÁNH GIÁ KẾT QUẢ ĐÀO TẠO SINH VIÊN TRƯỜNG ĐẠI HỌC QUẢNG NAM Lê Phước Thành1 Tóm tắt: Điểm số tuyển sinh đầu vào và điểm số kết quả quá trình đào tạo là một khía cạnh để đánh giá chất lượng giáo dục tại các cơ sở giáo dục đại học. Khi dữ liệu này được sưu tập đầy đủ và tin cậy là cơ sở để đưa ra những kết luận về chất lượng đào tạo có ý nghĩa về mặt thống kê. Ngoài ra bài báo nghiên cứu khoa học này trình bày một cách có hệ thống tất cả các loại kiểm định giả thuyết tương ứng với những nhận định đó. Từ khóa: Thống kê mô tả, Thống kê suy diễn, Kiểm định giả thuyết, Ý nghĩa thống kê. 1 . Mở đầu Từ năm 2002, Bộ GD&ĐT đã triển khai thi theo phương thức “3 chung” vào đại học trên cả nước, đó là chung đề thi, ngày thi và dùng chung kết quả xét tuyển. Tiếp theo là những cải tiến về gộp kỳ thi tốt nghiệp với kỳ thi đại học, xây dựng mức điểm sàn và những phương thức xét tuyển theo sự phát triển của kỹ thuật công nghệ. Với những đột phá đó, Bộ GD&ĐT đã giảm tải khá nhiều về áp lực kỳ thi (nhất là về mặt chi phí) và hướng đến xây dựng một bằng chất lượng chung cho cả nước. Với kỹ thuật cơ sở dữ liệu dùng chung kết quả tuyển sinh (điểm đầu vào) này các trường đại học dễ dàng kết nối với dữ liệu kết quả đào tạo (điểm đầu ra) để có những phân tích, đánh giá sâu hơn toàn bộ khóa đào tạo. Chất lượng đào tạo là một khái niệm đa chiều, nó được nhìn nhận ở các góc độ khác nhau. Chất lượng được đánh giá bằng “đầu vào” hoặc “đầu ra”, “chất lượng được đánh giá bằng giá trị gia tăng”, “sự hài lòng của các bên liên quan” [4]. Dưới góc độ đo lường năng lực sinh viên ra trường, chất lượng đào tạo của một cơ sở giáo dục bao gồm mức độ đạt được các chuẩn đầu ra của chương trình đào tạo (kiến thức, kỹ năng và thái độ). Các kết quả này được đánh giá bằng điểm số. Bằng cảm tính các bên liên quan thường đưa ra những nhận định chủ quan về kết quả đào tạo của nhà trường, chẳng hạn: (i) kết quả đầu vào thấp thì kết quả đầu ra của nhà 1 . ThS. Phòng Khảo thí và Đảm bảo chất lượng, trường Đại học Quảng Nam LÊ PHƯỚC THÀNH 2 trường sẽ thấp, (ii) chất lượng đầu ra của khối ngành sư phạm sẽ cao hơn khối ngành ngoài sư phạm vì chất lượng đầu vào cao hơn, Những nhận định này chỉ là võ đoán chưa được kiểm định. Đánh giá chất lượng đào tạo hiện nay, theo truyền thống vẫn sử dụng các phương pháp như thống kê mô tả, phân phối chuẩn, tần suất, trình bày dữ liệu bằng bảng, biểu đồ dựa trên các số liệu tổng hợp này để đưa ra những nhận định về kết quả đào tạo. Tuy nhiên, đối với một nhận định cần phải kiểm định bằng một phương pháp thống kê cụ thể trên tập dữ liệu sưu tập được để đảm bảo độ tin cậy của nhận định. Xuất phát từ những yêu cầu trên, bài báo này áp dụng những phương pháp kiểm định giả thuyết trên tập dữ liệu đã sưu tập được để công nhận hoặc bác bỏ những nhận định thường có ở những cơ sở giáo dục đại học. Tập dữ liệu dùng trong bài báo này là tập dữ liệu hoàn toàn trung thực được sưu tập tại một trường đại học ở miền Trung của khóa đào tạo đại học 4 năm 2013-2017. 2. Nội dung 2.1. Bài toán kiểm định giả thuyết 2.1.1. Giới thiệu Trong lĩnh vực kinh tế-xã hội, giáo dục có những bài toán đặt ra yêu cầu kiểm tra tính đúng sai của một nhận định khi chỉ dựa vào một ít số liệu cảm nhận được. Khi đó phải thực hiện việc kiểm định dựa trên thông tin có từ một mẫu, bằng những phương pháp thống kê cụ thể. Kiểm định giả thuyết là quá trình dựa vào các thông tin của mẫu để đưa ra kết luận là bác bỏ hay chấp nhận giả thuyết của tổng thể [3]. 2.1.2. Giả thuyết thống kê Dựa vào kết quả thống kê trên mẫu, người quan sát luôn đưa ra một nhận định cho tổng thể. Để kiểm định giả thuyết này, ta nên bắt đầu từ một giả sử trái với nhận định (trái với điều chúng ta mong muốn, ta cần sưu tập nhiều bằng chứng để cố gắng bác bỏ giả thuyết), điều giả sử này gọi là giả thuyết không H0( Null Hypothesis) cho là đúng lúc ban đầu. Giả thuyết đối H1(Alternative Hypothesis) nhận giá trị đúng khi bác bỏ giả thuyết H0 (H0 sai) và nhận giá trị sai khi chấp nhận giả thuyết H0 (H0 đúng) [2] , [3]. 2.1.3. Các loại sai lầm LÊ PHƯỚC THÀNH 3 Không phải bất cứ việc kiểm định giả thuyết nào là hoàn toàn đúng với thực tế, ta gọi đây là các loại sai lầm. Sai lầm loại 1 (loại α) là sai lầm khi bác bỏ giả thuyết H0, trong khi đó trình trạng thực tế là đúng. Sai lầm loại 2 (loại β) là sai lầm khi công nhận giả thuyết H0, trong khi đó trình trạng thực tế là sai. LÊ PHƯỚC THÀNH 4 Bảng 1. Các loại sai lầm trong kiểm định giả thuyết Thực tế Giả thuyết H0 đúng Giả thuyết H0 sai Chấp nhận giả thuyết H0 Quyết định đúng Sai lầm loại 2 (loại β) Bác bỏ giả thuyết H0 Sai lầm loại 1 (loại α) Quyết định đúng 2.1.4. Miền bác bỏ và miền chấp nhận Miền chấp nhận là miền chứa các giá trị thống kê mà tại đó giả thuyết H0 được chấp nhận. (Miền chưa đủ các chứng cứ để bác bỏ giả thuyết) Miền bác bỏ là miền chứa các giá trị thống kê mà tại đó giả thuyết H0 bị bác bỏ. Khi thu thập chứng cứ đến một điểm tới hạn nào đó thì chuyển sang miền bác bỏ-Miền có đủ (hoặc nhiều hơn) chứng cứ để bác bỏ giả thuyết [3]. 2.1.5. Mức ý nghĩa αvà giá trị P Giả thuyết là một tuyên bố về số liệu thực nghiệm và sự khác biệt có thể xuất hiện trong tổng thể. Theo quy tắc chung, mức ý nghĩa (hay alpha) thường được chọn ở mức 0,05, nghĩa là khả năng kết quả quan sát sự khác biệt được nhìn thấy trên số liệu là ngẫu nhiên chỉ là 5% (hay là xác suất tối đa cho phép giả thuyết H0 bị bác bỏ, nếu có điều kiện chọn 100 mẫu thì sẽ có 5 mẫu phạm phải sai lầm loại 1) Trong khi đó giá trị P (P-Value) (phần mềm gọi là giá trị sig) là xác suất phạm phải sai lầm loại 1 với thông tin từ tập mẫu tính toán được. Nhận thấy rằng khi xác suất càng cao thì hậu quả khi bác bỏ giả thuyết H0 càng lớn (và ngược lại). Quy tắc chung để công nhận hay bác bỏ giả thuyết H0 như sau: Nếu sig>α thì chấp nhận giả thuyết H0 Nếu sig≤α thì bác bỏ giả thuyết H0 [4] 2.2 . Kiểm định các giả thuyết Để thực hiện các phương pháp kiểm định giả thuyết, tập dữ liệu được sưu tập từ khóa tuyển sinh đại học năm 2013 và tốt nghiệp năm 2017 tại trường đại học Quảng Nam gồm 12 ngành đào tạo và 2 khối ngành sư phạm và ngoài sư phạm. Tập dữ liệu kết quả đầu vào được lấy theo kỳ thi tuyển sinh đại học của Bộ Giáo dục và Đào tạo năm 2013 gồm điểm 3 môn thi và các thông tin khác như đối tượng, LÊ PHƯỚC THÀNH 5 khu vực ưu tiên, khối ngành, ngành trúng tuyển... Điểm đầu vào được tính theo trung bình chung của 3 môn thi và xếp loại kết quả đầu vào theo điểm trung bình chung này theo các mức “Xuất sắc”, “Giỏi”, “Khá”, “Trung bình”, Tập dữ liệu kết quả đầu ra được lấy theo điểm trung bình kết quả học tập qua các năm, điểm kết quả học tập toàn khóa (tính theo thang điểm 10) và xếp loại tốt nghiệp. Số lượng sinh viên có đủ kết quả đầu vào và đầu ra là 589 trên 720 sinh viên tốt nghiệp khóa 2013-2017. Kích cỡ mẫu - Công thức tính kích thước mẫu, với độ tin cậy 95%, kích thước mẫu cần thiết là : N n = 2 , với N: số lượng tổng thể, e: Mức ý nghĩa 1-95% 1+ N(e) n = = 257 N=720 số lượng sinh viên tốt nghiệp khóa đào tạo 2013-2017 Kích thước mẫu tính được là 257, cộng với chi phí thất thoát 20% của mẫu là 144. Kích thước mẫu cần đạt là 401 sinh viên. Số sinh viên chọn làm mẫu là 589, nên việc phân tích hoàn toàn có ý nghĩa thống kê. 2.2.1. Kiểm định giả thuyết về giá trị trung bình của hai mẫu phụ thuộc/ phối hợp từng cặp (Paired-Sample T-TEST) Vấn đề: “Có hay không sự khác nhau về chất lượng đào tạo trước (điểm trung bình trúng tuyển) và sau khóa đào tạo (điểm trung bình toàn khóa học)” Giả thuyết H0: “Không có sự khác biệt về giá trị trung bình trước và sau đào tạo” LÊ PHƯỚC THÀNH 6 Điểm trung bình: 5.62 Độ lệch chuẩn: 0.716 N=589 Điểm trung bình: 7.73 Độ lệch chuẩn: 0.466 N=589 Hình 1. Biểu đồ phân bố điểm trung bình đầu vào và đầu ra Bảng 2. Kết quả kiểm định giá trị trung bình của 2 mẫu phụ thuộc Paired Samples Test Paired Differences t df Sig. ))2- tailed Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 TBC_DauVao - TBC_DauRa - 2.10856 .70589 .02909 - 2.16568 - 2.05143 - 72.494 588 .000 Kết quả sig=0.00<0.05, bác bỏ giả thuyết H0 Kết luận: “Có sự khác biệt về điểm trung bình trước và sau đào tạo, điểm trung bình sau đào tạo lớn hơn trước đào tạo (điểm trung bình đầu ra cao hơn so với đầu vào)” ĐẦU VÀO ĐẦU RA LÊ PHƯỚC THÀNH 7 2.2.2. Kiểm định giả thuyết về giá trị trung bình của hai mẫu độc lập (IndependentSample T-TEST) Vấn đề : “Có hay không sự khác nhau về giá trị trung bình của khối ngành sư phạm và ngoài sư phạm về chất lượng đầu vào (tính theo điểm trung bình tuyển sinh)” Giả thuyết H0: “Không có sự khác nhau về điểm trung bình đầu vào và đầu ra Điểm trung bình: 5.94 Độ lệch chuẩn: 0.645 N=328 Điểm trung bình: 5.22 Độ lệch chuẩn: 0.589 N=261 Hình 2. Biểu đồ Phân bố điểm trung bình đầu vào giữa 2 khối ngành Bảng 3. Kết quả kiểm định giá trị trung bình của 2 mẫu độc lập Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means F .Sig t df Sig. ))2- tailed Mean Difference Std. Error Difference Confidence 95 % Interval of the Difference giữa 2 khối ngành sư phạm và ngoài sư phạm” KHỐI NGOÀI SƯ PHẠM KHỐI SƯ PHẠM LÊ PHƯỚC THÀNH 8 Lower Upper TBC_ DauVao Equal variances assumed 1.635 .201 13.961 587 .000 .71905 .05150 .61790 .82020 Equal variances not assumed 14.105 575.821 .000 .71905 .05098 .61892 .81918 Kiểm định bằng nhau của phương sai (Levene's Test for Equality of Variances): Sig=0.201>0.05, phương sai giữa 2 khối sư phạm và ngoài sư phạm không khác nhau. Kiểm định giá trị trung bình giữa 2 khối sư phạm và ngoài sư phạm Sig=0.00<0.05, bác bỏ giả thuyết H0 Kết luận: “Giá trị điểm trung bình đầu vào giữa 2 khối sư phạm và ngoài sư phạm là khác nhau, điểm trung bình đầu vào khối sư phạm cao hơn khối ngoài sư phạm” Tương tự kiểm định cho vấn đề: “Có hay không sự khác nhau về giá trị trung bình của khối ngành sư phạm và ngoài sư phạm về chất lượng đầu ra (tính theo điểm trung bình toàn khóa học)” 2.2.3. Phân tích mối liên hệ giữa biến nguyên nhân định tính và biến kết quả định lượng (Phân tích phương sai 1 yếu tố-ANOVA TEST) Vấn đề: “Có hay không sự khác biệt điểm trung bình đầu ra giữa các nhóm khu vực: 1, 2, 2NT, 3” Giả thuyết H0: “Không có sự khác biệt điểm trung bình đầu ra giữa các nhóm khu vực” Bước 1. Thiết lập bảng tính giá trị trung bình giữa các nhóm Bảng 4. Các đại lượng thống kê mô tả Descriptives DiemTBTK_10 LÊ PHƯỚC THÀNH 9 N Mean Std. Deviation Std. Error 95 % Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound KV1 137 7.6350 .43629 .03727 7.5613 7.7087 6.43 8.64 KV2 138 7.7862 .48462 .04125 7.7046 7.8677 6.23 8.91 2NT 312 7.7407 .46331 .02623 7.6891 7.7923 6.29 9.14 Total 587 7.7267 .46465 .01918 7.6890 7.7644 6.23 9.14 Bước 2. Kiểm định phương sai giữa các nhóm ( Levene test ) Giả thuyết H0 về phương sai: “Phương sai giữa các nhóm bằng nhau” Bảng 5. Kiểm định sự bằng nhau của phương sai Test of Homogeneity of Varian ces TBC_DauRa Levene Statistic df1 df2 .Sig 1.472 3 585 221. Giá trị sig=0.221>0.05. Kết luận, công nhận giả thuyết H0: “Phương sai giữa các nhóm bằng nhau” Bước 3. Kiểm định ANOVA Giả thuyết H0: “Giá trị trung bình giữa các nhóm là như nhau” Bảng 6. Kiểm định ANOVA ANOVA DiemTBTK_10 LÊ PHƯỚC THÀNH 10 Sum of Squares df Mean Square F Sig. Between Groups 1.700 2 .850 3.977 .019 Within Groups 124.819 584 .214 Total 126.519 586 Kết quả sig=0.019<0.05, Bác bỏ giả thuyết H0 Kết luận: “Giá trị trung bình điểm đầu ra giữa các nhóm khu vực là khác nhau” Phân tích sâu sự khác biệt về giá trị trung bình giữa các nhóm Bảng 7. Phân tích sự khác biệt giữa các nhóm Multiple Comparisons Dependent Variable: DiemTBTK_10, LSD )I) KhuVuc_2 )J) KhuVuc_2 Mean Difference )I-J) Std. Error Sig. 95 % Confidence Interval Lower Bound Upper Bound KV1 KV2 -.15112* .05576 .007 -.2606 -.0416 2NT -.10564* .04738 .026 -.1987 -.0126 KV2 KV1 .15112* .05576 .007 .0416 .2606 2NT .04549 .04726 .336 -.0473 .1383 2 NT KV1 .10564* .04738 .026 .0126 .1987 KV2 -.04549 .04726 .336 -.1383 .0473 *. The mean difference is significant at the 0.05 level. Kết luận: “Có sự khác biệt điểm trung bình đầu ra giữa Khu vực 1 với khu vực 2, 2NT (sig=0.007 và sig=0.026 đều nhỏ hơn 0.05). Không có sự khác biệt giữa điểm trung bình đầu ra giữa khu vực 2 với 2NT (sig=0.336 lớn hơn 0.05)” Tương tự kiểm định cho vấn đề: “Có hay không sự khác biệt điểm trung bình đầu vào giữa các nhóm khu vực: 1, 2, 2NT, 3” 2.2.4. Kiểm định mối liên hệ giữa hai biến định tính/ Kiểm định chi bình phương (Chi-Square Test) LÊ PHƯỚC THÀNH 11 Vấn đề: “Có hay không sự khác nhau về kết quả xếp loại học tập đầu ra (Xuất sắc, Giỏi, Khá, Trung bình, ) giữa hai khối ngành sư phạm và ngoài sư phạm” Giả thuyết H0: “Không có mối liên hệ nào giữa kết quả xếp loại học tập đầu ra giữa hai khối ngành sư phạm và ngoài sư phạm” Bảng 8. Mối quan hệ giữa xếp loại đầu ra của 2 khối sư phạm và ngoài sư phạm Khối ngành Xuất Sắc Giỏi Khá Trung bình Total N N% N N% N N% N N% N N% Sư phạm 7 41.2% 108 64.7% 206 54.9% 7 23.3% 328 55.7 % Ngoài sư phạm 10 58.8% 59 35.3% 169 45.1% 23 76.7% 261 44.3 % Total 17 100.0% 167 100.0% 375 100.0% 30 100.0% 589 100.0 % Hình 3. Biểu đồ xếp loại học tập giữa 2 khối ngành Kiểm định Pearson Chi-Square ta được sig=0.00<0.05, bác bỏ giả thuyết H0 Kết luận: “Kết quả xếp loại học tập đầu ra của sinh viên có mối liên hệ với khối ngành đào tạo, sư phạm và ngoài sư phạm. Sinh viên khối ngành ngoài sư phạm xếp LÊ PHƯỚC THÀNH 12 loại xuất sắc và trung bình chiếm tỷ lệ nhiều hơn sinh viên khối ngành sư phạm và xếp loại giỏi, khá chiếm tỷ lệ ít hơn”. Tương tự kiểm định cho vấn đề: “Có hay không sự khác nhau về kết quả xếp loại điểm đầu vào (Xuất sắc, Giỏi, Khá, Trung bình, ) giữa hai khối ngành sư phạm và ngoài sư phạm” 3 . Kết luận Hiện nay các phương pháp phân tích thống kê đã ứng dụng rất nhiều trong việc đánh giá chất lượng đào tạo tại các cơ sở giáo dục, như thống kê mô tả, phân phối chuẩn, trình bày dữ liệu, Tuy nhiên thống kê suy diễn mà cụ thể là phương pháp kiểm định giả thuyết chưa được các nhà nghiên cứu quan tâm nhiều. Chất lượng giáo dục, theo truyền thống, vẫn được đánh giá thông qua điểm số. Nhiều giảng viên và các nhà quản lý thường đưa ra những nhận định mang tính võ đoán, chưa được kiểm định bằng một phương pháp khoa học rõ ràng trên toàn bộ dữ liệu. Vì vậy bài báo nghiên cứu khoa học này trình bày một cách có hệ thống các loại kiểm định giả thuyết tương ứng với những nhận định thường gặp tại các cơ sở giáo dục đại học. “Dữ liệu là thông tin”, hiện nay việc tuyển sinh và quản lý kết quả đào tạo đã có một hệ thống cơ sở dữ liệu đầy đủ và được chuẩn hóa, tạo điều kiện cho các nhà phân tích dữ liệu đưa ra những nhận định ở nhiều góc độ về chất lượng đào tạo thông qua các phương pháp phân tích dữ liệu bằng thống kê. Với cơ sở dữ liệu đó, có thể tiến đến việc ứng dụng trí tuệ nhân tạo (hạt nhân của cách mạng công nghiệp lần thứ 4.0) để tìm ra những quy luật (bản chất) của quá trình đào tạo. Bài báo đã trình bày rất cụ thể về phương pháp kiểm định giả thuyết với một bộ dữ liệu của khóa đào tạo đại học 4 năm 2013-2017. Một khi phương pháp hoặc quy trình đã được kiểm nghiệm nên lập báo cáo kết quả này một cách định kỳ hằng năm theo mỗi khóa đào tạo. Như vậy, bên cạnh phương pháp lập báo cáo tổng kết đánh giá chất lượng đào tạo hằng năm theo truyền thống, trường Đại học Quảng Nam nên đưa ra các phương pháp kiểm định giả thuyết này để những nhận định có độ tin cậy cao hay có ý nghĩa về mặt thống kê. Kết quả kiểm định là những thông tin bổ ích để giảng viên, cán bộ quản lý đưa ra những chiến lược đào tạo phù hợp nhằm nâng cao chất lượng đào tạo của nhà trường. TÀI LIỆU THAM KHẢO [1] Bộ GD&ĐT-Dự án Việt-Bỉ (2009), Tài liệu Nghiên cứu khoa học sư phạm ứng dụng, Nhà xuất bản đại học sư phạm. [2] Dương Thiệu Tống (200), Thống kê ứng dụng trong nghiên cứu khoa học giáo dục, Nhà xuất bản đại học Quốc gia Hà Nội. LÊ PHƯỚC THÀNH 13 [3] Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2005), Phân tích dữ liệu nghiên cứu với SPSS, Nhà xuất bản Thống kê. [4] Lê Đức Ngọc (2011), Tài liệu bồi dưỡng nghiệp vụ sư phạm đại học Title: APPLICATION OF STATISTICAL HYPOTHESIS TESTING METHODS IN EVALUATING THE STUDENT’S TRAINING RESULTS IN QUANG NAM UNIVERSITY LE PHUOC THANH Quang Nam University Abstract: University entrance exam scores and academic achievement results are aspects for assessing the quality of higher education institutions. Once this data has been collected fully and reliably, it is the basis for drawing conclusions in evaluating the training quality to have statistical significance. In addition, this scientific paper is presented in a systematic manner all types of hypothesis testing corresponding to those statements. Keywords: Descriptive statistics, Inferential statistics, Hypothesis testing, statistical significance. LÊ PHƯỚC THÀNH 14
File đính kèm:
- ung_dung_phuong_phap_kiem_dinh_gia_thuyet_thong_ke_trong_dan.pdf