Tài liệu Giảng dạy môn Kỹ thuật máy tính - Phần mềm Epidata
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta
thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm.
Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập
xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu).
1. Phần mềm Epidata là gì?
EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens
M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một
nghiên cứu dịch tễ học “Phòng chống tai nạn”.
2. Đặc điểm của phần mềm Epidata
Trước khi EpiData ra đời, đã có những phần mềm được sử dụng để nhập liệu và thực
hiện các công việc thống kê số liệu như EpiInfo (do Tổ chức Y tế Thế giới xây dựng)
và những sản phẩm thương mại có sẵn khác. Tuy nhiên, những phần mềm đó không có
nhiều ưu điểm như phần mềm Epidata. Phần mềm Epidata đơn giản, dễ sử dụng, có
khả năng kiểm tra và hạn chế lỗi số liệu, đặc biệt là khả năng hỗ trợ tạo ra công cụ
nhập liệu nhanh hơn nhiều so với các phần mềm khác.
Ý tưởng của người phát triển phần mềm EpiData là việc tạo ra một phần mềm nhập
liệu miễn phí, giao diện người dùng thân thiện, dễ sử dụng. Với Epidata, người sử
dụng có thể nhập số liệu dưới dạng văn bản đơn giản và sau đó chuyển đổi số liệu
sang các dạng khác nhau để phục vụ cho việc phân tích thống kê số liệu bằng các
phần mềm khác nhau. Phần mềm Epidata có những đặc điểm sau:
Epidata được phát triển nhằm phục vụ cho mục đích nghiên cứu và học tập, hỗ
trợ cho quy trình quản trị số liệu.
Epidata có giao diện người dùng thân thiện và tạo ra tiến trình làm việc đơn
giản. Những người sử dụng có trình độ Tin học khác nhau đều có thể dễ dàng
học tập và sử dụng được phần mềm này trong một thời gian rất ngắn.
Tóm tắt nội dung tài liệu: Tài liệu Giảng dạy môn Kỹ thuật máy tính - Phần mềm Epidata
TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG BỘ MÔN TIN HỌC – THỐNG KÊ TÀI LIỆU GIẢNG DẠY MÔN KỸ THUẬT MÁY TÍNH PHẦN MỀM EPIDATA HÀ NỘI, NĂM 2006 [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 2 OOOOOOOOOOOOOOOOOOOOOOOOOOOOO CHỦ BIÊN Kỹ sư Phạm Việt Cường NHÓM BIÊN SOẠN Cử nhân Mạc Văn Huy Cử nhân Chử Việt Anh Cử nhân Trương Đức Tùng THƯ KÝ BIÊN SOẠN Cử nhân Mạc Văn Huy OOOOOOOOOOOOOOOOOOOOOOOOOOOOO [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 3 MỤC LỤC BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU .......................... 6 1. Phần mềm Epidata là gì? ........................................................................................ 6 2. Đặc điểm của phần mềm Epidata ........................................................................... 6 3. Tiến trình thu thập và xử lý số liệu ....................................................................... 7 4. Chu trình của số liệu ............................................................................................... 8 5. Kiểu dữ liệu .......................................................................................................... 10 BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA .................................................. 16 1. Cài đặt Epidata ..................................................................................................... 16 1.1 Tải tệp chương trình cài đặt ............................................................................. 16 1.2 Cài đặt chương trình ........................................................................................ 20 2. Khởi động chương trình ....................................................................................... 25 3. Thiết lập tùy chọn chương trình .......................................................................... 29 4. Tệp liên đới ........................................................................................................... 37 BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU ............................ 40 1. Khai báo bộ câu hỏi .............................................................................................. 40 2. Hạn chế lỗi số liệu ................................................................................................ 52 2.1 Lỗi số liệu ........................................................................................................ 52 2.2 Phát hiện lỗi dữ liệu ......................................................................................... 53 2.3 Kiểm tra lỗi dữ liệu ......................................................................................... 54 3. Thiết lập ràng buộc số liệu với phần mềm Epidata .............................................. 55 4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE .......................................... 64 BÀI 4: NHẬP DỮ LIỆU ............................................................................................. 71 1. Nhập số liệu .......................................................................................................... 71 2. Xem dữ liệu .......................................................................................................... 77 3. Xem cấu trúc tệp REC .......................................................................................... 77 [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 4 4. Liệt kê số liệu ....................................................................................................... 78 5. Xem mô tả số liệu ................................................................................................. 79 BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU ...................................... 82 1. Ghép tệp số liệu .................................................................................................... 82 2. Xuất nhập tệp số liệu ............................................................................................ 87 2.1 Xuất tệp số liệu ................................................................................................ 87 2.2 Nhập tệp số liệu ............................................................................................... 88 BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH ...................................................................... 90 1. Sửa tên trường ...................................................................................................... 90 2. Sao chép cấu trúc tệp REC ................................................................................... 91 3. Đếm bản ghi theo trường dữ liệu .......................................................................... 93 4. So sánh hai tệp dữ liệu .......................................................................................... 95 5. Đóng gói tệp số liệu .............................................................................................. 96 6. Tạo tệp QES từ tệp REC ...................................................................................... 97 BÀI TẬP TỔNG KẾT ................................................................................................. 98 [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 5 LỜI GIỚI THIỆU Tài liệu này được viết bởi các cán bộ Bộ môn Tin học – Thống kê, Trường Đại học Y tế công cộng, được sử dụng làm giáo trình phục vụ cho giảng dạy và là tài liệu tham khảo cho sinh viên và học viên Y tế công cộng và các đối tượng tự học khác. Tài liệu cung cấp cho người học những kiến thức, kỹ thuật làm việc với số liệu sử dụng phần mềm Epidata. Nội dung tài liệu được chia làm 6 bài học, lần lượt cung cấp cho người học những kiến thức, kỹ thuật liên quan đến các bước trong tiến trình thu thập và xử lý số liệu trong gian đoạn trước phân tích thống kê số liệu. Tài liệu cũng cung cấp cho người học một cách tiếp cận đơn giản với các khái niệm về số liệu và hướng dẫn người học sử dụng phần mềm Epidata trong thu thập và xử lý số liệu. Tài liệu này cũng giúp người học hình dung được họ phải làm gì và làm như thế nào để có một bộ số liệu phục vụ cho thống kê phân tích số liệu. Tài liệu này được xây dựng lần đầu tiên nên khó tránh khỏi những thiếu sót. Chúng tôi mong muốn các học viên, giảng viên cũng như bạn đọc sẽ đưa ra các ý kiến đóng góp quý báu để tài liệu ngày càng hoàn thiện và phục vụ người đọc tốt hơn. Hà Nội, tháng 11 năm 2006 [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 6 BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm. Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu). 1. Phần mềm Epidata là gì? EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một nghiên cứu dịch tễ học “Phòng chống tai nạn”. 2. Đặc điểm của phần mềm Epidata Trước khi EpiData ra đời, đã có những phần mềm được sử dụng để nhập liệu và thực hiện các công việc thống kê số liệu như EpiInfo (do Tổ chức Y tế Thế giới xây dựng) và những sản phẩm thương mại có sẵn khác. Tuy nhiên, những phần mềm đó không có nhiều ưu điểm như phần mềm Epidata. Phần mềm Epidata đơn giản, dễ sử dụng, có khả năng kiểm tra và hạn chế lỗi số liệu, đặc biệt là khả năng hỗ trợ tạo ra công cụ nhập liệu nhanh hơn nhiều so với các phần mềm khác. Ý tưởng của người phát triển phần mềm EpiData là việc tạo ra một phần mềm nhập liệu miễn phí, giao diện người dùng thân thiện, dễ sử dụng. Với Epidata, người sử dụng có thể nhập số liệu dưới dạng văn bản đơn giản và sau đó chuyển đổi số liệu sang các dạng khác nhau để phục vụ cho việc phân tích thống kê số liệu bằng các phần mềm khác nhau. Phần mềm Epidata có những đặc điểm sau: Epidata được phát triển nhằm phục vụ cho mục đích nghiên cứu và học tập, hỗ trợ cho quy trình quản trị số liệu. Epidata có giao diện người dùng thân thiện và tạo ra tiến trình làm việc đơn giản. Những người sử dụng có trình độ Tin học khác nhau đều có thể dễ dàng học tập và sử dụng được phần mềm này trong một thời gian rất ngắn. EpiData là sản phần hoàn toàn miễn phí, người sử dụng có thể tải chương trình cài đặt từ trang Web EpiData có thể chạy trên các máy tính cài đặt hệ điều hành Microsoft Windows hoặc Macintosh. [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 7 Epidata có thể xuất số liệu sang nhiều dạng khác nhau để sử dụng cho phân tích số liệu bằng các phần mềm như Stata, Spss, .v.v. Những ưu điểm của Epidata đã khiến cho phần mềm này được nhiều người sử dụng trên thế giới lựa chọn. Tuy nhiên, Epidata không có phiên bản hỗ trợ tiếng Việt, vì vậy, cộng đồng sử dụng tiếng Việt nên sử dụng tiếng Việt không dấu khi làm việc với Epidata. 3. Tiến trình thu thập và xử lý số liệu Tiến trình thu thập và xử lý số liệu gồm nhiều bước nối tiếp nhau. Đây là công việc rất tỷ mỉ. Chất lượng của số liệu có ảnh hưởng quyết định đến tính chính xác của kết quả phân tích số liệu. Các bước của tiến trình thu thập và xử lý số liệu như sau: 1. Điều tra viên phỏng vấn, thu thập số liệu. 2. Điều tra viên kiểm tra thông tin trên phiếu đã phỏng vấn để xác định lỗi và sửa lỗi. 3. Giám sát viên kiểm tra lại các phiếu đã phỏng vấn, chọn ra một số phiếu trong số các phiếu đã phỏng vấn và thực hiện phỏng vấn lại để kiếm tra đánh giá tính chính xác của những thông tin đã phỏng vấn. 4. Nhập liệu viên nhập số liệu vào máy tính. 5. Nhập liệu viên khác hoặc một nhóm nhập liệu viên khác nhập lại số liệu lần thứ 2. 6. So sánh số liệu hai lần nhập để tìm lỗi số liệu sinh ra do quá trình nhập liệu và sửa lỗi. 7. Kiểm tra ràng buộc số liệu. Tính ràng buộc của số liệu thể hiện những quy luật của thông tin. Số liệu không thỏa mản các ràng buộc thì số liệu đó là không chính xác. Ví dụ, thông tin về một sự kiện mang thai phải thuộc vào những cá nhân có giới tính là nữ. Tuy nhiên, trong cơ sở dữ liệu lại có những trường hợp cá nhân có giới tính là nam có thông tin về việc mang thai và sinh đẻ. Đây chính là những số liệu không thỏa mãn ràng buộc số [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 8 liệu. 8. Tạo các biến (biến số liệu còn gọi là trường số liệu) mới từ các biến có sẵn trong cơ sở dữ liệu (cơ sở dữ liệu là một tệp hoặc một tập hợp các tệp lưu trữ thông tin về số liệu và lưu trữ số liệu). Việc tạo ra biến mới thực chất là tạo ra các thông tin mới trong cơ sở dữ liệu từ những thông tin ban đầu. 9. Liên kết số liệu để tạo ra những bộ số liệu có đủ những biến mong muốn phục vụ cho mục đích phân tích tích thống kê số liệu. 10. Xuất tệp số liệu sang các dạng khác. Hiện nay có nhiều dạng tệp số liệu khác nhau như các dạng tệp số liệu của phần mềm Spss là dạng tệp .SAV, Stata là dạng tệp .DTA và Epi_info là dạng .REC, .v.v. Các phần mềm thường chỉ hiểu được dạng tệp mà nó tạo ra. Chẳng hạn, phần mềm Epi_info chỉ hiểu được tệp .REC, phần mềm Stata chỉ hiểu được tệp .DTA. Điều này có nghĩa là chỉ có thể chạy phân tích số liệu bằng phần mềm Epi_info với tệp .REC, phần mềm Stata với tệp .DTA. Chính vì vậy, khi số liệu được nhập vào tệp .REC với phần mềm Epidata chỉ sử dụng được cho phần mềm Epi_info. Để có thể phân tích số liệu với phần mềm Stata hay Spss cần chuyển tệp .REC thành tệp .DTA hoặc .SAV. Việc này gọi là xuất tệp số liệu sang các dạng khác nhau. 4. Chu trình của số liệu Số liệu được thu thập thông qua phỏng vấn, hoặc quan sát, hoặc đo đếm .v.v. trên các đối tượng nghiên cứu, sau đó được ghi lại trên một phiếu thu thập thông tin (phiếu thu thập thông tin còn được gọi là bộ câu hỏi). [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 9 Hình 1: Mô tả biến và bản ghi Số liệu được thu thập và được điền vào các mục (các câu hỏi) tương ứng trên bộ câu hỏi. Qua qúa trình nhập liệu, số liệu được lưu vào cơ sở dữ liệu dưới dạng các bản ghi. Mỗi bản ghi thường là một tập hợp các số liệu trên một bộ câu hỏi, được lưu liền kề nhau và được gắn kết lại với nhau thành một khối trong cơ sở dữ liệu. Hinh 2: Mô tả tệp số liệu Tệp số liệu Bản ghi 2 Bản ghi 3 Bản ghi 1 Mã số : . Họ và tên: Ngày sinh: Giới tính: Tình trạng hôn nhân: Biến 1 Nhóm biến Một bản ghi (1 case) Biến 2 Biến 3 Biến 4 Biến 5 [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 10 Các bản ghi số liệu của các bộ câu hỏi được xếp nối tiếp nhau trong cơ sở dữ liệu với cùng một cấu trúc. Cấu trúc đó cũng chính là cấu trúc dữ liệu. Ta có thể hình dung cầu trúc dữ liệu được sắp xếp giống như một bảng biểu gồm nhiều hàng nhiều cột, mỗi hàng là một bản ghi, mỗi cột là một trường số liệu (gọi là trường) hay còn gọi một biến số liệu (gọi là biến) và số liệu được lưu trong mỗi trường đều thuộc vào một dạng duy nhất nào đó đã được xác định trước. Ví dụ số liệu trong trường họ và tên là dạng số liệu văn bản và số liệu trong trường ngày sinh là số liệu dạng ngày tháng. Các quy định về cấu trúc số liệu cũng đảm bảo cho các tính toán trên số liệu cho ra kết quả chính xác. Hình 1 và 2 sau đây là minh họa cho liên quan giữa thông tin trên phiếu điều tra và các biến trong tệp số liệu, cấu trúc tệp số liệu. Bảng sau đây là ví dụ về số liệu trong một tệp số liệu có 4 trường (biến) và có 4 bản ghi. 5. Kiểu dữ liệu Tệp số liệu trong Epidata có cấu trúc gồm nhiều trường, trường có các thuộc tính là nhãn, kiểu và độ rộng. Nhãn biến là chú thích về biến, kiểu cho biết dạng số liệu (dạng ngày tháng, dạng số, dạng xâu chuỗi văn bản .v.v.) và độ rộng cho biết kích thước lớn nhất của số liệu mà biến có thể chứa được. Các dạng số liệu được thu thập ở các câu hỏi trên các bộ câu hỏi luôn thuộc vào một dạng số liệu nào đó. Vì vậy, khi xây dựng cơ sở dữ liệu để lưu trữ số liệu, người thực hiện công việc này cần nắm được các kiểu dữ liệu mà phần mềm hỗ trợ. bản ghi trường số liệu (biến) [Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 11 Hình 3: Kiểu dữ liệu trong Epidata Epidata hỗ trợ các kiểu dữ liệu gồm Numeric, ID Number, Text, Date, Boolean và Soundex. Những người sử dụng Epidata cần nắm được đặc điểm và cách sử dụng các kiểu dữ liệu này. 5.1.1. Kiểu ID number Kiểu ID number là kiểu dữ liệu số tự động và có các đặc điểm sau: Chuỗi định dạng là Một trường số liệu được khai báo kiểu ID number thì giá trị số liệu của trường sẽ được tự động nhập khi nhập số liệu. Người sử dụng không được nhập giá trị cho trường này. Kiểu ID number thường được sử dụng để khai báo cho trường khóa. Trường khóa là trường chứa số liệu định danh cho bản ghi ... . Khi hộp thoại Open xuất hiện cần chọn tệp dữ liệu REC và chọn Open. Hình 67: Xuất tệp số liệu sang định dạng của Spss Chọn các tham số tùy chọn và xuất tệp số liệu Khi tệp REC đã được mở, hộp thoại Export Data xuất hiện. Việc tiếp theo là chọn các tham số tùy chọn và nhấn OK để thực hiện xuất tệp số liệu. [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 88 Hình 68: Hộp thoại Export data Chú ý: Hộp thoại Export Data có các tham số có ý nghĩa như sau: All records: Xuất tất cả các bản ghi của tệp dữ liệu From record # to # : Chỉ xuất các bản ghi từ số # đến số # Select fields: cho phép chọn các trường dữ liệu sẽ xuất hiện ở tệp đầu ra (trường được tích trong danh sách sẽ xuất hiện trong tệp đầu ra) 2.2 Nhập tệp số liệu Nếu chức năng xuất tệp số liệu sinh ra tệp số liệu có định dạng khác từ một tệp REC thì chức năng nhập tệp số liệu của Epidata tạo ra tệp số liệu REC từ tệp số liệu Excel, dBase hoặc Stata. Để nhập tệp số liệu, chọn Import Data từ thực đơn Data in/out trên thanh thực đơn, sau đó chọn tệp số liệu đầu vào và chọn OK trên hộp thoại Import from Stata (dBase/Text). [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 89 Hình 69: Khởi động chức năng import tệp Stata Hình 70: Hộp thoại chọn tệp Chú ý: trên hộp thoại nhập tệp số liệu, có thể chọn nút để chọn tệp số liệu đầu vào, sau đó chỉ định tên tệp đầu ra (tệp REC) và nơi lưu tệp ở mục Import to. Câu hỏi lượng giá 1. Nêu các bước của kỹ thuật ghép các tệp số liệu. 2. Nêu ý nghĩa của hai phương thức ghép tệp số liệu Append và Merge. 3. Vì sao phải thực hiện chuyển định dạng tệp số liệu? 4. Các bước để thực hiện chuyển định dạng tệp số liệu với chức năng Xuất tệp dữ liệu của Epidata. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 90 BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH Bài học này hướng dẫn người học sử dụng các chức năng tiện ích của Epidata. Các chức năng này được phát triển dựa trên những yêu cầu thực tế của công việc quản trị số liệu, vì vậy, chúng làm cho Epidata trở thành một công cụ hiệu quả đối với người sử dụng. 1. Sửa tên trường Thực tế, khi tệp REC được tạo ra, số liệu đã được nhập vào thì người sử dụng lại muốn sửa lại tên biến (trường). Người sử dụng có thể sửa lại tên trường trong tệp QES và tạo lại tệp REC từ tệp QES. Tuy nhiên, số liệu đã nhập sẽ bị mất nếu ta làm theo cách này. Epidata có tính năng sửa tên trường (Rename fields) hỗ trợ đổi tên trường trực tiếp trên tệp REC, không làm mất số liệu đã nhập. Để sửa tên trường, ta chọn tools, chọn rename fields trên thanh thực đơn chương trình. Khi hộp thoại Open xuất hiện, ta chọn tệp REC và chọn Open, hộp thoại change field names sau đó được mở có hình ảnh như sau: Hình 71: Hộp thoại đổi tên trường Hộp thoại trên có ba cột Field name, Label và New field name. Cột Field name chứa tên hiện tại của các trường số liệu trong tệp REC, cột Label chứa nhãn biến và cột New field name cho phép nhập vào tên mới của các trường số liệu. Để sửa tên trường [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 91 nào, người sử dụng chỉ cần nhập tên mới của các biến vào cột New field name trên cùng dòng, tương ứng với tên biến cũ và sau đó chọn Save and close để ghi lại tên biến mới và đóng hộp thoại. 2. Sao chép cấu trúc tệp REC Chức năng sao chép cấu trúc tệp REC cho phép người sử dụng sao chép cấu trúc tệp REC, không bao gồm số liệu. Chức năng này giúp cho người sử dụng có thể sử dụng lại tệp REC để nhập số liệu mà không cần đến tệp QES. Các bước sao chép cấu trúc tệp REC gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và thực hiện copy. Khởi động chức năng Để khởi động chức năng, ta chọn tool, chọn Copy structure trên thanh thực đơn. Hình 72: Khởi động chức năng copy cấu trúc tệp số liệu Chọn tệp REC Epidata yêu cầu chọn tệp REC trên hộp thoại Select data file to copy sau khi chức năng này được khởi động. Tiếp theo, người sử dụng phải chọn tệp REC để hoàn thành bước này. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 92 Hình 73: Chọn tệp REC Đặt các tham số tùy chọn và thực hiện Copy Khi tệp REC được chọn, Epidata yêu cầu người sử dụng phải chọn các tham số tùy chọn trên hộp thoại Copy file structure. Hình 74: Đặt tham số tùy chọn với hộp thoại copy cấu trúc tệp REC Trong bước này, người sử dụng phải điền vào các tham số tùy chọn trên hộp thoại và nhấn nút OK để kết thúc. Các tham số tùy chọn trên hộp thoại gồm: New data file: tên tệp REC mới [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 93 Don’t copy text field : không copy trường kiểu text Copy check file: copy tệp CHK liên quan tệp REC 3. Đếm bản ghi theo trường dữ liệu Chức năng này đưa ra báo cáo về số lượng bản ghi theo các giá trị số liệu xuất hiện trong một trường số liệu nào đó, các bước thực hiện gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và kết thúc. Khởi động chức năng Để khởi động chức năng, ta chọn 5.Document, chọn Count Records trên thanh thực đơn. Hình 75: Khởi động chức năng đếm bản ghi Chọn tệp REC, các tham số tùy chọn và kết thúc Sau khi khởi động chức năng, Epidata mở hộp thoại Count record by field, yêu cầu người sử dụng chọn tệp REC, chọn biến sẽ được sử dụng. Cuối cùng người sử dụng phải chọn OK để kết thúc. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 94 Hình 76: Hộp thoại Count record by field Hình 77: Báo cáo kết quả đếm bản ghi theo trường SG1 Chú ý: Các tham số tùy chọn trên hộp thoại gồm: Enter filename: tên tệp REC Field to evaluate: tên trường sử dụng [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 95 4. So sánh hai tệp dữ liệu Chức năng này cho phép người sử dụng đưa ra báo cáo về các thông tin giống và khác nhau của số liệu trong hai tệp REC. Chẳng hạn, ta đem so sánh hai tệp thông tin điều tra cúm gia cầm được nhập ở bởi hai nhóm nhập liệu khác nhau là cumgiacam1.rec và cumgiacam2.rec, các bước thực hiện như sau: Khởi động chức năng Để khởi động chức năng, ta chọn 5.Document, chọn chọn Validate duplicate files. Chọn tệp REC Trên hộp thoại Validate files, ta chọn các tệp và chọn OK để chuyển sang bước tiếp theo. Hình 78: Hộp thoại chọn tệp Validate files Chọn các tham số tùy chọn và kết thúc Trong bước này, người sử dụng phải chọn các trường khóa (select key fields) và các tham số tùy chọn khác (option) như bỏ qua các bản ghi được đánh dấu xóa (ignore deleted records), trường kiểu Text (ignore text fields), .v.v. và nhấn OK để đưa ra báo cáo. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 96 Hình 79: Hộp thoại tùy chọn Validate files Hình 80: Kết quả so sánh số liệu 5. Đóng gói tệp số liệu [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 97 Chức năng đóng gói tệp số liệu tạo ra tệp REC mới từ một tệp REC ban đầu, trong đó, các bản ghi được đánh dấu xóa không được sao chép sang tệp mới. Để thực hiện đóng gói, ta chọn Tool và chọn Pack data file trên thanh thực đơn và chọn tệp REC trong hộp thoại Open. Khi nhấn nút Open để kết thúc bước chọn tệp REC, Epidata đưa ra thông báo hỏi người sử dụng xác nhận là xóa các bản ghi đã được đánh dấu xóa. Nếu đồng ý, người sử dụng nhấn OK để kết thúc và nhấn Cancel để hủy bỏ. 6. Tạo tệp QES từ tệp REC Chức năng này được sử dụng để sinh ra một tệp QES từ một tệp REC. Thực tế, người sử dụng có thể muốn sinh ra tệp REC có cấu trúc gần giống với tệp REC đang có, nhưng lại chưa có tệp QES. Để có thể tạo nhanh ra một tệp REC như vậy, người sử dụng có thể sử dụng chức năng này sinh ra tệp QES từ tệp REC, sửa lại nội dung tệp QES và sinh ra tệp REC mong muốn. Để sinh tệp QES từ tệp REC, ta chọn Tool trên thanh thực đơn, chọn QES file from REC file, chọn tệp REC trên hộp thoại Create QES file from data file và chọn OK để kết thúc. Câu hỏi lượng giá Hãy nêu tên các tiện ích được nhắc đến trong bài học và chức năng của các tiện ích đó. [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 98 BÀI TẬP TỔNG KẾT Giáo trình này đã trình bày những kiến thức và kỹ thuật cần thiết để làm việc với phần mềm Epidata. Để giúp cho người học củng cố lại những kiến thức và kỹ thuật trong nội dung giáo trình, chúng tôi đưa ra bài tập tổng kết này. Bộ câu hỏi được đưa ra dưới đây là một phần trong bộ câu hỏi “Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động và sự chấp nhận của xã hội với hút thuốc”. Yêu cầu đặt ra cho những người học là hãy sử dụng phẩn mềm Epidata để tạo ra công cụ nhập số liệu cho bộ câu hỏi của nghiên cứu này. Các kỹ thuật mà những người học cần thực hiện gồm: khai báo bộ câu hỏi, tạo tệp REC, thiết lập ràng buộc số liệu và nhập số liệu. /___________________________________________________________________/ Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động và sự chấp nhận của xã hội với hút thuốc (Bộ câu hỏi giành cho phụ nữ) Họ và tên:................................................................................................................ Họ tên điều tra viên:................................................................................................ Họ tên giám sát viên:.................................................................. ............................ Ngày phỏng vấn:......................................... ............................... ........................... Đồng ý tham gia phỏng vấn: 1. Có 2. Không Mức độ hoàn thành bảng hỏi: 1. Hoàn thành 2. Không gặp (ĐTV đến 3 lần không gặp) 3. Không có nhà 4. Không hợp tác (Chú ý:1. Tiêu chuẩn lựa chọn đối tượng: Phụ nữ độ tuổi 18-55 (theo danh sách). 2. Thay thế đối tượng: Trong trường hợp không gặp, không có nhà, không hợp tác: chọn đối tượng nhà liền kề bên tay phái) [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 99 I. THÔNG TIN CHUNG Chuyển câu C1 Năm sinh (dương lịch) ....................... C2 Chị hiện đang sống ở đâu Nông thôn 1 Thành thị (thị trấn/thị xã) 2 C3 Trình độ học vấn cao nhất (Với hệ 10 năm: lớp 7 là hết cấp II Với hệ 11 năm: lớp 8 là hết cấp II Với hệ 12 năm: lớp 9 là hết cấp II) Chưa bao giờ đi học Chưa học hết hoặc hết cấp I Chưa học hết hoặc hết cấp II Chưa học hết hoặc hết cấp III Trung cấp Cao đẳng, đại học Trên Đại học 1 2 3 4 5 6 7 C4 Nghề nghiệp chính (nghề mang lại thu nhập chính) của chị hiện nay là gì? Công chức (đang công tác) Nông dân Công nhân Thợ xây, Thợ thủ công Học sinh/sinh viên Buôn bán nhỏ Hưu trí Thất nghiệp/Nội trợ Khác, (ghi rõ).......................... 1 2 3 4 5 6 7 8 9 C5 Tình trạng hôn nhân hiện tại Đang sống với chồng Độc thân 1 2 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 100 (Xa nhau vì công việc là người chồng có mặt ở nhà ít hơn 1 tuần/tháng) Ly thân Ly dị Goá Xa nhau vì công việc Khác, (ghi rõ)........................ 3 4 5 6 7 C6 Hiện tại chị có hút thuốc lá /lào không ? Có Không 1 2 C7 Trong nhà chị hiện tại có ai hút thuốc lá/lào không (sống cùng nhà với chị trong vòng ít nhất 3 tháng trở lại đây)? (nhiều lựa chọn) Bố Chồng Anh/em trai Khác, (ghi rõ)........................ Không ai hút 1 2 3 4 5 ÆC9 C8 Nếu có, có bất cứ ai trong số những người hút thuốc ở cùng nhà với chị trong tuần qua không? Có Không 1 2 1.1.1. II. Thực trạng hút thuốc thụ động C9 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nhà? (phòng khách, phòng ngủ, phòng ăn nhà vệ sinh) (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày..... (giá trị từ 0 - 7 ngày) [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 101 C10 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nơi làm việc? (Chỉ hỏi với những người đi làm - được trả lương) (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày..... (giá trị từ 0 - 7 ngày) C11 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nơi công cộng (bến tàu xe, nơi tập trung đông người...)? (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày..... (giá trị từ 0 - 7 ngày) C12 Con/cháu/trẻ em (nhỏ hơn 16 tuổi, sống cùng nhà) của chị có phải tiếp xúc với khói thuốc lá của bất cứ thành viên nào sống cùng nhà trong tuần qua không? Có Không Tôi không có con/trẻ con sống cùng nhà Không biết/không trả lời 1 2 3 4 C13 Câu nói nào sau đây mô tả đúng nhất tình trạng tiếp xúc với khói thuốc của các thành viên trong nhà chị? (Đọc các phương án trả Mọi người có thể tiếp xúc khói thuốc ở bất cứ đâu trong nhà vào bất cứ lúc nào Mọi người tiếp xúc khói thuốc ở một số nơi, và/hoặc vào một lúc nào đó 1 2 3 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 102 lời) Mọi người không bao giờ phải tiếp xúc khói thuốc trong nhà Không biết/không trả lời 4 III. Hiểu biết về tác hại của khói thuốc lá C14 Theo chị khói thuốc của người hút thuốc có ảnh hưởng tới sức khỏe của người xung quanh không? Có Không Không biết/ không trả lời 1 2 3 Æ C16 Æ C16 C15 Theo chị nếu hít phải khói thuốc có thể gây bệnh thì đó là bệnh gì? (nhiều lựa chọn, để tự trả lời) Bệnh phổi/phế quản/ho & viêm họng Ung thư phổi Lao phổi Bệnh tim mạch Gày yếu suy nhược Khác (ghi rõ):.................. 1 2 3 4 5 6 C16 Theo chị phụ nữ có thai hít phải khói thuốc thì có hại không? (để phụ nữ đánh giá mức độ có hại của khói thuốc thụ động dựa vào thang đo bên) Rất có hại Có hại Không có ý kiến gì/ko chắc chắn Không có hại lắm Hoàn toàn không có hại 1 2 3 4 5 ÆC18 C17 Theo chị thì khói thuốc có thể gây ra những bệnh gì Sinh con nhẹ cân 1 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 103 cho phụ nữ có thai và thai nhi? (nhiều lựa chọn, để tự trả lời) Tăng nguy cơ trẻ sinh ra bị ung thư não, máu trắng Viêm đường hô hấp cấp tính trẻ em Sảy thai/đẻ non Không biết/không trả lời Khác (ghi rõ):................................ 2 3 4 5 6 C18 Theo chị khói thuốc có hại đến sức khỏe của trẻ em không? (để phụ nữ đánh giá mức độ có hại của khói thuốc thụ động dựa vào thang đo bên) Rất có hại Có hại Không có ý kiến gì/không chắc chắn Không có hại lắm Hoàn toàn không có hại 1 2 3 4 5 ÆC20 C19 Nếu có hại thì khói thuốc có thể gây bệnh gì cho trẻ em? (nhiều lựa chọn, để tự trả lời) Viêm đường hô hấp Tăng nguy cơ các bệnh về tim Hen suyễn Viêm tai giữa Không biết Khác (ghi rõ):.......................................... 1 2 3 4 5 6 /___________________________________________________________________/ [Bộ môn Tin học – Đại học YTCC] | TÀI LIỆU THAM KHẢO 104 TÀI LIỆU THAM KHẢO 1. Epidata for data entry and documentation, Ziad EI, Clinical Cancer Epidemiology, 2004 2. Jens ML, Michael BR, Epidata Help, The Epidata Association, Odense Denmark,26/10/2004
File đính kèm:
- tai_lieu_giang_day_mon_ky_thuat_may_tinh_phan_mem_epidata.pdf