Bài giảng Nhập môn tin học - Chương 5: Lưu trữ và xử lý dữ liệu - Từ Thị Xuân Hiền
Khái niệm về dữ liệu
Dữ liệu là một tập hợp các sự kiện chưa được tổ chức nhưng có thể được tổ chức thành thông tin hữu ích.
Thông tin: dữ liệu đã được sắp xếp theo một trật tự và dạng thức có ích cho dùng.
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nhập môn tin học - Chương 5: Lưu trữ và xử lý dữ liệu - Từ Thị Xuân Hiền", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Nhập môn tin học - Chương 5: Lưu trữ và xử lý dữ liệu - Từ Thị Xuân Hiền
Chương 5L ư u trữ và xử lý dữ liệu 12/2/2021 1 Khái niệm về dữ liệu D ữ liệu là một tập hợp các sự kiện chưa được tổ chức nhưng có thể được tổ chức thành thông tin hữu ích . T hông tin : dữ liệu đã được sắp xếp theo một trật tự và dạng thức có ích cho dùng. 12/2/2021 2 Khái niệm xử lý dữ liệu X ử lý dữ liệu là một loạt các hành động hoặc hoạt động có thể chuyển đổi dữ liệu thành thông tin hữu ích . M ột hệ thống xử lý dữ liệu bao gồm các tài nguyên như con người, quy trình và các thiết bị sử dụng để xử lý dữ liệu đầu vào cho cho kết quả đầu ra như mong muốn . 12/2/2021 3 Sự phân cấp lưu trữ dữ liệu 12/2/2021 4 Sự phân cấp lưu trữ dữ liệu Bit : đơn vị lưu trữ nhỏ nhất của dữ liệu, có 2 giá trị là 0 hoặc là 1. Kí tự: Nhiều bit có quan hệ với nhau được kết hợp lại thành 1 dạng kí tự (hay 1 byte).. Trường: Nhiều kí tự có quan hệ với nhau được kết hợp lại thành một trường. 12/2/2021 5 Sự phân cấp lưu trữ dữ liệu Bản ghi: Nhiều trường có quan hệ với nhau được kết hợp lại thành một bản ghi. Tập tin: Nhiều bản ghi có quan hệ với nhau được kết hợp lại thành một tập tin. Cơ sở dữ liệu: Nhiều tập tin có quan hệ với nhau được kết hợp lại thành 1 dạng tập tin. 12/2/2021 6 Sự phân cấp lưu trữ dữ liệu 12/2/2021 7 Phương thức chuẩn tổ chức dữ liệu Hai tiêu chuẩn cho việc tổ chức dữ liệu: Hướng tiếp cận tập tin Hướng tiếp cận cơ sở dữ liệu 12/2/2021 8 Hướng tiếp cận tập tin Dữ liệu của ứng dụng được tổ chức thành một hay nhiều tập tin. Chương trình ứng dụng xử lý dữ liệu được lưu giữ trong những tập tin này để cho ra những kết quả mong muốn 12/2/2021 9 Hướng tiếp cận tập tin File management system: Tập các chương trình được cung cấp để tạo điều kiện cho người dùng tổ chức, tạo, xóa, cập nhật và thao tác trên các tập tin. 12/2/2021 10 Hướng tiếp cận tập tin File management system hỗ trợ các loại file: Transaction file : lưu trữ dữ liệu đầu vào cho đến khi nó được xử lý Master file : lưu trữ tất cả dữ liệu hiện hành liên quan đến ứng dụng. Output file : lưu trữ kết quả của chương trình ứng dụng mà nó sẽ là dữ liệu đầu vào cho ứng dụng khác. 12/2/2021 11 Hướng tiếp cận tập tin Report file : lưu trữ một bản sao của một bản báo cáo được tạo ra bởi một ứng dụng . Backup file : bản sao của một tập tin, được tạo ra như là một biện pháp phòng ngừa an toàn , chống mất mát dữ liệu 12/2/2021 12 Tổ chức tập tin Có 3 cách tổ chức tập tin thông dụng: Tuần tự (Sequential) : các mẫu tin được lưu trữ tăng dần hoặc giảm dần được xác định bởi giá trị của các cột trong các record. Ngẫu nhiên (Direct/random ): bản ghi mong muốn liên quan đến giao dịch hiện tại có thể được đặt trực tiếp theo giá trị khóa chính của nó mà không cần phải điều hướng thông qua trình tự của các mẫu tin khác 12/2/2021 13 Tổ chức tập tin L ập chỉ mục tuần tự (indexed sequential) : có hai tập tin cho mỗi tập tin dữ liệu : C ác tập tin dữ liệu trong đó có các mẫu tin C ác tập tin chỉ mục nhỏ hơn, trong đó có khóa và địa chỉ của mỗi bản ghi lưu trong các tập tin dữ liệu 12/2/2021 14 Tổ chức tập tin 12/2/2021 15 Ưu và nhược của cách tiếp cận tập tin Ưu điểm: Xử lý dữ liệu cho các ứng dụng đơn giản, không tốn kém, và thường dễ sử dụng. Khuyết điểm : Hạn chế sự linh hoạt trong truy vấn Tính dư thừa dữ liệu Vấn đề toàn vẹn dữ liệu Thiếu tích độc lập chương trình/dữ liệu. Khó bảo mật dữ liệu 12/2/2021 16 Hệ quản trị cơ sở dữ liệu Trong cách tiếp cận hướng cơ sở dữ liệu của việc tổ chức dữ liệu, một tập các chương trình được cung cấp cho người dùng trong việc tổ chức, tạo, xóa, cập nhật và duy trì dữ liệu trong cơ sở dữ liệu. Tập tất cả chương trình như trên gọi là hệ quản trị cơ sở dữ liệu (Database management system-DBMS) 12/2/2021 17 Mô hình dữ liệu – Data model M ô hình dữ liệu xác định cách thức mà các tập tin khác nhau của một cơ sở dữ liệu được liên kết với nhau Có 4 mô hình dữ liệu thông dụng Phân cấp Mạng Quan hệ Hướng đối tượng 12/2/2021 18 Mô hình phân cấp Các yếu tố dữ liệu được liên kết theo dạng cấu trúc của 1 hình cây. Có mối quan hệ cha-con giữa các thành phần dữ liệu. Một phần tử dữ liệu cha có một hoặc nhiều phần tử dữ liệu con nhưng mỗi phần tử con chỉ có một phần tử cha. 12/2/2021 19 Mô hình phân cấp 12/2/2021 20 Mô hình mạng Là sự mở rộng của mô hình phân cấp. Các phần tử của một cơ sở dữ liệu được tổ chức theo mối quan hệ cha -con, nhưng mỗi con có thể có nhiều cha hoặc không có. Hệ quản trị cơ sở dữ liệu cho phép khai thác các thông tin bắt đầu từ phần tử dữ liệu bất kỳ trong mô hình. 12/2/2021 21 Mô hình mạng 12/2/2021 22 Mô hình mạng 12/2/2021 23 Mô hình cơ sở dữ liệu quan hệ Các phần tử dữ liệu được tổ chức thành nhiều bảng. Mỗi bảng gồm các hàng và cột. Mỗi cột mô tả một thuộc tính gọi là trường dữ liệu (field hay thuộc tính) Mỗi hàng mô tả thông tin cụ thể của một đối tượng gọi là bản ghi dữ liệu (tuple-bộ). 12/2/2021 24 Mô hình cơ sở dữ liệu quan hệ Mỗi bảng lưu trữ như là một tập tin tuần tự. Các dữ liệu trong một bảng có thể liên quan đến dữ liệu trong một bảng khác thông qua việc sử dụng chung một trường. 12/2/2021 25 Mô hình cơ sở dữ liệu quan hệ 12/2/2021 26 Mô hình cơ sở dữ liệu quan hệ Kết quả truy vấn thông tin từ cơ sở dữ liệu 12/2/2021 27 Mô hình dữ liệu hướng đối tượng Dữ liệu trong mô hình hướng đối tượng được xem như các đối tượng Mỗi đối tượng trong mô hình hướng đối tượng có các thành phần: Thuộc tính Phương thức Mối quan hệ giữa các đối tượng 12/2/2021 28 Mô hình dữ liệu hướng đối tượng 12/2/2021 29 Các thành phần chính của DBMS DBMS cho phép người dùng tổ chức, xử lý và truy vấn dữ liệu t ừ một cơ sở dữ liệu mà không cần biết về cấu trúc cơ sở dữ liệu . Có 4 thành phần cơ bản trong DBMS: Data definition language (DDL): ngôn ngữ định nghĩa cấu trúc của cơ sở dữ liệu. Data manipulation language (DML): giúp người dùng nhập và thao tác dữ liệu. Query language : cho phép người dùng xác định yêu cầu truy vấn thông tin mong muốn từ cơ sở dữ liệu . 12/2/2021 30 Các thành phần chính của DBMS Report generator : công cụ tạo báo cáo , giúp người dùng thiết kế bố báo cáo theo một định dạng như mong muốn. 12/2/2021 31 Các chức năng của DBMS Tạo cơ sở dữ liệu Lưu trữ, truy xuất và cập nhật dữ liệu Quản lý giao tác ( transaction management ). Điều khiển đồng thời ( concurrency control ) Sao lưu và phục hồi dữ liệu. Bảo mật dữ liệu Hỗ trợ truyền thông dữ liệu. Duy trì tính toàn vẹn / nhất quán dữ liệu. Cung cấp các tiện ích. 12/2/2021 32 Tạo cơ sở dữ liệu Tạo cơ sở dữ liệu gồm 3 bước: Định nghĩa cấu trúc của cơ sở dữ liệu. Thiết kế form để hiển thị và nhập dữ liệu. Nhập dữ liệu vào cơ sở dữ liệu. 12/2/2021 33 Tạo cơ sở dữ liệu Ví dụ một form nhập liệu 12/2/2021 34 Xem, xóa, hiệu chỉnh, thêm mẫu tin Tất cả các hệ quản trị cơ sở dữ liệu đều cung cấp các công cụ cho phép xem, xóa, hiệu chỉnh và thêm mẫu tin vào trong cơ sở dữ liệu. Ngoài ra DBMS còn cung cấp các công cụ cho phép lọc dữ liệu theo các điều kiện của người dùng. 12/2/2021 35 Tìm kiếm dữ liệu Hầu hết các hệ quản trị CSDL đều cung cấp chức năng giúp người dùng có thể tìm những thông tin cần thiết Find command : lệnh truy vấn dữ liệu đơn giản. Query language : truy vấn dữ liệu với những điều kiện phức tạp. Query by example (QBE): cung cấp giao diện người dùng đơn giản để truy vấn dữ liệu theo điều kiện được chỉ định 12/2/2021 36 Tạo report Report được tạo bằng công cụ tạo report của hệ quản trị CSDL. Report là kết xuất dữ liệu được truy vấn từ cơ sở dữ liệu theo một dạng thức mong muốn của người dùng. Một report bao gồm các thành phần: Tiêu đề chính, tiêu đề phụ Tiêu đề của cột trong bảng kết xuất Các thành phần dữ liệu khác 12/2/2021 37 Tạo report 12/2/2021 38
File đính kèm:
- bai_giang_nhap_mon_tin_hoc_chuong_5_luu_tru_va_xu_ly_du_lieu.pptx