Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu
Chương 1: Tổng quan về khai phá dữ liệu
Chương 2: Các vấn đề tiền xử lý dữ liệu
Chương 3: Hồi qui dữ liệu
Chương 4: Phân loại dữ liệu
Chương 5: Gom cụm dữ liệu
Chương 6: Luật kết hợp
Chương 7: Khai phá dữ liệu và công nghệ cơ sở
dữ liệu
Chương 8: Ứng dụng khai phá dữ liệu
Chương 9: Các đề tài nghiên cứu trong khai phá
dữ liệu
Chương 10: Ôn tập
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu
11 Chương 8: Ứng dụng khai phá dữ liệu Học kỳ 1 – 2011-2012 Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Cao Học Ngành Khoa Học Máy Tính Giáo trình điện tử Biên soạn bởi: TS. Võ Thị Ngọc Châu (chauvtn@cse.hcmut.edu.vn) 22 Tài liệu tham khảo [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008. [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006. [5] Hillol Kargupta, Jiawei Han, Philip S. Yu, Rajeev Motwani, and Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009. [6] Daniel T. Larose, “Data mining methods and models”, John Wiley & Sons, Inc, 2006. [7] Ian H.Witten, Eibe Frank, “Data mining : practical machine learning tools and techniques”, Second Edition, Elsevier Inc, 2005. [8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire, “Successes and new directions in data mining”, IGI Global, 2008. [9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010. 33 Nội dung Chương 1: Tổng quan về khai phá dữ liệu Chương 2: Các vấn đề tiền xử lý dữ liệu Chương 3: Hồi qui dữ liệu Chương 4: Phân loại dữ liệu Chương 5: Gom cụm dữ liệu Chương 6: Luật kết hợp Chương 7: Khai phá dữ liệu và công nghệ cơ sở dữ liệu Chương 8: Ứng dụng khai phá dữ liệu Chương 9: Các đề tài nghiên cứu trong khai phá dữ liệu Chương 10: Ôn tập 44 Chương 8: Ứng dụng khai phá dữ liệu 8.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu 8.2. Qui trình phát triển ứng dụng khai phá dữ liệu 8.3. Các chuẩn dành cho khai phá dữ liệu 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 8.5. Tóm tắt 55 8.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu Vấn đề dữ liệu Lượng và chất lượng dữ liệu Kiểu dữ liệu Vấn đề tri thức từ quá trình khai phá Biểu diễn và tích hợp vào ứng dụng Vấn đề kỹ thuật khai phá Lựa chọn giải thuật khai phá Vấn đề hiệu quả (effective) và hiệu suất (efficient) 66 8.2. Qui trình phát triển ứng dụng khai phá dữ liệu Qui trình phát triển ứng dụng Qui trình phát triển ứng dụng khai phá dữ liệu Æ Tương đồng và khác biệt 77 8.3. Các chuẩn dành cho khai phá dữ liệu The Predictive Model Markup Language (PMML – www.dmg.org) Standard application programming interfaces (APIs) The Cross-Industry Standard Process for Data Mining (CRISP-DM – www.crisp-dm.org) Nguồn: R. L. Grossman, M. F. Hornick, G. Meyer, Data Mining Standards Initiatives, Communications of the ACM 45 (8) 2002 59- 61. 88 8.3. Các chuẩn dành cho khai phá dữ liệu The Predictive Model Markup Language (PMML – www.dmg.org) Chuẩn dựa trên XML Mô tả các mô hình thống kê và khai phá dữ liệu, các tác vụ làm sạch và biến đổi dữ liệu Các thành phần của PMML Data dictionary Mining schema Transformation dictionary Model statistics Models 99 8.3. Các chuẩn dành cho khai phá dữ liệu 10 10 8.3. Các chuẩn dành cho khai phá dữ liệu 11 11 8.3. Các chuẩn dành cho khai phá dữ liệu 12 12 8.3. Các chuẩn dành cho khai phá dữ liệu Standard application programming interfaces (APIs) SQL/MM Part 6: Data Mining The Java Specification Request-73 (JSR-73) Jcp.org/jsr/detail/073.jsp Microsoft APIs Microsoft.AnalysisServices.AdomdClient 13 13 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu Các công cụ mã nguồn mở (open-source tools) Các công cụ thương mại 14 14 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu Các công cụ mã nguồn mở (open-source) R (www.r-project.org) Tanagra (eric.univ-lyon2.fr/~ricco/tanagra/) Weka (www.cs.waikato.ac.nz/ml/weka) YALE (rapid-i.com) KNIME (www.knime.org) Orange (www.ailab.si/orange) Nguồn: B. Zupan, J. Demsar, “Open-Source Tools for Data Mining”, Clinics in Laboratory Medicine 28(2008) 37-54. 15 15 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 16 16 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 17 17 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 18 18 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 19 19 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 20 20 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu 21 21 8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu Các công cụ thương mại Hỗ trợ từ Intelligent Miner (IBM) Hỗ trợ từ Microsoft data mining tools (MS SQL Server 2000/2005/2008) Hỗ trợ từ Oracle Data Mining Hỗ trợ từ Enterprise Miner (SAS Institute) 22 22 8.5. Tóm tắt Xem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệu Sự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệu Sự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu 23 23 Hỏi & Đáp
File đính kèm:
- bai_giang_khai_pha_du_lieu_chuong_8_ung_dung_khai_pha_du_lie.pdf