Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu

 Chương 1: Tổng quan về khai phá dữ liệu

‡ Chương 2: Các vấn đề tiền xử lý dữ liệu

‡ Chương 3: Hồi qui dữ liệu

‡ Chương 4: Phân loại dữ liệu

‡ Chương 5: Gom cụm dữ liệu

‡ Chương 6: Luật kết hợp

‡ Chương 7: Khai phá dữ liệu và công nghệ cơ sở

dữ liệu

‡ Chương 8: Ứng dụng khai phá dữ liệu

‡ Chương 9: Các đề tài nghiên cứu trong khai phá

dữ liệu

‡ Chương 10: Ôn tập

pdf 23 trang yennguyen 3280
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu

Bài giảng Khai phá dữ liệu - Chương 8: Ứng dụng khai phá dữ liệu - Võ Thị Ngọc Châu
11
Chương 8: Ứng dụng khai phá
dữ liệu
Học kỳ 1 – 2011-2012
Khoa Khoa Học & Kỹ Thuật Máy Tính
Trường Đại Học Bách Khoa Tp. Hồ Chí Minh
Cao Học Ngành Khoa Học Máy Tính
Giáo trình điện tử
Biên soạn bởi: TS. Võ Thị Ngọc Châu
(chauvtn@cse.hcmut.edu.vn)
22
Tài liệu tham khảo
‡ [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and 
Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006.
‡ [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data 
Mining”, MIT Press, 2001.
‡ [3] David L. Olson, Dursun Delen, “Advanced Data Mining 
Techniques”, Springer-Verlag, 2008.
‡ [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, 
Methodology, Techniques, and Applications”, Springer-Verlag, 2006.
‡ [5] Hillol Kargupta, Jiawei Han, Philip S. Yu, Rajeev Motwani, and 
Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis 
Group, LLC, 2009.
‡ [6] Daniel T. Larose, “Data mining methods and models”, John Wiley 
& Sons, Inc, 2006.
‡ [7] Ian H.Witten, Eibe Frank, “Data mining : practical machine 
learning tools and techniques”, Second Edition, Elsevier Inc, 2005. 
‡ [8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire, 
“Successes and new directions in data mining”, IGI Global, 2008.
‡ [9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge 
Discovery Handbook”, Second Edition, Springer Science + Business
Media, LLC 2005, 2010.
33
Nội dung
‡ Chương 1: Tổng quan về khai phá dữ liệu
‡ Chương 2: Các vấn đề tiền xử lý dữ liệu
‡ Chương 3: Hồi qui dữ liệu
‡ Chương 4: Phân loại dữ liệu
‡ Chương 5: Gom cụm dữ liệu
‡ Chương 6: Luật kết hợp
‡ Chương 7: Khai phá dữ liệu và công nghệ cơ sở
dữ liệu
‡ Chương 8: Ứng dụng khai phá dữ liệu
‡ Chương 9: Các đề tài nghiên cứu trong khai phá
dữ liệu
‡ Chương 10: Ôn tập
44
Chương 8: Ứng dụng khai phá dữ
liệu
‡ 8.1. Tổng quan về vấn đề phát triển ứng
dụng khai phá dữ liệu
‡ 8.2. Qui trình phát triển ứng dụng khai
phá dữ liệu
‡ 8.3. Các chuẩn dành cho khai phá dữ liệu
‡ 8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
‡ 8.5. Tóm tắt
55
8.1. Tổng quan về vấn đề phát triển ứng
dụng khai phá dữ liệu
‡ Vấn đề dữ liệu
„ Lượng và chất lượng dữ liệu
„ Kiểu dữ liệu
‡ Vấn đề tri thức từ quá trình khai phá
„ Biểu diễn và tích hợp vào ứng dụng
‡ Vấn đề kỹ thuật khai phá
„ Lựa chọn giải thuật khai phá
‡ Vấn đề hiệu quả (effective) và hiệu suất
(efficient)
66
8.2. Qui trình phát triển ứng dụng khai
phá dữ liệu
‡Qui trình phát triển ứng dụng
‡Qui trình phát triển ứng dụng khai phá
dữ liệu
Æ Tương đồng và khác biệt
77
8.3. Các chuẩn dành cho khai phá dữ liệu
‡ The Predictive Model Markup Language (PMML 
– www.dmg.org)
‡ Standard application programming interfaces 
(APIs)
‡ The Cross-Industry Standard Process for Data 
Mining (CRISP-DM – www.crisp-dm.org)
Nguồn: R. L. Grossman, M. F. Hornick, G. 
Meyer, Data Mining Standards Initiatives, 
Communications of the ACM 45 (8) 2002 59-
61.
88
8.3. Các chuẩn dành cho khai phá dữ liệu
‡ The Predictive Model Markup Language (PMML 
– www.dmg.org)
„ Chuẩn dựa trên XML
‡ Mô tả các mô hình thống kê và khai phá dữ liệu, các tác
vụ làm sạch và biến đổi dữ liệu
„ Các thành phần của PMML
‡ Data dictionary
‡ Mining schema
‡ Transformation dictionary
‡ Model statistics
‡ Models
99
8.3. Các chuẩn dành cho khai phá dữ liệu
10
10
8.3. Các chuẩn dành cho khai phá dữ liệu
11
11
8.3. Các chuẩn dành cho khai phá dữ liệu
12
12
8.3. Các chuẩn dành cho khai phá dữ liệu
‡ Standard application programming interfaces 
(APIs)
„ SQL/MM Part 6: Data Mining
„ The Java Specification Request-73 (JSR-73)
‡ Jcp.org/jsr/detail/073.jsp
„ Microsoft APIs
‡ Microsoft.AnalysisServices.AdomdClient
13
13
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
‡ Các công cụ mã nguồn mở (open-source 
tools)
‡ Các công cụ thương mại
14
14
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
‡ Các công cụ mã nguồn mở (open-source)
„ R (www.r-project.org)
„ Tanagra (eric.univ-lyon2.fr/~ricco/tanagra/)
„ Weka (www.cs.waikato.ac.nz/ml/weka)
„ YALE (rapid-i.com)
„ KNIME (www.knime.org)
„ Orange (www.ailab.si/orange)
„ 
Nguồn: B. Zupan, J. Demsar, “Open-Source Tools for 
Data Mining”, Clinics in Laboratory Medicine
28(2008) 37-54. 
15
15
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
16
16
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
17
17
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
18
18
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
19
19
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
20
20
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
21
21
8.4. Các công cụ hỗ trợ phát triển ứng
dụng khai phá dữ liệu
‡ Các công cụ thương mại
„ Hỗ trợ từ Intelligent Miner (IBM)
„ Hỗ trợ từ Microsoft data mining tools (MS SQL 
Server 2000/2005/2008)
„ Hỗ trợ từ Oracle Data Mining
„ Hỗ trợ từ Enterprise Miner (SAS Institute)
„ 
22
22
8.5. Tóm tắt
‡Xem xét sự tương đồng/khác biệt giữa qui 
trình phát triển ứng dụng truyền thống và
ứng dụng khai phá dữ liệu
‡Sự cần thiết của các chuẩn (standards) dành
cho khai phá dữ liệu
‡Sự quan tâm của các nhà sản xuất phần
mềm đối với việc hỗ trợ phát triển ứng
dụng khai phá dữ liệu
23
23
Hỏi & Đáp 

File đính kèm:

  • pdfbai_giang_khai_pha_du_lieu_chuong_8_ung_dung_khai_pha_du_lie.pdf