Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản

tf(w,d): Số lần xuất hiện của từ w trong văn bản di • Số lần xuất hiện càng cao thì từ càng có vai trò

quan trọng trong văn bản • Từ dừng có tần suất xuất hiện cao trong hầu hết

văn bản nhưng đã bị loại bỏ trong bước tiền xử

• Chưa thể hiện vai trò của từ trong cả tập văn bản

 

pdf 9 trang yennguyen 1800
Bạn đang xem tài liệu "Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfbai_giang_xu_ly_ngon_ngu_tu_nhien_chuong_4_phan_lop_van_ban.pdf