Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng
Tóm tắt
Bài báo này ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ cho bài toán phân tích nhu cầu
khách hàng. Đây là bài toán có ý nghĩa ứng dụng lớn trong hoạt động sản xuất kinh doanh.
Áp dụng thuật toán tối ưu tiến hóa bầy đàn mờ vào bài toán cụ thể là một công ty chuyên
cung cấp thiết bị y tế của Mỹ muốn phân tích nhu cầu 500 bệnh viện trong khu vực về các
thiết bị và vật tư y tế, hỗ trợ công ty đưa ra chiến lược kinh doanh phù hợp nhất với từng
bệnh viện để đạt doanh thu cao.
Bạn đang xem tài liệu "Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng
TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT Tập 7, Số 2, 2017 247–261 247 ỨNG DỤNG THUẬT TOÁN TỐI ƯU TIẾN HÓA BẦY ĐÀN MỜ TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG Nguyễn Thị Như Naa* aKhoa Tự nhiên, Trường Cao đẳng Sư phạm Điện Biên, Lai Châu, Việt Nam Lịch sử bài báo Nhận ngày 31 tháng 03 năm 2017 | Chỉnh sửa ngày 21 tháng 04 năm 2017 Chấp nhận đăng ngày 19 tháng 05 năm 2017 Tóm tắt Bài báo này ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ cho bài toán phân tích nhu cầu khách hàng. Đây là bài toán có ý nghĩa ứng dụng lớn trong hoạt động sản xuất kinh doanh. Áp dụng thuật toán tối ưu tiến hóa bầy đàn mờ vào bài toán cụ thể là một công ty chuyên cung cấp thiết bị y tế của Mỹ muốn phân tích nhu cầu 500 bệnh viện trong khu vực về các thiết bị và vật tư y tế, hỗ trợ công ty đưa ra chiến lược kinh doanh phù hợp nhất với từng bệnh viện để đạt doanh thu cao. Từ khóa: Bầy đàn; Di truyền; Phân cụm; Tập mờ; Tiến hóa; Tối ưu. 1. ĐẶT VẤN ĐỀ Phân tích nhu cầu khách hàng là một việc rất quan trọng trong kinh doanh, phân tích nhu cầu khách hàng, phân khúc thị trường, xác định nhu cầu biến động của khách hang... Các thông tin thu được sử dụng để hỗ trợ các doanh nghiệp đưa ra chiến lược kinh doanh hiệu quả. Cụ thể, bài toán thực tế phân tích nhu cầu khách hàng là một công ty chuyên cung cấp các thiết bị y tế cho 500 bệnh viện ( ~cabrera/sc/cs8/cs8.html) ở Mỹ muốn tìm giải pháp để tăng doanh số bán hàng. Phân tích nhu cầu tiêu thụ các thiết bị y tế của các bệnh viện ở Mỹ tìm ra bệnh viện có mức tiêu thụ loại thiết bị y tế nào cao nhằm đưa ra chiến lược kinh doanh phù hợp với từng bệnh viện để tăng hiệu quả kinh doanh. Dữ liệu đầu vào bài toán là 500 bệnh viện ở Mỹ được tổ chức trong tập tin Customer.xls bao gồm 19 trường và 4000 bản ghi. Dữ liệu đầu ra bài toán là phân tích 500 bệnh viện thành 3 nhóm với mức tiêu thụ * Tác giả liên hệ: Email: nhuna.cdsp@gmail.com 248 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] thiết bị y tế khác nhau: Bệnh viện có mức tiêu thụ thiết bị y tế thấp; Bệnh viện có mức tiêu thụ thiết bị y tế trung bình; Bệnh viện có mức tiêu thụ thiết bị y tế cao. 19 trường trong tập tin bao gồm các mã như sau: 1. ZIP: Mã bưu điện 2. HID: ID bệnh viện 3. CITY: Tên thành phố 4. STATE: Tên tiểu bang 5. BEDS: Số giường bệnh 6. RBEDS: Số giường chỉnh hình 7. OUT-V: số lượt khám ngoại trú 8. ADM: Chi phí hành chính (1000 $/năm) 9. SIR: Thu từ nội trú 10. SALESY: Bán trang thiết bị phục hồi chức năng từ ngày 1 tháng 1 11. SALES12: Bán trang thiết bị phục hồi chức năng cuối tháng 12 12. HIP95: Số hoạt động cho hông trong năm 1995 13. KNEE95: Số hoạt động đầu gối trong năm 1995 14. TH: Có hoạt động dạy học không? 0, 1 15. TRAUMA: Có chấn thương không? 0, 1 16. REHAB: Có chỉnh hình không? 0, 1 17. HIP96: Số hoạt động cho hông cho năm 1996 18. KNEE96: Số hoạt động đầu gối cho năm 1996 19. FEMUR96: Số hoạt động cho xương đùi cho năm 1996. Có nhiều cách tiếp cận để giải quyết bài toán phân tích nhu cầu khách hàng như là cách tiếp cận thống trị dựa trên tập rõ (DRSA) được phát triển bởi Greco, Matarazzo, và Slowinski (1998) và Greco, Matarazzo, và Slowinski (2000) rất hữu ích để giảm dữ Nguyễn Thị Như Na 249 liệu trong phân tích định tính. Cách tiếp cận phân tích giỏ hàng (MBA) của Giudici và Passerone (2002) xác định mối liên hệ giữa khách hàng và các sản phẩm khác nhau trong một đơn vị đặc biệt như là bên trong một siêu thị. Các dữ liệu được phân tích trong MBA thường bao gồm tất cả các giao dịch mua hàng được thực hiện trong một khoảng thời gian nhất định để phân tích cấu trúc kết hợp giữa việc bán sản phẩm khác nhau có sẵn dựa vào đó doanh nghiệp lên kế hoạch cho các chính sách tiếp thị tốt hơn. Cách tiếp cận cho bài toán phân tích nhu cầu khách hàng mua bán trên Internet (Song, Kyeong, & Kim, 2001) sử dụng độ đo tượng tự và độ đo khác nhau cho các thay đổi của khách hàng, sau đó đánh giá độ đo thay đổi để đưa ra quy tắc thay đổi giúp các nhà quản lý đưa ra chiến lược kinh doanh phù hợp cho từng đối tượng khách hàng dựa trên số liệu kinh doanh cụ thể. Phân cụm được coi như một công cụ độc lập để xem xét phân bố dữ liệu, làm bước tiền xử lý cho các thuật toán khác. Phân cụm ứng dụng rất nhiều trong các lĩnh vực như phân tích hình ảnh (Pappas, 1992), thông tin địa lý (Aksoy, 2006), khai phá web (Runkler & Bezdek, 2003) Phương pháp phân cụm mờ là sự kết hợp của kỹ thuật phân cụm với lý thuyết mờ của Zadeh (1965) đang phát triển và được ứng dụng rộng rãi trong thực tiễn, ví dụ như phân tích rủi ro, dự báo nguy cơ phá sản cho ngân hàng và nhiều bài toán khác. Nhưng những vấn đề được quan tâm nhiều vẫn là nâng cao chất lượng phân cụm (Chen & Ludwig, 2014), tính toán thông qua một số độ đo chất lượng cụ thể Và một số nghiên cứu ứng dụng thuật toán tối ưu tiến hóa phân cụm mờ như là nghiên cứu phân cụm mờ bằng PSO (Runkler & Katz, 2006) giải quyết bài toán phân cụm mờ bằng cực tiểu hóa mô hình Fuzzy C – Means (FCM), ứng dựng trên bộ dữ liệu bệnh ung thư phổi. Nghiên cứu về vấn đề phát hiện, định vị trực quan các tín hiệu không cố định của Biswal, Dash, và Panigrahi (2009). Các nghiên cứu dựa trên tối ưu tiến hóa mờ để giải bài toán phân tích nhu cầu khách hàng như trên là rất ít. Bài báo này sẽ áp dụng thuật toán tối ưu tiến hóa mờ do Pang, Wang, Zhou, và Dong (2004) đề xuất cho bài toán phân cụm mờ để xác định nghiệm tối ưu toàn cục cho bài toán phân tích nhu cầu khách hàng. Với dữ liệu thực tế một công ty chuyên cung cấp các thiết bị y tế Mỹ muốn phân tích nhu cầu khách hàng là 500 bệnh viện trong khu vực để có kế hoạch và chiến lược kinh doanh phù hợp nhất cho từng đối tượng khách hàng, thích ứng với nhu cầu khách hàng mà đạt được doanh thu cao. Thuật toán tối ưu hóa bầy 250 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] đàn mờ (FPSO) (Pang và ctg., 2004) dựa trên thuật toán tối ưu bầy đàn cho bài toán người bán hàng. Thuật toán tối ưu bầy đàn (PSO) được Eberhart và Kennenday (1995) giới thiệu thuộc về lớp các bài toán tiến hóa, dựa trên khái niệm trí tuệ bầy đàn để giải bài toán tối ưu tiến hóa. PSO được áp dụng rộng rãi để cải tiến hiệu suất các thuật toán khác. Các ứng dụng như là bài toán lập kế hoạch (Weijun, Zhiming, Wei, & Genke, 2004), người bán hàng (Wang, Huang, Zhou, & Pang, 2003). Bài báo này ứng dụng thuật toán tối ưu tiến hóa phân cụm mờ cho công ty ở Mỹ chuyên cung cấp thiết bị y tế cho 500 bệnh viện khu vực, muốn phân tích nhu cầu về vật tư và thiết bị y tế của các bệnh viện trên. Kết quả thực nghiệm thu được 3 cụm khách hàng với các mức tiêu thụ vật tư và thiết bị y tế khác nhau, dựa vào đó công ty có cơ sở khoa học đưa ra giải pháp chiến lược kinh doanh phù hợp nhất cho từng nhóm đối tượng và từng đối tượng khách hàng làm tăng hiệu quả hoạt động kinh doanh. Ngoài ra, ứng dụng của thuật toán này có thể mở rộng không chỉ cho công ty chuyên cung cấp các thiết bị y tế mà còn có thể ứng dụng cho các doanh nghiệp kinh doanh sản xuất các mặt hàng khác. 2. THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ 2.1. Phương pháp phân cụm mờ Bài toán phân cụm N vector 1 2, ,..., NX x x x thành c cụm dựa trên tính toán tối thiểu hóa hàm mục tiêu để đo chất lượng của cụm và tìm tâm cụm sao cho hàm độ đo không tương tự là nhỏ nhất. Một phân cụm mờ vector 1 2, ,..., NX x x x được biểu diễn bởi ma trận ki N cU U sao cho một điểm dữ liệu có thể thuộc về nhiều nhóm và được xác định bằng giá trị hàm thuộc u . Ma trận giá trị hàm thuộc có dạng như sau: 11 1 1 c N Nc u u U u u (1) Thuật toán phân cụm mờ đã được xuất phát từ việc cực tiểu giá trị hàm mục tiêu: Nguyễn Thị Như Na 251 1 1 ( , z ) N c m m kj k j k j J u d x (2) Trong đó: ( , z )k jd x là một độ đo không tương tự. Giải bài toán ( , ) minmJ u z với ràng buộc sau: 1 1 0 1 1 0 kj c kj j N kj k u u u N (3) 2.2. Áp dụng thuật toán tối ưu bầy đàn cho phân cụm mờ (FPSO) Pang và ctg. (2004) đã đề xuất thuật toán tối ưu bầy đàn mờ. Trong thuật toán này vị trí và vận tốc của các cá thể xác định lại tương ứng với các biến mờ. Phương pháp này mô tả cho bài toán phân cụm mờ. Với X là vị trí các cá thể, thể hiện mối quan hệ mờ của các đối tượng dữ liệu. Tâm cụm 1 2, ,..., cZ z z z , X được biểu diễn như sau: 11 1 1 c N Nc X (4) Trong đó: ij là một hàm thuộc của cá thể i thuộc cụm j : ij ij 1 0,1 , 1,2,..., ; 1,2,...,c 1, 1,2,..., c j i N j i N (5) Ma trận vị trí của mỗi cá thể giống ma trận mờ trong thuật toán FCM. Ngoài ra, vận tốc của mỗi cá thể là ma trận N dòng và c cột, các cá thể của ma trận trong phạm vi [-1, 1]. 252 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 11 1 1 c N Nc v v V v v (6) Ta có công thức (7) cập nhật vị trí và vận tốc của các cá thể: 1 1 2 2( 1) w.V(t) + (c )( ( ) ( )) (c )( ( ) ( )) X(t 1) ( ) ( 1) V t r pbest t X t r gbest t X t X t V t (7) Sau khi cập nhật ma trận vị trí của cá thể, có thể không thỏa mãn điều kiện như trong (8). Vì vậy phải chuẩn hóa ma trận vị trí. ij ij 1 0,1 , 1,2,..., ; 1,2,...,c 1, 1,2,..., c j i N j i N (8) Để chuẩn hóa ta chuyển các số âm trong ma trận thành 0. Nếu các cá thể trên một hàng của ma trận là 0, chúng cần chuẩn hóa lại bằng cách lấy ngẫu nhiên trong [0,1], ta có ma trận được chuẩn hóa được biểu diễn như trong (9). 11 1 1 11 1 1 1 1 or c c j c jj j c c N Nj Nc Njj j Xn mal (9) Thuật toán FPSO cũng tương tự như các thuật toán cải tiến khác, đều cần một hàm đánh giá kết quả tổng quát gọi là hàm độ đo thích nghi. Công thức (10) là hàm độ đo thích nghi sử dụng để đánh giá các kết quả. ( ) m K f X J (10) Trong đó K là hằng số; mJ là hàm mục tiêu 2 ij 1 1 ( , Z) N c m m i j i j J x z Nguyễn Thị Như Na 253 Từ các công thức trên, ta có thuật toán FPSO như sau: Bước 1. Khởi tạo tham số 1 2, , , wP c c và tham số đếm vòng lặp tối đa Maxinter. Bước 2. Tạo P cá thể trong quần thể ( , ,X pbest gbest , V ma trận N c cá thể). Bước 3. Khởi tạo ,V,X pbest cho mỗi cá thể và gbest cho quần thể. Bước 4. Tính các tâm cụm cho mỗi cá thể bằng công thức (11): ij 1 j ij1 N m ii N m i x z (11) Bước 5. Tính giá trị hàm độ đo thích nghi cho mỗi cá thể bằng công thức (10). Bước 6. Tính pbest cho mỗi cá thể. Bước 7. Tính gbest cho quần thể. Bước 8. Cập nhật ma trận vận tốc cho mỗi cá thể bằng công thức (9). Bước 9. Cập nhật ma trận vị trí cho mỗi cá thể bằng công thức (7). Bước 10. Nếu thỏa gặp điều kiện kết thúc, quay lại Bước 4. Điều kiện kết thúc là số lần lặp tối đa hoặc giá trị trong vòng lặp không cải thiện nữa. 2.3. Ưu điểm và nhược điểm của bài toán Thuật toán FPSO là sự kết hợp ưu điểm của thuật toán FCM, dễ dàng giải quyết các bài toán tối ưu hàm mục tiêu khác nhau của thuật toán PSO để phân cụm trong môi trường mờ. Hiệu suất tốt hơn so với một số thuật toán phân cụm mờ như FCM. Sử dụng FPSO dễ dàng giải quyết các bài toán phân cụm mờ, tối ưu hóa tổ hợp khó giải quyết trong phạm vi lớn trong môi trường mờ (Mehdizadeh & Moghaddam, 2008). Tuy nhiên, nhược điểm là thuật toán FPSO hội tụ chậm hơn so với thuật toán phân cụm mờ FCM. gbest 254 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 3. KẾT QUẢ THỰC NGHIỆM Thuật toán chạy với tham số cụm c=3 với nhãn các cụm như sau: Bệnh viện có mức tiêu thiết bị y tế thấp, trung bình, cao. Tham số mờ m=2, tiêu chuẩn hội tụ (epsilon) Eps = 0.01, và số lần lặp tối đa MaxTest =1000. Quy tắc: Khách hàng sẽ thuộc về cụm mà có độ thuộc lớn nhất. Nếu có hai độ thuộc lớn nhất bằng nhau trở lên thì chọn một trong số các cụm đó để đưa vào. Cụm 1. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ thuộc: ID(37011) với độ thuộc (0.3723); ID(55511) và độ thuộc (0.3728); ID(24016) và độ thuộc (0.3698); ID(2016) và độ thuộc (0.3763); ID(53016) và độ thuộc (0.3764) cụ thể ở Bảng 1. Cụm 2. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ thuộc: ID(1104) với độ thuộc (0.4234); ID(1602) với độ thuộc (0.4517); ID(1605) với độ thuộc (0.2738); ID(1801) với độ thuộc (0.4082); ID(1830) với độ thuộc (0.4662); ID(1841) với độ thuộc (0.4303) cụ thể ở Bảng 2. Cụm 3. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ thuộc: ID(43014) với độ thuộc (0.4406); ID(21514) độ thuộc (0.4469); ID(46014) với độ thuộc (0.4402); ID(62014) với độ thuộc (0.4859); ID(78014) với độ thuộc (0.4938); ID(20901) với độ thuộc (0.48844); ID(153014) với độ thuộc (0.4874); ID(174014) với độ thuộc (0.4083) cụ thể ở Bảng 3. Xây dựng hàm thuộc cho các biến ngôn ngữ. Trước hết xác định biến ngôn ngữ: RBEDS = {RBEDS thấp; RBEDS cao} OUT_V = {OUT_V thấp; OUT_V cao} ADM = {ADM thấp; ADM cao} SIR = {SIR thấp; SIR cao} SALESY = {SALESY thấp; SALESY cao} Nguyễn Thị Như Na 255 SALES12 = {SALES12 thấp; SALES12 cao} HIP95 = {HIP95 thấp; HIP95 cao} KNEE95 = {KNEE95 thấp; KNEE95 cao} HIP96 = {HIP96 thấp; HIP96 cao} KNEE96 = {KNEE96 thấp; KNEE96 cao} FEMUR96 = {FEMUR96 thấp; FEMUR96 cao} Không gian tham chiếu của các thuộc tính được thể hiện ở Bảng 4. Xác định hàm thuộc cho các biến ngôn ngữ: Với biến X, và không gian tham chiếu U = [0, u]. Khi đó: X cao ( x ) / ;0x u x u , X thấp (x) = 1 - x/u. Ví dụ: Với thuộc tính BEDS: 0 BEDS 1476; với BEDS = 1001 thì BEDS cao (1001) =1001/ 1476 = 0.678184; BEDS thấp = 1- 0.678184. Tương tự với các thuộc tính còn lại. Xác định luật mờ: (Theo MISO - với n đầu vào và 1 đầu ra) • Luật 1. Nếu BEDS cao và RBEDS cao và OUT_V cao và REHAB cao thì tiêu thụ mức cao. • Luật 2. Nếu RBED và OUT_V và SIR cao và HIP95 cao thì tiêu thụ mức cao. B ả n g 1 . B ện h v iện th u ộ c C ụ m 1 ID B E D S R B E D S O U T -V A D M S IR S A L E S Y S A L E S 1 2 H IP 9 5 K N E E 9 5 T H T R A U M A R E H A B H IP 9 6 K N E E 9 6 F E M U R 9 6 3 7 0 1 1 2 5 0 1 2 1 0 7 2 9 7 9 2 0 3 5 5 0 3 1 1 6 6 4 6 1 0 1 9 1 4 7 6 2 5 5 5 1 2 3 6 2 5 2 6 3 1 8 9 7 8 9 1 6 7 4 8 3 3 6 6 5 6 1 0 1 6 5 7 0 5 2 2 4 0 1 6 1 5 5 1 0 5 3 3 9 8 7 5 3 0 6 4 2 6 1 1 3 8 2 4 1 0 1 5 4 3 9 5 7 2 0 1 6 4 7 5 1 3 6 3 6 5 6 1 7 4 2 4 1 0 9 4 0 0 0 1 5 4 1 1 2 1 0 1 1 4 7 1 2 4 1 3 7 5 3 0 1 6 3 2 0 1 8 4 8 5 5 6 1 1 9 3 5 1 1 1 8 5 8 1 6 1 2 6 4 7 1 0 1 1 4 5 8 0 1 2 7 256 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] B ả n g 2 . B ện h v iện th u ộ c C ụ m 2 ID B E D S R B E D S O U T -V A D M S IR S A L E S Y S A L E S 1 2 H IP 9 5 K N E E 9 5 T H T R A U M A R E H A B H IP 9 6 K N E E 9 6 F E M U R 9 6 1 1 0 4 3 2 4 0 9 5 7 0 2 1 0 4 0 6 1 3 6 4 8 2 8 2 9 1 2 2 9 4 0 0 0 1 5 2 9 5 1 1 6 1 6 0 2 8 0 8 0 0 9 0 7 0 3 1 8 4 9 1 0 0 0 0 1 0 0 0 1 6 0 5 2 1 1 0 9 2 7 5 7 5 7 1 1 5 7 6 6 2 7 7 5 1 3 2 0 9 1 4 3 1 0 0 2 0 7 1 7 8 1 7 7 1 8 0 1 8 2 8 2 0 4 4 0 0 5 0 8 2 0 0 0 0 1 0 0 0 1 8 3 0 1 5 1 0 2 5 5 5 0 6 1 9 9 5 2 5 7 1 2 1 6 4 0 1 5 0 0 0 3 9 1 9 8 7 1 8 4 1 2 9 0 0 9 2 7 6 8 8 6 6 2 5 3 8 8 5 6 9 6 5 5 2 6 0 0 0 4 9 4 0 8 0 B ả n g 3 . B ện h v iện th u ộ c C ụ m 3 ID B E D S R B E D S O U T -V A D M S IR S A L E S Y S A L E S 1 2 H IP 9 5 K N E E 9 5 T H T R A U M A R E H A B H IP 9 6 K N E E 9 6 F E M U R 9 6 4 3 0 1 4 1 0 0 5 0 5 0 4 1 2 5 3 4 2 1 4 2 7 8 3 0 0 2 5 0 4 2 7 1 1 1 0 5 1 9 2 8 9 3 0 3 2 1 5 1 4 7 1 0 0 4 2 1 4 5 6 3 7 7 4 5 2 5 7 9 6 0 0 4 6 1 4 5 8 1 1 0 4 3 7 3 7 2 1 6 9 4 6 0 1 4 2 1 9 0 4 7 0 3 6 7 8 2 9 9 1 6 3 6 1 8 6 6 3 4 6 3 1 0 0 6 1 8 4 1 0 5 1 6 2 0 1 4 3 9 1 0 0 1 4 5 9 4 8 8 5 2 7 1 3 8 2 4 9 1 1 0 8 0 4 7 7 7 7 8 0 1 4 2 9 0 0 7 2 0 6 1 1 1 7 6 7 7 4 2 6 0 0 7 8 5 1 1 0 0 1 0 1 5 3 1 0 3 2 0 9 0 1 4 2 7 5 0 1 1 8 7 9 1 8 7 8 8 6 4 7 3 1 1 5 5 1 3 0 1 0 0 5 2 3 2 6 8 1 5 3 0 1 4 3 2 1 0 6 6 0 6 1 1 7 4 7 5 9 3 7 5 0 0 1 0 4 9 3 1 1 0 1 0 2 6 0 1 0 9 B ả n g 4 . K h ô n g g ia n th a m ch iếu củ a cá c th u ộ c tín h B E D S R B E D S O U T -V A D M S IR S A L E S Y S A L E S 1 2 H IP 9 5 K N E E 9 5 T H T R A U M A R E H A B H IP 9 6 K N E E 9 6 F E M U R 9 6 M in 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 M ax 1 4 7 6 8 5 0 1 9 8 7 0 0 0 6 6 4 4 0 7 0 3 0 0 1 2 0 9 2 7 7 0 1 4 2 1 8 6 8 1 1 1 1 3 7 3 1 0 8 1 4 8 9 Nguyễn Thị Như Na 257 • Luật 3. Nếu BEDS cao và RBEDS thấp và HIP95 cao và KNEE95 cao thì tiêu thụ mức trung bình. • Luật 4. Nếu BEDS thấp và RBEDS cao và HIP95 thấp và KNEE95 thấp thì tiêu thụ mức thấp. • Luật 5. Nếu BEDS cao và RBEDS thấp và HIP96 cao và KNEE96 cao thì tiêu thụ mức trung bình. • Luật 6. Nếu BEDS thấp và RBEDS cao và HIP96 thấp và KNEE96 thấp thì tiêu thụ mức thấp. • Luật 7. Nếu BEDS thấp và RBEDS cao và OUT_Vcao và REHAB thấp thì tiêu thụ mức thấp. • Luật 8. Nếu BEDS thấp và RBEDS thấp và TH cao và REHAB cao thì tiêu thụ ở mức trung bình. • Luật 9. Nếu BEDS cao và RBEDS thấp và TH cao và REHAB cao thì tiêu thụ ở mức cao. • Luật 10. Nếu BEDS cao và RBEDS thấp và HIP96 cao và KNEE96 cao thì tiêu thụ ở mức cao. • Luật 11. Nếu BEDS thấp và RBEDS thấp và SALELY cao và SALES12 cao thì tiêu thụ ở mức thấp. • Luật 12. Nếu BEDS cao và RBEDS cao và SALELY cao và SALES12 cao thì tiêu thụ ở mức cao. Qua tính toán với số liệu cụ thể ở các bảng trên cho thấy: Cụm 1 là nhóm các bệnh viện có các chỉ số RBEDS (số giường chỉnh hình) cao và chỉ số REHAB (có chỉnh hình) thường xuyên, có chỉ số TH (có hoạt động dạy học) thường xuyên. Các chỉ số khác của các thuộc tính ở mức trung bình. Cụm 1 là cụm các bệnh viện có mức tiêu thụ thiết bị y tế mức trung bình. 258 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] Cụm 2 là nhóm các bệnh viện có chỉ số SALELY (bán trang thiết bị phục hồi chức năng ngày 1 tháng 1) và chỉ số SALES12 (bán trang thiết bị phục hồi chức năng cuối tháng 12) cao hơn. Các chỉ số khác của các thuộc tính ở mức thấp. Cụm 2 là cụm các bệnh viện có mức tiêu thụ thiết bị y tế mức thấp. Cụm 3 là nhóm các bệnh viện có chỉ số ADM (chi phí hành chính), SIR (thu từ nội trú), HIP95 (số hoạt động cho hông năm 1995), KNEE95 (số hoạt động cho đầu gối năm 1995), TH (có hoạt động dạy học), HIP96 (số hoạt động cho hông năm 1996), KNEE96 (số hoạt động cho đầu gối năm 1996), FEMUR96 (số hoạt động cho xương đùi năm 1996) cao hơn. Cụm 3 là cụm các bệnh viện có mức tiêu thụ thiết bị y tế mức cao. Vậy để tăng doanh thu cho công ty kinh doanh các thiết bị y tế, công ty sẽ tập trung vào 3 nhóm khách hàng với những chiến lược khác nhau cho từng nhóm. Với nhóm 1, công ty tập trung vào cung cấp các thiết bị liên quan đến hoạt động chỉnh hình và các thiết bị phục vụ cho quá trình học tập và đào tạo chuyên môn. Với nhóm 2, công ty tập trung cung cấp các trang thiết bị liên quan đến phục hồi chức năng. Với nhóm 3, có chi phí hành chính, thu từ nội trú khá cao, các chỉ số khác tương đối cao so với hai nhóm trên, có thể nói nhóm 3 là nhóm khách hàng tiềm năng có khả năng tiêu thụ nhiều thiết bị y tế phục vụ cho các hoạt động chữa bệnh như: Hoạt động cho hông, hoạt động cho đầu gối, hoạt động cho xương đùi, và các trang thiết bị liên quan đến hoạt động học tập và đào tạo chuyên môn. Cung cấp và phân phối các thiết bị y tế phù hợp cho từng nhóm ở trên, công ty kinh doanh sẽ nhanh chóng thúc đẩy quá trình bán hàng và từ đó doanh thu sẽ tăng cao hơn. 4. KẾT LUẬN Bài toán phân tích nhu cầu khách hàng là bài toán có tính ứng dụng cao, có ý nghĩa quan trọng trong hoạt động sản xuất kinh doanh. Bài toán phân tích nhu cầu khách hàng đã được giải quyết trên thuật toán tối ưu tiến hóa phân cụm mờ. Thuật toán tối ưu tiến hóa mờ được phát triển từ thuật toán tối ưu tiến hóa trên môi trường mờ đã được ứng dụng trong bài toán phân tích nhu cầu khách hàng cụ thể là của một công ty chuyên cung cấp các thiết bị y tế cho 500 bệnh viện khu vực. Công ty Nguyễn Thị Như Na 259 muốn phân tích nhu cầu tiêu thụ khác nhau về thiết bị và vật tư y tế của các bệnh viện. 500 bệnh viện được phân thành 3 cụm với các mức tiêu thụ vật tư và thiết bị y tế khác nhau: Bệnh viện có mức tiêu thiết bị y tế thấp; Bệnh viện có mức tiêu thụ thiết bị y tế trung bình; Bệnh viện có mức tiêu thụ thiết bị y tế cao. Từ đó, công ty đã có cơ sở để đưa ra chiến lược kinh doanh phù hợp nhất đáp ứng nhu cầu từng nhóm bệnh viện và từng bệnh viện cụ thể để hoạt động kinh doanh đạt hiệu quả và lợi nhuận cao. Hướng phát triển tiếp theo, chúng tôi sẽ áp dụng thuật toán trên trong nhiều lĩnh vực, như là hỗ trợ ra quyết định, thông tin địa lý, xử lý ảnh, v.v. TÀI LIỆU THAM KHẢO Angeline, P. J. (1995). Adaptive and self-adaptive evolutionary computations. Paper presented at The Computational Intelligence: A Dynamic Systems Perspective, USA. Aksoy, E. (2006). Clustering with GIS: An attempt to classify Turkish district data. Paper presented at The XXIII FIG Congress, Germany. Bezdek, J. C. (2013). Pattern recognition with fuzzy objective function algorithms. Berlin, Germany: Springer Science & Business Media. Biswal, B., Dash, P. K., & Panigrahi, B. K. (2009). Power quality disturbance classification using fuzzy C-means algorithm and adaptive particle swarm optimization. IEEE Transactions on Industrial Electronics, 56(1), 212-220. Bùi, C. C., & Nguyễn, D. P. (2006). Hệ mờ mạng nơron và ứng dụng. Hà Nội, Việt Nam: NXB Khoa học và Kỹ thuật. Brimberg, J., Hansen, P., Mladenović, N., & Taillard, E. D. (2000). Improvements and comparison of heuristics for solving the uncapacitated multisource Weber problem. Operations Research, 48(3), 444-460. Chen, M., & Ludwig, S. A. (2014). Particle swarm optimization based fuzzy clustering approach to identify optimal number of clusters. Journal of Artificial Intelligence and Soft Computing Research, 4(1), 43-56. Du, M. O., Hansen, P., Jaumard, B., & Mladenovic, N. (1999). An interior point algorithm for minimum sum-of-squares clustering. SIAM Journal on Scientific Computing, 21(4), 1485-1505. Eberhart, R., & Kennedy, J. (1995). A new optimizer using particle swarm theory. Paper presented at The Sixth International Symposium on IEEE, USA. Fischetti, M., Lancia, G., & Serafini, P. (2002). Exact algorithms for minimum routing cost trees. Networks, 39(3), 161-173. Giudici, P., & Passerone, G. (2002). Data mining of association structures to model consumer behavior. Computational Statistics & Data Analysis, 38(4), 533-541. 260 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] Greco, S., Matarazzo, B., & Slowinski, R. (1998). A new rough set approach to evaluation of bankruptcy risk. Paper presented at The Operational Tools in the Management of Financial Risks, USA. Greco, S., Matarazzo, B., & Slowinski, R. (2000). Extension of the rough set approach to multicriteria decision support. INFOR: Information Systems and Operational Research, 38(3), 161-195. Hall, L. O., Ozyurt, I. B., & Bezdek, J. C. (1999). Clustering with a genetically optimized approach. IEEE Transactions on Evolutionary Computation, 3(2), 103-112. Hansen, P., & Jaumard, B. (1997). Cluster analysis and mathematical programming. Mathematical Programming, 79(1-3), 191-215. Hansen, P., & Mladenović, N. (1999). An introduction to variable neighborhood search. Paper presented at Meta-heuristics, USA. Mehdizadeh, E., & Moghaddam, R. T. (2008). Fuzzy particle swarm optimization algorithm for a supplier clustering problem. Journal of Industrial Engineering, 1(1), 17-24. Mladenović, N., & Hansen, P. (1997). Variable neighborhood search. Computers & Operations Research, 24(11), 1097-1100. Pappas, T. N. (1992). An adaptive clustering algorithm for image segmentation. IEEE Transactions on Signal Processing, 40(4), 901-914. Pang, W., Wang, K. P., Zhou, C. G., & Dong, L. J. (2004). Fuzzy discrete particle swarm optimization for solving traveling salesman problem. Paper presented at Computer and Information Technology Conference, USA. Richter, F. (2016). Identität, Ethnizität und Nationalismus in Kurdistan. Berlin, Germany: LIT Verlag Münster. Runkler, T. A., & Bezdek, J. C. (2003). Web mining with relational clustering. International Journal of Approximate Reasoning, 32(2-3), 217-236. Runkler, T. A., & Katz, C. (2006). Fuzzy clustering by particle swarm optimization. Paper presented at Fuzzy Systems, 2006 IEEE International Conference on IEEE, USA. Salerno, J. (1997). Using the particle swarm optimization technique to train a recurrent neural model. Paper presented at Tools with Artificial Intelligence, The Ninth IEEE International Conference, USA. Song, H. S., Kyeong, K. J., & Kim, S. H. (2001). Mining the change of customer behavior in an internet shopping mall. Expert Systems with Applications, 21(3), 157-168. Stefanowski, J. (2009). Data mining-clustering [PowerPoint slides]. Retrieved from Wang, K. P., Huang, L., Zhou, C. G., & Pang, W. (2003). Particle swarm optimization for traveling salesman problem. Paper presented at Machine Learning and Cybernetics, 2003 International Conference on IEEE, USA. Nguyễn Thị Như Na 261 Weijun, X., Zhiming, W., Wei, Z., & Genke, Y. (2004). A new hybrid optimization algorithm for the job-shop scheduling problem. Paper presented at American Control Conference IEEE, USA. Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8(3), 338-353. AN APPLICATION OF FUZZY PARTICLE SWARM OPTIMIZATION FOR CUSTOMER ANALYSIS Nguyen Thi Nhu Naa* aThe Faculty of Natural Sciences, Dienbien College of Education, Laichau, Vietnam *Corresponding author: Email: nhuna.cdsp@gmail.com Article history Received: March 31st, 2017 | Received in revised form: April 21st, 2017 Accepted: May 19th, 2017 Abstract This article presents the application of the Fuzzy Particle Swarm Optimization algorithm for analyzing customer needs. Applying Fuzzy Particle Swarm Optimization algorithm to the problem of a US medical device supplier wanting to analyze the needs of 500 hospitals, in the region in terms of, medical equipment and supplies, the needs analysis assisted. The supplier offering the most suitable business strategies for each hospital to achieve higher revenues. Keywords: Clustering; Fuzzy set; Genetic; Optimal; Swarm.
File đính kèm:
- ung_dung_thuat_toan_toi_uu_tien_hoa_bay_dan_mo_trong_phan_ti.pdf