Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng

Tóm tắt
Bài báo này ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ cho bài toán phân tích nhu cầu
khách hàng. Đây là bài toán có ý nghĩa ứng dụng lớn trong hoạt động sản xuất kinh doanh.
Áp dụng thuật toán tối ưu tiến hóa bầy đàn mờ vào bài toán cụ thể là một công ty chuyên
cung cấp thiết bị y tế của Mỹ muốn phân tích nhu cầu 500 bệnh viện trong khu vực về các
thiết bị và vật tư y tế, hỗ trợ công ty đưa ra chiến lược kinh doanh phù hợp nhất với từng
bệnh viện để đạt doanh thu cao.
15 trang yennguyen 8060
Download
Bạn đang xem tài liệu "Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ trong phân tích nhu cầu khách hàng

 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT Tập 7, Số 2, 2017 247–261 247 
ỨNG DỤNG THUẬT TOÁN TỐI ƯU TIẾN HÓA BẦY ĐÀN MỜ 
TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG 
Nguyễn Thị Như Naa* 
aKhoa Tự nhiên, Trường Cao đẳng Sư phạm Điện Biên, Lai Châu, Việt Nam 
Lịch sử bài báo 
Nhận ngày 31 tháng 03 năm 2017 | Chỉnh sửa ngày 21 tháng 04 năm 2017 
Chấp nhận đăng ngày 19 tháng 05 năm 2017 
Tóm tắt 
Bài báo này ứng dụng thuật toán tối ưu tiến hóa bầy đàn mờ cho bài toán phân tích nhu cầu 
khách hàng. Đây là bài toán có ý nghĩa ứng dụng lớn trong hoạt động sản xuất kinh doanh. 
Áp dụng thuật toán tối ưu tiến hóa bầy đàn mờ vào bài toán cụ thể là một công ty chuyên 
cung cấp thiết bị y tế của Mỹ muốn phân tích nhu cầu 500 bệnh viện trong khu vực về các 
thiết bị và vật tư y tế, hỗ trợ công ty đưa ra chiến lược kinh doanh phù hợp nhất với từng 
bệnh viện để đạt doanh thu cao. 
Từ khóa: Bầy đàn; Di truyền; Phân cụm; Tập mờ; Tiến hóa; Tối ưu. 
1. ĐẶT VẤN ĐỀ 
Phân tích nhu cầu khách hàng là một việc rất quan trọng trong kinh doanh, phân 
tích nhu cầu khách hàng, phân khúc thị trường, xác định nhu cầu biến động của khách 
hang... Các thông tin thu được sử dụng để hỗ trợ các doanh nghiệp đưa ra chiến lược kinh 
doanh hiệu quả. Cụ thể, bài toán thực tế phân tích nhu cầu khách hàng là một công ty 
chuyên cung cấp các thiết bị y tế cho 500 bệnh viện ( 
~cabrera/sc/cs8/cs8.html) ở Mỹ muốn tìm giải pháp để tăng doanh số bán hàng. Phân tích 
nhu cầu tiêu thụ các thiết bị y tế của các bệnh viện ở Mỹ tìm ra bệnh viện có mức tiêu thụ 
loại thiết bị y tế nào cao nhằm đưa ra chiến lược kinh doanh phù hợp với từng bệnh viện 
để tăng hiệu quả kinh doanh. Dữ liệu đầu vào bài toán là 500 bệnh viện ở Mỹ được tổ 
chức trong tập tin Customer.xls bao gồm 19 trường và 4000 bản ghi. 
Dữ liệu đầu ra bài toán là phân tích 500 bệnh viện thành 3 nhóm với mức tiêu thụ 
* Tác giả liên hệ: Email: [email protected] 
248 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
thiết bị y tế khác nhau: Bệnh viện có mức tiêu thụ thiết bị y tế thấp; Bệnh viện có mức 
tiêu thụ thiết bị y tế trung bình; Bệnh viện có mức tiêu thụ thiết bị y tế cao. 
19 trường trong tập tin bao gồm các mã như sau: 
1. ZIP: Mã bưu điện 
2. HID: ID bệnh viện 
3. CITY: Tên thành phố 
4. STATE: Tên tiểu bang 
5. BEDS: Số giường bệnh 
6. RBEDS: Số giường chỉnh hình 
7. OUT-V: số lượt khám ngoại trú 
8. ADM: Chi phí hành chính (1000 $/năm) 
9. SIR: Thu từ nội trú 
10. SALESY: Bán trang thiết bị phục hồi chức năng từ ngày 1 tháng 1 
11. SALES12: Bán trang thiết bị phục hồi chức năng cuối tháng 12 
12. HIP95: Số hoạt động cho hông trong năm 1995 
13. KNEE95: Số hoạt động đầu gối trong năm 1995 
14. TH: Có hoạt động dạy học không? 0, 1 
15. TRAUMA: Có chấn thương không? 0, 1 
16. REHAB: Có chỉnh hình không? 0, 1 
17. HIP96: Số hoạt động cho hông cho năm 1996 
18. KNEE96: Số hoạt động đầu gối cho năm 1996 
19. FEMUR96: Số hoạt động cho xương đùi cho năm 1996. 
Có nhiều cách tiếp cận để giải quyết bài toán phân tích nhu cầu khách hàng như 
là cách tiếp cận thống trị dựa trên tập rõ (DRSA) được phát triển bởi Greco, Matarazzo, 
và Slowinski (1998) và Greco, Matarazzo, và Slowinski (2000) rất hữu ích để giảm dữ 
Nguyễn Thị Như Na 249 
liệu trong phân tích định tính. Cách tiếp cận phân tích giỏ hàng (MBA) của Giudici và 
Passerone (2002) xác định mối liên hệ giữa khách hàng và các sản phẩm khác nhau trong 
một đơn vị đặc biệt như là bên trong một siêu thị. Các dữ liệu được phân tích trong MBA 
thường bao gồm tất cả các giao dịch mua hàng được thực hiện trong một khoảng thời gian 
nhất định để phân tích cấu trúc kết hợp giữa việc bán sản phẩm khác nhau có sẵn dựa vào 
đó doanh nghiệp lên kế hoạch cho các chính sách tiếp thị tốt hơn. Cách tiếp cận cho bài 
toán phân tích nhu cầu khách hàng mua bán trên Internet (Song, Kyeong, & Kim, 2001) 
sử dụng độ đo tượng tự và độ đo khác nhau cho các thay đổi của khách hàng, sau đó đánh 
giá độ đo thay đổi để đưa ra quy tắc thay đổi giúp các nhà quản lý đưa ra chiến lược kinh 
doanh phù hợp cho từng đối tượng khách hàng dựa trên số liệu kinh doanh cụ thể. 
Phân cụm được coi như một công cụ độc lập để xem xét phân bố dữ liệu, làm 
bước tiền xử lý cho các thuật toán khác. Phân cụm ứng dụng rất nhiều trong các lĩnh vực 
như phân tích hình ảnh (Pappas, 1992), thông tin địa lý (Aksoy, 2006), khai phá web 
(Runkler & Bezdek, 2003)  Phương pháp phân cụm mờ là sự kết hợp của kỹ thuật phân 
cụm với lý thuyết mờ của Zadeh (1965) đang phát triển và được ứng dụng rộng rãi trong 
thực tiễn, ví dụ như phân tích rủi ro, dự báo nguy cơ phá sản cho ngân hàng và nhiều bài 
toán khác. Nhưng những vấn đề được quan tâm nhiều vẫn là nâng cao chất lượng phân 
cụm (Chen & Ludwig, 2014), tính toán thông qua một số độ đo chất lượng cụ thể Và 
một số nghiên cứu ứng dụng thuật toán tối ưu tiến hóa phân cụm mờ như là nghiên cứu 
phân cụm mờ bằng PSO (Runkler & Katz, 2006) giải quyết bài toán phân cụm mờ bằng 
cực tiểu hóa mô hình Fuzzy C – Means (FCM), ứng dựng trên bộ dữ liệu bệnh ung thư 
phổi. Nghiên cứu về vấn đề phát hiện, định vị trực quan các tín hiệu không cố định của 
Biswal, Dash, và Panigrahi (2009). Các nghiên cứu dựa trên tối ưu tiến hóa mờ để giải 
bài toán phân tích nhu cầu khách hàng như trên là rất ít. 
Bài báo này sẽ áp dụng thuật toán tối ưu tiến hóa mờ do Pang, Wang, Zhou, và 
Dong (2004) đề xuất cho bài toán phân cụm mờ để xác định nghiệm tối ưu toàn cục cho 
bài toán phân tích nhu cầu khách hàng. Với dữ liệu thực tế một công ty chuyên cung cấp 
các thiết bị y tế Mỹ muốn phân tích nhu cầu khách hàng là 500 bệnh viện trong khu vực 
để có kế hoạch và chiến lược kinh doanh phù hợp nhất cho từng đối tượng khách hàng, 
thích ứng với nhu cầu khách hàng mà đạt được doanh thu cao. Thuật toán tối ưu hóa bầy 
250 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
đàn mờ (FPSO) (Pang và ctg., 2004) dựa trên thuật toán tối ưu bầy đàn cho bài toán người 
bán hàng. Thuật toán tối ưu bầy đàn (PSO) được Eberhart và Kennenday (1995) giới thiệu 
thuộc về lớp các bài toán tiến hóa, dựa trên khái niệm trí tuệ bầy đàn để giải bài toán tối 
ưu tiến hóa. PSO được áp dụng rộng rãi để cải tiến hiệu suất các thuật toán khác. Các ứng 
dụng như là bài toán lập kế hoạch (Weijun, Zhiming, Wei, & Genke, 2004), người bán 
hàng (Wang, Huang, Zhou, & Pang, 2003). 
Bài báo này ứng dụng thuật toán tối ưu tiến hóa phân cụm mờ cho công ty ở Mỹ 
chuyên cung cấp thiết bị y tế cho 500 bệnh viện khu vực, muốn phân tích nhu cầu về vật 
tư và thiết bị y tế của các bệnh viện trên. Kết quả thực nghiệm thu được 3 cụm khách 
hàng với các mức tiêu thụ vật tư và thiết bị y tế khác nhau, dựa vào đó công ty có cơ sở 
khoa học đưa ra giải pháp chiến lược kinh doanh phù hợp nhất cho từng nhóm đối tượng 
và từng đối tượng khách hàng làm tăng hiệu quả hoạt động kinh doanh. Ngoài ra, ứng 
dụng của thuật toán này có thể mở rộng không chỉ cho công ty chuyên cung cấp các thiết 
bị y tế mà còn có thể ứng dụng cho các doanh nghiệp kinh doanh sản xuất các mặt hàng 
khác. 
2. THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ 
2.1. Phương pháp phân cụm mờ 
Bài toán phân cụm N vector 1 2, ,..., NX x x x thành c cụm dựa trên tính toán 
tối thiểu hóa hàm mục tiêu để đo chất lượng của cụm và tìm tâm cụm sao cho hàm độ đo 
không tương tự là nhỏ nhất. Một phân cụm mờ vector 1 2, ,..., NX x x x được biểu diễn 
bởi ma trận  ki N cU U sao cho một điểm dữ liệu có thể thuộc về nhiều nhóm và được 
xác định bằng giá trị hàm thuộc u . Ma trận giá trị hàm thuộc có dạng như sau: 
11 1
1
c
N Nc
u u
U
u u
 (1)
Thuật toán phân cụm mờ đã được xuất phát từ việc cực tiểu giá trị hàm mục tiêu: 
Nguyễn Thị Như Na 251 
1 1
( , z )
N c
m
m kj k j
k j
J u d x
 
 (2)
Trong đó: ( , z )k jd x là một độ đo không tương tự. 
Giải bài toán ( , ) minmJ u z với ràng buộc sau: 
1
1
0 1
1
0
kj
c
kj
j
N
kj
k
u
u
u N


 (3)
2.2. Áp dụng thuật toán tối ưu bầy đàn cho phân cụm mờ (FPSO) 
Pang và ctg. (2004) đã đề xuất thuật toán tối ưu bầy đàn mờ. Trong thuật toán này 
vị trí và vận tốc của các cá thể xác định lại tương ứng với các biến mờ. Phương pháp này 
mô tả cho bài toán phân cụm mờ. 
Với X là vị trí các cá thể, thể hiện mối quan hệ mờ của các đối tượng dữ liệu. 
Tâm cụm 1 2, ,..., cZ z z z , X được biểu diễn như sau: 
11 1
1
c
N Nc
X
 
 
 (4)
Trong đó: ij là một hàm thuộc của cá thể i thuộc cụm j : 
 ij
ij
1
0,1 , 1,2,..., ; 1,2,...,c
1, 1,2,...,
c
j
i N j
i N


   
  
 (5) 
Ma trận vị trí của mỗi cá thể giống ma trận mờ  trong thuật toán FCM. Ngoài 
ra, vận tốc của mỗi cá thể là ma trận N dòng và c cột, các cá thể của ma trận trong phạm 
vi [-1, 1]. 
252 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
11 1
1
c
N Nc
v v
V
v v
 (6)
Ta có công thức (7) cập nhật vị trí và vận tốc của các cá thể: 
1 1 2 2( 1) w.V(t) + (c )( ( ) ( )) (c )( ( ) ( ))
X(t 1) ( ) ( 1)
V t r pbest t X t r gbest t X t
X t V t
  (7)
Sau khi cập nhật ma trận vị trí của cá thể, có thể không thỏa mãn điều kiện như 
trong (8). Vì vậy phải chuẩn hóa ma trận vị trí. 
 ij
ij
1
0,1 , 1,2,..., ; 1,2,...,c
1, 1,2,...,
c
j
i N j
i N


   
   (8)
Để chuẩn hóa ta chuyển các số âm trong ma trận thành 0. Nếu các cá thể trên một 
hàng của ma trận là 0, chúng cần chuẩn hóa lại bằng cách lấy ngẫu nhiên trong [0,1], ta 
có ma trận được chuẩn hóa được biểu diễn như trong (9). 
11 1 1 11 1
1 1 1
or
c c
j c jj j
c c
N Nj Nc Njj j
Xn mal
   
   
 
 
 (9)
Thuật toán FPSO cũng tương tự như các thuật toán cải tiến khác, đều cần một hàm 
đánh giá kết quả tổng quát gọi là hàm độ đo thích nghi. Công thức (10) là hàm độ đo thích 
nghi sử dụng để đánh giá các kết quả. 
( )
m
K
f X
J
 (10)
Trong đó K là hằng số; mJ là hàm mục tiêu 
2
ij
1 1
( , Z)
N c
m
m i j
i j
J x z 
  
Nguyễn Thị Như Na 253 
Từ các công thức trên, ta có thuật toán FPSO như sau: 
Bước 1. Khởi tạo tham số 1 2, , , wP c c và tham số đếm vòng lặp tối đa Maxinter. 
Bước 2. Tạo P cá thể trong quần thể ( , ,X pbest gbest , V ma trận N c cá thể). 
Bước 3. Khởi tạo ,V,X pbest cho mỗi cá thể và gbest cho quần thể. 
Bước 4. Tính các tâm cụm cho mỗi cá thể bằng công thức (11): 
ij 1
j
ij1
N m
ii
N m
i
x
z



 (11)
Bước 5. Tính giá trị hàm độ đo thích nghi cho mỗi cá thể bằng công thức (10). 
Bước 6. Tính pbest cho mỗi cá thể. 
Bước 7. Tính gbest cho quần thể. 
Bước 8. Cập nhật ma trận vận tốc cho mỗi cá thể bằng công thức (9). 
Bước 9. Cập nhật ma trận vị trí cho mỗi cá thể bằng công thức (7). 
Bước 10. Nếu thỏa gặp điều kiện kết thúc, quay lại Bước 4. 
Điều kiện kết thúc là số lần lặp tối đa hoặc giá trị trong vòng lặp không cải 
thiện nữa. 
2.3. Ưu điểm và nhược điểm của bài toán 
Thuật toán FPSO là sự kết hợp ưu điểm của thuật toán FCM, dễ dàng giải quyết 
các bài toán tối ưu hàm mục tiêu khác nhau của thuật toán PSO để phân cụm trong môi 
trường mờ. Hiệu suất tốt hơn so với một số thuật toán phân cụm mờ như FCM. Sử dụng 
FPSO dễ dàng giải quyết các bài toán phân cụm mờ, tối ưu hóa tổ hợp khó giải quyết 
trong phạm vi lớn trong môi trường mờ (Mehdizadeh & Moghaddam, 2008). Tuy nhiên, 
nhược điểm là thuật toán FPSO hội tụ chậm hơn so với thuật toán phân cụm mờ FCM. 
gbest
254 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
3. KẾT QUẢ THỰC NGHIỆM 
Thuật toán chạy với tham số cụm c=3 với nhãn các cụm như sau: Bệnh viện có 
mức tiêu thiết bị y tế thấp, trung bình, cao. Tham số mờ m=2, tiêu chuẩn hội tụ (epsilon) 
Eps = 0.01, và số lần lặp tối đa MaxTest =1000. Quy tắc: Khách hàng sẽ thuộc về cụm 
mà có độ thuộc lớn nhất. Nếu có hai độ thuộc lớn nhất bằng nhau trở lên thì chọn một 
trong số các cụm đó để đưa vào. 
Cụm 1. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ 
thuộc: ID(37011) với độ thuộc (0.3723); ID(55511) và độ thuộc (0.3728); ID(24016) và 
độ thuộc (0.3698); ID(2016) và độ thuộc (0.3763); ID(53016) và độ thuộc (0.3764) cụ 
thể ở Bảng 1. 
Cụm 2. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ 
thuộc: ID(1104) với độ thuộc (0.4234); ID(1602) với độ thuộc (0.4517); ID(1605) với độ 
thuộc (0.2738); ID(1801) với độ thuộc (0.4082); ID(1830) với độ thuộc (0.4662); 
ID(1841) với độ thuộc (0.4303) cụ thể ở Bảng 2. 
Cụm 3. Gồm những khách hàng là những bệnh viện có mã bệnh viện ID và độ 
thuộc: ID(43014) với độ thuộc (0.4406); ID(21514) độ thuộc (0.4469); ID(46014) với độ 
thuộc (0.4402); ID(62014) với độ thuộc (0.4859); ID(78014) với độ thuộc (0.4938); 
ID(20901) với độ thuộc (0.48844); ID(153014) với độ thuộc (0.4874); ID(174014) với 
độ thuộc (0.4083) cụ thể ở Bảng 3. 
Xây dựng hàm thuộc cho các biến ngôn ngữ. Trước hết xác định biến ngôn ngữ: 
RBEDS = {RBEDS thấp; RBEDS cao} 
OUT_V = {OUT_V thấp; OUT_V cao} 
ADM = {ADM thấp; ADM cao} 
SIR = {SIR thấp; SIR cao} 
SALESY = {SALESY thấp; SALESY cao} 
Nguyễn Thị Như Na 255 
SALES12 = {SALES12 thấp; SALES12 cao} 
HIP95 = {HIP95 thấp; HIP95 cao} 
KNEE95 = {KNEE95 thấp; KNEE95 cao} 
HIP96 = {HIP96 thấp; HIP96 cao} 
KNEE96 = {KNEE96 thấp; KNEE96 cao} 
FEMUR96 = {FEMUR96 thấp; FEMUR96 cao} 
Không gian tham chiếu của các thuộc tính được 
thể hiện ở Bảng 4. 
Xác định hàm thuộc cho các biến ngôn ngữ: Với 
biến X, và không gian tham chiếu U = [0, u]. Khi đó: X 
cao ( x ) / ;0x u x u , X thấp (x) = 1 - x/u. Ví dụ: 
Với thuộc tính BEDS: 0 BEDS 1476; với BEDS = 
1001 thì BEDS cao (1001) =1001/ 1476 = 0.678184; 
BEDS thấp = 1- 0.678184. Tương tự với các thuộc tính 
còn lại. 
Xác định luật mờ: (Theo MISO - với n đầu vào 
và 1 đầu ra) 
• Luật 1. Nếu BEDS cao và RBEDS cao và 
OUT_V cao và REHAB cao thì tiêu thụ 
mức cao. 
• Luật 2. Nếu RBED và OUT_V và SIR cao 
và HIP95 cao thì tiêu thụ mức cao. 
B
ả
n
g
 1
. B
ện
h
 v
iện
 th
u
ộ
c C
ụ
m
 1
ID
B
E
D
S
R
B
E
D
S
O
U
T
 -V
A
D
M
S
IR
S
A
L
E
S
Y
S
A
L
E
S
1
2
H
IP
9
5
K
N
E
E
9
5
T
H
T
R
A
U
M
A
R
E
H
A
B
H
IP
9
6
K
N
E
E
9
6
F
E
M
U
R
9
6
3
7
0
1
1
2
5
0
1
2
1
0
7
2
9
7
9
2
0
3
5
5
0
3
1
1
6
6
4
6
1
0
1
9
1
4
7
6
2
5
5
5
1
2
3
6
2
5
2
6
3
1
8
9
7
8
9
1
6
7
4
8
3
3
6
6
5
6
1
0
1
6
5
7
0
5
2
2
4
0
1
6
1
5
5
1
0
5
3
3
9
8
7
5
3
0
6
4
2
6
1
1
3
8
2
4
1
0
1
5
4
3
9
5
7
2
0
1
6
4
7
5
1
3
6
3
6
5
6
1
7
4
2
4
1
0
9
4
0
0
0
1
5
4
1
1
2
1
0
1
1
4
7
1
2
4
1
3
7
5
3
0
1
6
3
2
0
1
8
4
8
5
5
6
1
1
9
3
5
1
1
1
8
5
8
1
6
1
2
6
4
7
1
0
1
1
4
5
8
0
1
2
7
256 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
B
ả
n
g
 2
. B
ện
h
 v
iện
 th
u
ộ
c C
ụ
m
 2
ID
B
E
D
S
R
B
E
D
S
O
U
T
-V
A
D
M
S
IR
S
A
L
E
S
Y
S
A
L
E
S
1
2
H
IP
9
5
K
N
E
E
9
5
T
H
T
R
A
U
M
A
R
E
H
A
B
H
IP
9
6
K
N
E
E
9
6
F
E
M
U
R
9
6
1
1
0
4
3
2
4
0
9
5
7
0
2
1
0
4
0
6
1
3
6
4
8
2
8
2
9
1
2
2
9
4
0
0
0
1
5
2
9
5
1
1
6
1
6
0
2
8
0
8
0
0
9
0
7
0
3
1
8
4
9
1
0
0
0
0
1
0
0
0
1
6
0
5
2
1
1
0
9
2
7
5
7
5
7
1
1
5
7
6
6
2
7
7
5
1
3
2
0
9
1
4
3
1
0
0
2
0
7
1
7
8
1
7
7
1
8
0
1
8
2
8
2
0
4
4
0
0
5
0
8
2
0
0
0
0
1
0
0
0
1
8
3
0
1
5
1
0
2
5
5
5
0
6
1
9
9
5
2
5
7
1
2
1
6
4
0
1
5
0
0
0
3
9
1
9
8
7
1
8
4
1
2
9
0
0
9
2
7
6
8
8
6
6
2
5
3
8
8
5
6
9
6
5
5
2
6
0
0
0
4
9
4
0
8
0
B
ả
n
g
 3
. B
ện
h
 v
iện
 th
u
ộ
c C
ụ
m
 3
ID
B
E
D
S
R
B
E
D
S
O
U
T
 -V
A
D
M
S
IR
S
A
L
E
S
Y
S
A
L
E
S
1
2
H
IP
9
5
K
N
E
E
9
5
T
H
T
R
A
U
M
A
R
E
H
A
B
H
IP
9
6
K
N
E
E
9
6
F
E
M
U
R
9
6
4
3
0
1
4
1
0
0
5
0
5
0
4
1
2
5
3
4
2
1
4
2
7
8
3
0
0
2
5
0
4
2
7
1
1
1
0
5
1
9
2
8
9
3
0
3
2
1
5
1
4
7
1
0
0
4
2
1
4
5
6
3
7
7
4
5
2
5
7
9
6
0
0
4
6
1
4
5
8
1
1
0
4
3
7
3
7
2
1
6
9
4
6
0
1
4
2
1
9
0
4
7
0
3
6
7
8
2
9
9
1
6
3
6
1
8
6
6
3
4
6
3
1
0
0
6
1
8
4
1
0
5
1
6
2
0
1
4
3
9
1
0
0
1
4
5
9
4
8
8
5
2
7
1
3
8
2
4
9
1
1
0
8
0
4
7
7
7
7
8
0
1
4
2
9
0
0
7
2
0
6
1
1
1
7
6
7
7
4
2
6
0
0
7
8
5
1
1
0
0
1
0
1
5
3
1
0
3
2
0
9
0
1
4
2
7
5
0
1
1
8
7
9
1
8
7
8
8
6
4
7
3
1
1
5
5
1
3
0
1
0
0
5
2
3
2
6
8
1
5
3
0
1
4
3
2
1
0
6
6
0
6
1
1
7
4
7
5
9
3
7
5
0
0
1
0
4
9
3
1
1
0
1
0
2
6
0
1
0
9
B
ả
n
g
 4
. K
h
ô
n
g
 g
ia
n
 th
a
m
 ch
iếu
 củ
a
 cá
c th
u
ộ
c tín
h
B
E
D
S
R
B
E
D
S
O
U
T
 -V
A
D
M
S
IR
S
A
L
E
S
Y
S
A
L
E
S
1
2
H
IP
9
5
K
N
E
E
9
5
T
H
T
R
A
U
M
A
R
E
H
A
B
H
IP
9
6
K
N
E
E
9
6
F
E
M
U
R
9
6
M
in
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
M
ax
1
4
7
6
8
5
0
1
9
8
7
0
0
0
6
6
4
4
0
7
0
3
0
0
1
2
0
9
2
7
7
0
1
4
2
1
8
6
8
1
1
1
1
3
7
3
1
0
8
1
4
8
9
Nguyễn Thị Như Na 257 
• Luật 3. Nếu BEDS cao và RBEDS thấp và HIP95 cao và KNEE95 cao thì 
tiêu thụ mức trung bình. 
• Luật 4. Nếu BEDS thấp và RBEDS cao và HIP95 thấp và KNEE95 thấp thì 
tiêu thụ mức thấp. 
• Luật 5. Nếu BEDS cao và RBEDS thấp và HIP96 cao và KNEE96 cao thì 
tiêu thụ mức trung bình. 
• Luật 6. Nếu BEDS thấp và RBEDS cao và HIP96 thấp và KNEE96 thấp thì 
tiêu thụ mức thấp. 
• Luật 7. Nếu BEDS thấp và RBEDS cao và OUT_Vcao và REHAB thấp thì 
tiêu thụ mức thấp. 
• Luật 8. Nếu BEDS thấp và RBEDS thấp và TH cao và REHAB cao thì tiêu 
thụ ở mức trung bình. 
• Luật 9. Nếu BEDS cao và RBEDS thấp và TH cao và REHAB cao thì tiêu 
thụ ở mức cao. 
• Luật 10. Nếu BEDS cao và RBEDS thấp và HIP96 cao và KNEE96 cao thì 
tiêu thụ ở mức cao. 
• Luật 11. Nếu BEDS thấp và RBEDS thấp và SALELY cao và SALES12 cao 
thì tiêu thụ ở mức thấp. 
• Luật 12. Nếu BEDS cao và RBEDS cao và SALELY cao và SALES12 cao 
thì tiêu thụ ở mức cao. 
Qua tính toán với số liệu cụ thể ở các bảng trên cho thấy: 
Cụm 1 là nhóm các bệnh viện có các chỉ số RBEDS (số giường chỉnh hình) cao 
và chỉ số REHAB (có chỉnh hình) thường xuyên, có chỉ số TH (có hoạt động dạy học) 
thường xuyên. Các chỉ số khác của các thuộc tính ở mức trung bình. Cụm 1 là cụm các 
bệnh viện có mức tiêu thụ thiết bị y tế mức trung bình. 
258 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
Cụm 2 là nhóm các bệnh viện có chỉ số SALELY (bán trang thiết bị phục hồi chức 
năng ngày 1 tháng 1) và chỉ số SALES12 (bán trang thiết bị phục hồi chức năng cuối 
tháng 12) cao hơn. Các chỉ số khác của các thuộc tính ở mức thấp. Cụm 2 là cụm các 
bệnh viện có mức tiêu thụ thiết bị y tế mức thấp. 
Cụm 3 là nhóm các bệnh viện có chỉ số ADM (chi phí hành chính), SIR (thu từ 
nội trú), HIP95 (số hoạt động cho hông năm 1995), KNEE95 (số hoạt động cho đầu gối 
năm 1995), TH (có hoạt động dạy học), HIP96 (số hoạt động cho hông năm 1996), 
KNEE96 (số hoạt động cho đầu gối năm 1996), FEMUR96 (số hoạt động cho xương đùi 
năm 1996) cao hơn. Cụm 3 là cụm các bệnh viện có mức tiêu thụ thiết bị y tế mức cao. 
Vậy để tăng doanh thu cho công ty kinh doanh các thiết bị y tế, công ty sẽ tập 
trung vào 3 nhóm khách hàng với những chiến lược khác nhau cho từng nhóm. Với nhóm 
1, công ty tập trung vào cung cấp các thiết bị liên quan đến hoạt động chỉnh hình và các 
thiết bị phục vụ cho quá trình học tập và đào tạo chuyên môn. Với nhóm 2, công ty tập 
trung cung cấp các trang thiết bị liên quan đến phục hồi chức năng. Với nhóm 3, có chi 
phí hành chính, thu từ nội trú khá cao, các chỉ số khác tương đối cao so với hai nhóm trên, 
có thể nói nhóm 3 là nhóm khách hàng tiềm năng có khả năng tiêu thụ nhiều thiết bị y tế 
phục vụ cho các hoạt động chữa bệnh như: Hoạt động cho hông, hoạt động cho đầu gối, 
hoạt động cho xương đùi, và các trang thiết bị liên quan đến hoạt động học tập và đào tạo 
chuyên môn. Cung cấp và phân phối các thiết bị y tế phù hợp cho từng nhóm ở trên, công 
ty kinh doanh sẽ nhanh chóng thúc đẩy quá trình bán hàng và từ đó doanh thu sẽ tăng cao 
hơn. 
4. KẾT LUẬN 
Bài toán phân tích nhu cầu khách hàng là bài toán có tính ứng dụng cao, có ý nghĩa 
quan trọng trong hoạt động sản xuất kinh doanh. Bài toán phân tích nhu cầu khách hàng 
đã được giải quyết trên thuật toán tối ưu tiến hóa phân cụm mờ. 
Thuật toán tối ưu tiến hóa mờ được phát triển từ thuật toán tối ưu tiến hóa trên 
môi trường mờ đã được ứng dụng trong bài toán phân tích nhu cầu khách hàng cụ thể là 
của một công ty chuyên cung cấp các thiết bị y tế cho 500 bệnh viện khu vực. Công ty 
Nguyễn Thị Như Na 259 
muốn phân tích nhu cầu tiêu thụ khác nhau về thiết bị và vật tư y tế của các bệnh viện. 
500 bệnh viện được phân thành 3 cụm với các mức tiêu thụ vật tư và thiết bị y tế khác 
nhau: Bệnh viện có mức tiêu thiết bị y tế thấp; Bệnh viện có mức tiêu thụ thiết bị y tế 
trung bình; Bệnh viện có mức tiêu thụ thiết bị y tế cao. Từ đó, công ty đã có cơ sở để đưa 
ra chiến lược kinh doanh phù hợp nhất đáp ứng nhu cầu từng nhóm bệnh viện và từng 
bệnh viện cụ thể để hoạt động kinh doanh đạt hiệu quả và lợi nhuận cao. Hướng phát triển 
tiếp theo, chúng tôi sẽ áp dụng thuật toán trên trong nhiều lĩnh vực, như là hỗ trợ ra quyết 
định, thông tin địa lý, xử lý ảnh, v.v. 
TÀI LIỆU THAM KHẢO 
Angeline, P. J. (1995). Adaptive and self-adaptive evolutionary computations. Paper 
presented at The Computational Intelligence: A Dynamic Systems Perspective, 
USA. 
Aksoy, E. (2006). Clustering with GIS: An attempt to classify Turkish district data. Paper 
presented at The XXIII FIG Congress, Germany. 
Bezdek, J. C. (2013). Pattern recognition with fuzzy objective function algorithms. Berlin, 
Germany: Springer Science & Business Media. 
Biswal, B., Dash, P. K., & Panigrahi, B. K. (2009). Power quality disturbance 
classification using fuzzy C-means algorithm and adaptive particle swarm 
optimization. IEEE Transactions on Industrial Electronics, 56(1), 212-220. 
Bùi, C. C., & Nguyễn, D. P. (2006). Hệ mờ mạng nơron và ứng dụng. Hà Nội, Việt Nam: 
NXB Khoa học và Kỹ thuật. 
Brimberg, J., Hansen, P., Mladenović, N., & Taillard, E. D. (2000). Improvements and 
comparison of heuristics for solving the uncapacitated multisource Weber 
problem. Operations Research, 48(3), 444-460. 
Chen, M., & Ludwig, S. A. (2014). Particle swarm optimization based fuzzy clustering 
approach to identify optimal number of clusters. Journal of Artificial Intelligence 
and Soft Computing Research, 4(1), 43-56. 
Du, M. O., Hansen, P., Jaumard, B., & Mladenovic, N. (1999). An interior point algorithm 
for minimum sum-of-squares clustering. SIAM Journal on Scientific Computing, 
21(4), 1485-1505. 
Eberhart, R., & Kennedy, J. (1995). A new optimizer using particle swarm theory. Paper 
presented at The Sixth International Symposium on IEEE, USA. 
Fischetti, M., Lancia, G., & Serafini, P. (2002). Exact algorithms for minimum routing 
cost trees. Networks, 39(3), 161-173. 
Giudici, P., & Passerone, G. (2002). Data mining of association structures to model 
consumer behavior. Computational Statistics & Data Analysis, 38(4), 533-541. 
260 TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT [ĐẶC SAN CÔNG NGHỆ THÔNG TIN] 
Greco, S., Matarazzo, B., & Slowinski, R. (1998). A new rough set approach to evaluation 
of bankruptcy risk. Paper presented at The Operational Tools in the Management 
of Financial Risks, USA. 
Greco, S., Matarazzo, B., & Slowinski, R. (2000). Extension of the rough set approach to 
multicriteria decision support. INFOR: Information Systems and Operational 
Research, 38(3), 161-195. 
Hall, L. O., Ozyurt, I. B., & Bezdek, J. C. (1999). Clustering with a genetically optimized 
approach. IEEE Transactions on Evolutionary Computation, 3(2), 103-112. 
Hansen, P., & Jaumard, B. (1997). Cluster analysis and mathematical programming. 
Mathematical Programming, 79(1-3), 191-215. 
Hansen, P., & Mladenović, N. (1999). An introduction to variable neighborhood search. 
Paper presented at Meta-heuristics, USA. 
Mehdizadeh, E., & Moghaddam, R. T. (2008). Fuzzy particle swarm optimization 
algorithm for a supplier clustering problem. Journal of Industrial Engineering, 
1(1), 17-24. 
Mladenović, N., & Hansen, P. (1997). Variable neighborhood search. Computers & 
Operations Research, 24(11), 1097-1100. 
Pappas, T. N. (1992). An adaptive clustering algorithm for image segmentation. IEEE 
Transactions on Signal Processing, 40(4), 901-914. 
Pang, W., Wang, K. P., Zhou, C. G., & Dong, L. J. (2004). Fuzzy discrete particle swarm 
optimization for solving traveling salesman problem. Paper presented at 
Computer and Information Technology Conference, USA. 
Richter, F. (2016). Identität, Ethnizität und Nationalismus in Kurdistan. Berlin, Germany: 
LIT Verlag Münster. 
Runkler, T. A., & Bezdek, J. C. (2003). Web mining with relational 
clustering. International Journal of Approximate Reasoning, 32(2-3), 217-236. 
Runkler, T. A., & Katz, C. (2006). Fuzzy clustering by particle swarm optimization. Paper 
presented at Fuzzy Systems, 2006 IEEE International Conference on IEEE, USA. 
Salerno, J. (1997). Using the particle swarm optimization technique to train a recurrent 
neural model. Paper presented at Tools with Artificial Intelligence, The Ninth 
IEEE International Conference, USA. 
Song, H. S., Kyeong, K. J., & Kim, S. H. (2001). Mining the change of customer behavior 
in an internet shopping mall. Expert Systems with Applications, 21(3), 157-168. 
Stefanowski, J. (2009). Data mining-clustering [PowerPoint slides]. Retrieved from 
Wang, K. P., Huang, L., Zhou, C. G., & Pang, W. (2003). Particle swarm optimization 
for traveling salesman problem. Paper presented at Machine Learning and 
Cybernetics, 2003 International Conference on IEEE, USA. 
Nguyễn Thị Như Na 261 
Weijun, X., Zhiming, W., Wei, Z., & Genke, Y. (2004). A new hybrid optimization 
algorithm for the job-shop scheduling problem. Paper presented at American 
Control Conference IEEE, USA. 
Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8(3), 338-353. 
AN APPLICATION OF FUZZY PARTICLE SWARM 
OPTIMIZATION FOR CUSTOMER ANALYSIS 
Nguyen Thi Nhu Naa* 
 aThe Faculty of Natural Sciences, Dienbien College of Education, Laichau, Vietnam 
*Corresponding author: Email: [email protected] 
Article history 
Received: March 31st, 2017 | Received in revised form: April 21st, 2017 
Accepted: May 19th, 2017 
Abstract 
This article presents the application of the Fuzzy Particle Swarm Optimization algorithm for 
analyzing customer needs. Applying Fuzzy Particle Swarm Optimization algorithm to the 
problem of a US medical device supplier wanting to analyze the needs of 500 hospitals, in 
the region in terms of, medical equipment and supplies, the needs analysis assisted. The 
supplier offering the most suitable business strategies for each hospital to achieve higher 
revenues. 
Keywords: Clustering; Fuzzy set; Genetic; Optimal; Swarm.
File đính kèm:
ung_dung_thuat_toan_toi_uu_tien_hoa_bay_dan_mo_trong_phan_ti.pdf