Ứng dụng phân cụm trừ mờ cho bài toán nhận dạng hệ điều khiển tự động từ dữ liệu

TÓM TẮT

Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng

quá trình và điều khiển. Các hệ thống mờ có thể đƣợc thiết kế từ tri thức chuyên gia hoặc từ dữ

liệu. Mỗi phƣơng pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó. Trong bài báo này

chúng tôi trình bày quá trình xây dựng hệ luật mờ cho hệ mờ từ dữ liệu trong nhận dạng các hệ

động lực học. Có nhiều cách tiếp cận khác nhau nhƣng bài báo tập trung vào phân tích phƣơng

pháp phân cụm trừ để tạo ra các luật mờ.

5 trang yennguyen 15880 Free

Download

Bạn đang xem tài liệu "Ứng dụng phân cụm trừ mờ cho bài toán nhận dạng hệ điều khiển tự động từ dữ liệu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ứng dụng phân cụm trừ mờ cho bài toán nhận dạng hệ điều khiển tự động từ dữ liệu

Trần Mạnh Tuấn và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 73 - 77
73
ỨNG DỤNG PHÂN CỤM TRỪ MỜ
CHO BÀI TOÁN NHẬN DẠNG HỆ ĐIỀU KHIỂN TỰ ĐỘNG TỪ DỮ LIỆU
Trần Mạnh Tuấn1*, Lê Bá Dũng2
1Trường ĐH Công nghệ thông tin và Truyền thông - ĐHTN
2Viện Công Nghệ Thông tin
TÓM TẮT
Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng
quá trình và điều khiển. Các hệ thống mờ có thể đƣợc thiết kế từ tri thức chuyên gia hoặc từ dữ
liệu. Mỗi phƣơng pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó. Trong bài báo này
chúng tôi trình bày quá trình xây dựng hệ luật mờ cho hệ mờ từ dữ liệu trong nhận dạng các hệ
động lực học. Có nhiều cách tiếp cận khác nhau nhƣng bài báo tập trung vào phân tích phƣơng
pháp phân cụm trừ để tạo ra các luật mờ.
Từ khóa: phân cụm trừ mờ, hệ nhận dạng, điều khiển mờ
PHẦN MỞ ĐẦU*
Sự phát triển nhanh chóng các hệ thống thông
tin nhƣ hiện nay, thì hệ mờ đƣợc áp dụng
thành công trong nhiều lĩnh vực nhƣ điều
khiển tự động, phân lớp dữ liệu, phân tích
việc ra quyết định, các hệ chuyên gia, các cơ
sở dữ liệu mờ. Hệ luật mờ xây dựng từ tri
thức nói chung hay hệ suy luận mờ nói riêng
đƣợc xây dựng theo suy diễn của con ngƣời,
là một phần quan trọng trong ứng dụng logic
mờ cũng nhƣ trong lý thuyết tập mờ vào thực
tế. Có nhiều tác giả đã sử dụng các phƣơng
pháp dựa theo phân lớp dữ liệu, phân cụm dữ
liệu, xây dựng cây quyết định...[2,3,4,5] vào
xây dựng hệ mờ của các hệ thống thông minh,
hệ hỗ trợ ra quyết định. Hệ mờ đƣợc thực
hiện từ các luật mờ và các luật mờ này đƣợc
xây dựng từ tri thức của các chuyên gia trong
một lĩnh vực cụ thể.
Phân cụm dữ liệu đang là một vấn đề quan
tâm nghiên cứu của các tác giả trong và ngoài
nƣớc [2,3,4,5] và có nhiều thuật toán phân
cụm đƣợc đề xuất. Trong đó, một số thuật
toán phân cụm đƣợc sử dụng kết hợp với giải
thuật di truyền trong quá trình thực hiện. Một
cách tiếp cận khác mà bài báo nêu ra đó là xây
dựng hệ luật mờ từ dữ liệu cho nhận dạng hệ
điều khiển. Bài báo trình bày theo các phần:
*
Tel: 0983 668841, Email: [email protected]
i) Mở đầu, ii)Tiếp cận hệ thống: đƣa ra cái
nhìn khái quát của bài toán trong quá trình
xây dựng luật từ dữ liệu. Đề xuất một phƣơng
pháp tiếp cận là phân cụm trừ mờ. iii) Mô hình
mờ và Kết quả thực nghiệm iv) Kết luận.
TIẾP CẬN HỆ THỐNG
Hệ điều khiển mờ
Giả sử chúng ta có tập dữ liệu với cỡ p đầu
vào và q đầu ra trong hệ điều khiển mờ có hệ
luật mờ có các luật nhƣ dƣới đây. Theo
Sugeno ở luật thứ i trong hệ luật đƣợc viết
theo[2]:
Ri: If x1 is
iA1 and x2 is
iA2 and... and xp is
i
pA then yi is p0
i
+p1
i
x1+....+pp
i
xp (1)
Trong đó:
xi là các biến vào
i
jA là giá trị ngữ nghĩa của biến đầu vào
yi là hàm tuyến tính
i
jp là các thông số của hàm tuyến tính đầu ra
Các biến đầu vào x1, x2 ...là các biến thể hiện
các đại lƣợng vật lý của hệ thống, cũng có thể
là thời gian xử lý và độ ƣu tiên (hoặc trọng
số) trong khi biến đầu ra yk (với k = 1, 2, ,
K) là đại lƣợng vật lý của đầu ra, có thể là chỉ
số khả năng lựa chọn (hoặc chỉ số tuần tự)
của luật k.
kA1 và
kA2 (với k = 1, 2, , K) là
các giá trị ngữ nghĩa của phần điều kiện của
luật k nhận đƣợc bằng cách chiếu các cụm
vào các miền của các đại lƣợng vật lý đầu vào
Trần Mạnh Tuấn và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 73 - 77
74
hoặc là thời gian xử lý và độ ƣu tiên tƣơng
ứng và
k
ip (với i = 1, 2; k = 1, 2, , K) là
các hằng của hàm tuyến tính đầu ra theo
Sugeno.
Phân cụm trừ
Phân cụm trừ (subtractive clustering - SC)
xác định các tâm cụm dựa trên mật độ các
điểm lân cận. Xét một tập hợp dữ liệu gồm n
điểm [3]:
1 2 n, ,...,X x x x (2)
Hàm tính mật độ cho một điểm dữ liệu là:
n
j
xx
r
i
ji
aeP
1
4 2
2
(3)
Trong đó:
Pi: Mật độ các điểm bao quanh điểm dữ liệu
thứ i.
ra: là một hằng số dƣơng hay còn gọi là bán
kính cụm.
Chuẩn . : Khoảng cách Euclide giữa điểm
dữ liệu thứ i với các điểm bao quanh.
Khi mật độ của tất cả các điểm dữ liệu đã
đƣợc tính, lựa chọn điểm có mật độ lớn nhất
làm tâm cụm thứ nhất. Gọi
*
1x là vị trí tâm
cụm đầu tiên, có mật độ là *
1P thì
*
1P đƣợc
xác định theo
*
1
1
ax
n
i
i
P m P
Tính lại mật độ cho các điểm dữ liệu theo
công thức: 2*
12
4
*
1 ; 1,...,
i
b
x x
r
i iP P P e i n
(4)
Và rb thƣờng đƣợc chọn là ab rr 5.1 , tiếp
tục chọn điểm có mật độ lớn nhất làm tâm
cụm thứ 2.
Trong trƣờng hợp tổng quát khi đã có k tâm
cụm thì mật độ của các điểm dữ liệu còn lại
đƣợc tính theo công thức:
2
*
2
4
* ; 1,...,
i k
b
x x
r
i i kP P P e i n
(5)
Sử dụng 2 điểm cận là cận dƣới
ef* rP và
cận trên
ef* rP , với Pref là mật độ của tâm
cụm thứ k, trong đó  và  lần lƣợt đƣợc
gọi là hằng số chấp nhận và hằng số từ chối,
thƣờng đƣợc chọn lần lƣợt là 0.5 và 0.15.
Một tâm cụm mới đƣợc chọn nếu điểm đó có
mật độ lớn hơn cận trên. Nếu điểm có mật độ
lớn nhất nhỏ hơn cận dƣới thì thuật toán
dừng. Phân cụm trừ bao gồm các thông số
chủ yếu sau  ,  ,  , ar . Các thông số đó
thƣờng đƣợc chọn nhƣ sau: 0.3≥ ar ≥0.15;
1.5≥  ≥1.25.
Biểu diễn thuật toán: Các bƣớc của thuật toán
nhƣ sau
Bước 1: Khởi tạo ar ,  với b
a
r
r
 , 
và  .
Bước 2: Tính mật độ cho các điểm dữ liệu
theo công thức (3). Chọn điểm có mật độ lớn
nhất làm tâm cụm thứ nhất
i
n
i
PP
1
*
1 max
và
*
1x là tâm cụm thứ nhất .
Bước 3: Tính toán lại mật độ cho các điểm dữ
liệu còn lại theo công thức (4).
Bước 4: Gọi x* là điểm có mật độ lớn nhất là
P
*
.
- Nếu * efrP P :
*x là một tâm cụm
mới và tiếp tục bƣớc 3.
- Ngƣợc lại nếu * efrP P
: chuyển sang
bƣớc 5
- Ngƣợc lại:
+ mind khoảng cách nhỏ nhất giữa
*x và
các tâm cụm trƣớc đó.
+ Nếu 1
*
min
ref
a P
P
r
d
:
*x là một tâm cụm
mới và tiếp tục bƣớc 3.
+ Ngƣợc lại: Thiết lập 0)( *xP .
Chọn x* có mật độ P* lớn nhất và tiếp tục
bƣớc 4.
Bước 5: Đƣa ra các cụm kết quả. Khi đó, độ
thuộc của điểm xi đối với một tâm cụm thứ k
đƣợc xác định theo công thức (6):
Trần Mạnh Tuấn và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 73 - 77
75
2
2
4
i k
a
x x
r
ik e (6)
Nhận dạng hệ thống mờ
Giả sử các tâm cụm c của các cụm đƣợc thể
hiện M*= {m1
*
, m2
*
,....... mc
*
} trong không
gian L chiều, với N chiều đầu vào, ta sẽ có L-
N chiều đầu (hình 1a). Từ đó tâm cụm M* sẽ
đƣợc chia ra theo (hình 1b)
a) Các hàm thuộc hình thành qua phân cụm
b) Các tâm điểm của các giá trị ngữ nghĩa
Hình 1. Dạng hàm thuộc cho phân cụm
Định lý: Giả sử hệ thống suy diễn mờ f(x) với
số lƣợng bất kỳ các giá trị ngữ nghĩa, có thể là
dạng tam giác, dạng chuôngcó tâm điểm mj
i
trên ai, bi i=1N và trên khoảng đó ít nhất
một và nhiều nhất là hai các giá trị ngữ nghĩa
khác không. Cũng giả sử là g(x): RN R là
hàm chƣa biết bất kỳ, và nếu g(x) là hàm liên
tục và khả vi trên U =[a1, b1]x[a2,
b2]x.x[aN, bN] thì hệ mờ f(x) có thể xấp xỉ
hàm g(x) với độ chính xác bất kỳ ε với ε> 0 ,
ε đƣợc gọi là sai số chấp nhận đƣợc ||g(x)-
f)x)|| ∞ ≤ ε
Khi đó ||.||∞ đƣợc định nghĩa ||e(x)||∞=supx U
|e(x)|
QUÁ TRÌNH THỰC NGHIỆM
Mô hình nhận dạng hệ phi tuyến
Giả sử mô hình động học của hệ điều khiển
có dạng mô tả toán học nhƣ sau:
))(()1(6.0)(3.0)1( kufkykyky
(7)
Với y(k) và u(k) là các tín hiệu ra và vào của
hệ thống tại thời điểm thứ k.
Hàm f(.) không đƣợc biết trƣớc có dạng:
)5(1.0)3(3.0)(6.0)( uSinuSinuSinuf (8)
Để có thể nhận dạng đƣợc hệ động lực học
trên, ta sử dụng một hệ mô hình mẫu dạng:
))(()1(6.0)(3.0)1( kuFkykyky
(9)
trong đó )1(ky , )(ky , )1(ky là các giá
trị ƣớc lƣợng ở thời điển thứ k-1, k, k+1
F(u(k)) là hàm ƣớc lƣợng qua quá trình phân
cụm trừ mờ cho các dữ liệu vào ra hình 2, hệ
luật mờ đƣợc hình thành với các luật nhƣ trên
H3, tín hiệu điều khiển u(k) với
)250/2()( kSinku cho quá trình ƣớc lƣợng
từ thời k=1 đến thời điển k=250 sau đó thay
đổi đến k=500:
)25/2(5.0)250/2(5.0)( kSinkSinku
Hình 2. Dữ liệu vào ra của hệ thống
Hệ luật mờ cho nhận dạng hệ điều khiển trên
Hình 3.
Hình 3. Hệ luật qua phân cụm
Hình 4. Kết quả mô phỏng
0 50 100 150 200 250 300 350 400 450 500
-10
-5
0
5
10
0 50 100 150 200 250 300 350 400 450 500
-10
-5
0
5
10
0 50 100 150 200 250 300 350 400 450 500
-10
-5
0
5
10
TIN HIEU THUC xanh, TIN HIEU MO HINH do
0 50 100 150 200 250 300 350 400 450 500
-1
-0.5
0
0.5
1
Sai so mo hinh
Trần Mạnh Tuấn và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 73 - 77
76
Kết quả mô phỏng cho thấy sự hội tụ giữa hai
mô hình toán học và mô hình nhận dạng hệ
thống qua phân cụm. Kết quả mô phỏng trên
cũng cho thấy sự hội tụ nhanh của mô hình
nhận dạng, một điều quan trọng thể hiện tính
xấp xỉ của các mô hình tính toán mềm có độ
chính xác tùy ý với các mô hình thực.
KẾT LUẬN
Bài báo trình bày một thuật toán nhận dạng hệ
điều khiển theo phân cụm trừ mờ từ dữ liệu.
Các kết quả của thuật toán đƣợc mô phỏng
cho hệ. Các kết quả mô phỏng cho thấy thuật
toán nhận dạng hay hệ luật đề xuất đáp ứng
đƣợc các chỉ tiêu của quá trình nhận dạng hệ
thống. Việc thiết kế các hệ điều khiển nói
chung hay các hệ thống mờ nói riêng từ dữ
liệu là một trong những quan tâm rộng lớn
trong thời gian gần đây và rất phù hợp với
thực tế và đây cũng là một hƣớng nghiên cứu
mới cần đƣợc quan tâm.
Ký hiệu
Ký hiệu Ý nghĩa
iA1 ,
iA2 .. Các giá trị ngôn ngữ
Y hàm tuyến tính đầu ra
i
jp
Các thông số hàm tuyến
tính đầu ra
ra Bán kính cụm
x1, x2 Tập các điểm dữ liệu
 Hằng số chấp nhận
 Hằng số từ chối
ab rr 5.1 Thông số chọn theo ra
* giá trị đặt, giá trị cần
TÀI LIỆU THAM KHẢO
1. Trần Mạnh Tuấn, Lê Bá Dũng, (2013) Markov
model in proving the convergence of fuzzy genetic
algorithm, tạp chí Khoa học và Công nghệ - Viện
Hàn lâm Khoa học và Công nghệ Việt Nam, tập 51,
số 3, , trang 267-277.
2. S. L. Chiu, (1994), Fuzzy Model Identification
Based on Cluster Estimation, Journal on Intelligent
Fuzzy Systems, vol. 2, pp.267_278.
3. S. L. Chiu, (1997) Extracting Fuzzy Rules from
Data for Function Approximation and Pattern
Classification, Fuzzy Information Engineering: a
Guide Tour of Applications, pp.149_162 (Chapter 9).
D.Dubois, H. Prade, R.R. Yager (Eds.), Wiley, New
York.
4. Demirli, K., S. X. Cheng, and P. Muthukumaran,
(2003) Subtractive Clustering Based Modeling of
Job Sequencing with Parametric Algorithm,
Information Technology Journal 7 JunYing Chen,
Zheng Qin and Ji Jia,A Weighted Mean Subtractive
Clustering (2): 356-360, ISSN 1812-5638,
2008.Search, Fuzzy Sets
and Systems. 137: 235-270.
5. Mohammad GhasemiGol, Hadi Saoghi Yazdi,
Reza Monsefi, (2010) A New Hierarchical
Clustering Algorithm on Fuzzy Data (FHCA),
International Journal of coputer and electrical
engineering, Vol.2, No.1, February.
6. Agus Priyono, Muhammad Ridwad Jais Alias,
Riza AtiQ O.K.Rahmat, Azmi Hassan,
Mohd.Alauddin Mohd.Ali, Generation of fuzzy rules
with subtractive clusterring, Universiti Teknologi
Malaysia, Jurnal Teknologi, 43(D) Dis.2005:143-153
7. Siamak Tafazoli, Mathieu Leduc and Xuehong
Sun, (September 2006) Hysteresis Modeling using
Fuzzy Subtractive Clutering, International Journal of
Computational Cognition, Vol.4, No.3.
8. C.D.Doan, S.Y.Liong and Dulakshi
S.K.Karunasinghe, (07.4.2005) Derivation of
effective and effcient data set with subtractive
clustering method and genetic algorithm, Journal of
Hydroinfomatics.
9. Lothar M.Schmitt, (2001), Fundamental Study
Theory of genetic algorithms, Theoretical Computer
Science 59 1-61
10. Gunter Rudolph, (January 1994) Convergence
Analysis of Canonical Genetic Algorithms, IEEE
transaction on neural networks, vol.5, No.1.
11. Mohanad Alata, Mohammad Molhim, and
Abdullah Ramini, (2008), Optimizing of Fuzzy C-
Means Clustering Algorithm Using GA, World
Academy of Science, Engineering and
Technology, pages 224-229, 39.
Trần Mạnh Tuấn và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 73 - 77
77
SUMMARY
AN APPLICATION OF FUZZY SUBSTRACTIVE CLUSTERING
FOR IDENTIFICATION CONTROLLED SYSTEMS FROM DATA
Tran Manh Tuan
1*
, Le Ba Dung
2
1College of Information and Communication Technology – TNU,
2Institute of Information Technology
Fuzzy system is applied in various fields, in which fuzzy control fuzzy identification is widely
focussed. Usually, fuzzy system designed from knowledge of experts in the certain application
fields or from data. Each approach has some advantages and some limitations. In this paper, we
describe substractive clustering method to create fuzzy rules
Keywords: Fuzzy substractive clustering, identification system, fuzzy control.
Ngày nhận bài:25/01/2014; Ngày phản biện:10/02/2014; Ngày duyệt đăng: 26/02/2014
Phản biện khoa học: TS. Vũ Đức Thái – Trường ĐH Công nghệ Thông tin & Truyền thông - ĐHTN
*
Tel: 0983 668841, Email: [email protected]

File đính kèm:

ung_dung_phan_cum_tru_mo_cho_bai_toan_nhan_dang_he_dieu_khie.pdf