Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong chiết tách thông tin nước mặt khu vực cửa sông

Nước tại khu vực cửa sông là một trong những môi trường có sự đa dạng sinh

học bậc nhất trên bề mặt đất. Tuy nhiên, hiện nay, môi trường này thường

xuyên bị đe dọa bởi các hoạt động của con người. Để tăng cường hiệu quả cho

công tác quản lý và bảo vệ môi trường quan trọng này thì một giải pháp chiết

tách thông tin nước bề mặt trên tư liệu ảnh viễn thám nhanh chóng và chính

xác là rất cần thiết. Trong nghiên cứu này, phương pháp phân cụm mờ fuzzy

c-means (FCM) tích hợp với thông tin không gian của các điểm ảnh láng giềng

(MFCM) áp dụng lên ảnh chỉ số nước (WIs)được sử dụngđể chiết tách nước

mặt trên ảnh viễn thám. Phương pháp này được áp dụng cho ảnh Landsat 8

OLI chụp khu vực cửa sông Bạch Đằng thuộc thành phố Hải Phòng và tỉnh

Quảng Ninh. Bên cạnh đó, nghiên cứu cũng đánh giá sự ảnh hưởng tới hiệu

quả chiết tách nước mặt của tham số mức độ mờ hóa(fuzzification) và số

lượng các điểm ảnh láng giềng trong thuật toán FCM. Kết quả thực nghiệm

cho thấy,khi hệ số mờ và số điểm ảnh láng giềng tăng, độ chính xác chiết tách

nước sẽ giảm, với m =2 và số điểm láng giềng là 8 thìphương phápđạthiệu quả

cao nhất về thời gian xử lý. Ngoài ra, khi so sánh với phương pháp phân

ngưỡng, phương pháp được sử dụng cũng cho độ chính xác cao hơn với hệ số

kappa của hai phương pháp lần lượt là 0.84 và 0.87

pdf 12 trang yennguyen 4880
Bạn đang xem tài liệu "Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong chiết tách thông tin nước mặt khu vực cửa sông", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong chiết tách thông tin nước mặt khu vực cửa sông

Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong chiết tách thông tin nước mặt khu vực cửa sông
 Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất Tập 59, Kỳ 5 (2018) 55-66 55 
Ứng dụng thuật toán phân cụm mờ trên ảnh chỉ số nước trong 
chiết tách thông tin nước mặt khu vực cửa sông 
Cao Xuân Cường *, Võ Ngọc Dũng 
Khoa Trắc địa - Bản đồ và Quản lý đất đai, Trường Đại học Mỏ - Địa chất, Việt Nam 
THÔNG TIN BÀI BÁO 
TÓM TẮT 
Quá trình: 
Nhận bài 10/8/2018 
Chấp nhận 25/9/2018 
Đăng online 31/10/2018 
 Nước tại khu vực cửa sông là một trong những môi trường có sự đa dạng sinh 
học bậc nhất trên bề mặt đất. Tuy nhiên, hiện nay, môi trường này thường 
xuyên bị đe dọa bởi các hoạt động của con người. Để tăng cường hiệu quả cho 
công tác quản lý và bảo vệ môi trường quan trọng này thì một giải pháp chiết 
tách thông tin nước bề mặt trên tư liệu ảnh viễn thám nhanh chóng và chính 
xác là rất cần thiết. Trong nghiên cứu này, phương pháp phân cụm mờ fuzzy 
c-means (FCM) tích hợp với thông tin không gian của các điểm ảnh láng giềng 
(MFCM) áp dụng lên ảnh chỉ số nước (WIs)được sử dụngđể chiết tách nước 
mặt trên ảnh viễn thám. Phương pháp này được áp dụng cho ảnh Landsat 8 
OLI chụp khu vực cửa sông Bạch Đằng thuộc thành phố Hải Phòng và tỉnh 
Quảng Ninh. Bên cạnh đó, nghiên cứu cũng đánh giá sự ảnh hưởng tới hiệu 
quả chiết tách nước mặt của tham số mức độ mờ hóa(fuzzification) và số 
lượng các điểm ảnh láng giềng trong thuật toán FCM. Kết quả thực nghiệm 
cho thấy,khi hệ số mờ và số điểm ảnh láng giềng tăng, độ chính xác chiết tách 
nước sẽ giảm, với m =2 và số điểm láng giềng là 8 thìphương phápđạthiệu quả 
cao nhất về thời gian xử lý. Ngoài ra, khi so sánh với phương pháp phân 
ngưỡng, phương pháp được sử dụng cũng cho độ chính xác cao hơn với hệ số 
kappa của hai phương pháp lần lượt là 0.84 và 0.87. 
© 2018 Trường Đại học Mỏ - Địa chất. Tất cả các quyền được bảo đảm. 
Từ khóa: 
Nước mặt 
Viễn thám 
Chiết tách nước 
Chỉ số nước 
Landsat 
Fuzzy c-means 
1. Mở đầu 
Cửa sông là nơi các dòng sông đổ ra biển, nơi 
nước ngọt giao hòa với nước mặn. Điều kiện đặc 
biệt này đã tạo ra một trong những môi trường có 
sự đa dạng sinh học bậc nhất trên bề mặt đất 
(Fujii, 2012; McKeon et al., 2015). Việt Nam là một 
quốc gia có đường bờ biển dài với nhiều khu vực 
cửa sông quan trọng. Đây là môi trường cho các hệ 
sinh thái quan trọng như hệ sinh thái rừng ngập 
mặn phát triển (Pham & Yoshino, 2016). Tuy 
nhiên, các hoạt động của con người đã và đang đe 
dọa nghiêm trọng tới môi trường các cửa sông. 
Bên cạnh đó, biến đổi khí hậu cũng góp phần làm 
thay đổi môi trường này(Fujii, 2012). Để quản lý 
và bảo vệ môi trường cửa sông một cách hiệu quả, 
một giải pháp chiết tách thông tin nước bề mặt ở 
khu vực này trên tư liệu ảnh viễn thám nhanh 
chóng và chính xác là rất cần thiết. 
Viễn thám là một trong những công nghệ đã 
được sử dụng hiệu quả trong giám sát tài nguyên 
_____________________ 
*Tác giả liên hệ 
E-mail: caoxuancuong@humg.edu.vn 
56 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 
thiên nhiên nói chung và tài nguyên nước nói 
riêng (Alsdorf & Lettenmaier, 2003). Khi sử dụng 
tư liệu ảnh viễn thám thành lập bản đồ chuyên đề 
về tài nguyên nước mặt, bên cạnh ca c phương 
pha p thường được sử dụng như số hóa dựa trên 
giải đoán bằng mắt (digitizing), phương pháp 
phân ngưỡng (density slicing), phân loại có kiểm 
định và không kiểm định (supervised and 
unsupervised classifications), phương pháp phân 
cụm mờ (fuzzy c – means) áp dụng trên các chỉ số 
nước (water indices-WIs) còn tương đối mới mẻ. 
Trong nghiên cứu của Yang et al. (2015), các tác 
giả đã phân tích đánh giá chi tiết ca c phương pha p 
nêu trên và đưa ra các ưu nhược điểm của từng 
phương pháp. Cụ thể, phương pha p só ho a dựa 
tre n giải đoa n bàng mát tuy cho đo ̣ chi nh xa c cao 
nhưng lại tón nhièu thời gian và sư c lao đo ̣ ng, do 
đo kho ng thực té trong ca c trường hợp nghie n cư u 
tre n qui mo ro ̣ ng. Phương pha p pha n ngưỡng 
được đè xuát và sử dụng trong nhièu nghie n cư u 
của (Frazier et al., 2003; Ryu et al., 2002; White, 
1999). Trong nghie n cư u vè lũ lụt ở khu vực đát 
nga ̣ p nươ c của Frazier và đồng nghiệp (2003), ca c 
gia trị ngưỡng đã được sử dụng pha n loại nươ c và 
kho ng phải nươ c tre n ke nh 5 của ảnh Landsat 
TM(Frazier et al., 2003). Đa y là phương pha p đơn 
giản và hie ̣u quả vè ma ̣ t thời gian, tuy nhie n, đo ̣ 
chi nh xa c bị ảnh hưởng nhièu bởi sự ca c yéu tó 
như bo ng địa hình và ma y (Verpoorter et al., 
2014). Mo ̣ t phương pha p kha c co thẻ được sử 
dụng đẻ chiét ta ch nươ c là pha n loại co kiẻm định 
và kho ng kiẻm định. Phương pha p pha n loại co 
kiẻm định phụ thuo ̣ c nhièu vào y kién chủ quan 
của chuye n gia và chát lượng của vie ̣ c láy mãu, 
trong khi phương pha p pha n loại kho ng kiẻm định 
cho đo ̣ chi nh xa c tháp khi khu vực pha n loại lãn 
nhièu đói tượng co sự tương phản vè phỏ tháp 
(Hao et al., 2014). Chiét ta ch nươ c sử dụng ca c chỉ 
só toa n học (chỉ só nươ c-WIs) được ti nh từ ca c 
ke nh ảnh là mo ̣ t trong ca c phương pha p được sử 
dụng kha phỏ bién do ti nh hie ̣u quả và tie ̣n lợi của 
no . Ca c chỉ số nước như Normalized Difference 
Water Index (NDWI) (McFeeters, 1996), Modified 
Normalized Difference Water Index (MNDWI) 
(Xu, 2006), và Automated Water Extraction Index 
(AWEI) (Feyisa et al., 2014) được xác định từ các 
kênh ảnh green (kênh 2), near-infrared (kênh 4), 
và SWIR1 (kênh 6) của Landsat. Các chỉ số này 
được thiết kế nhằm làm nổi bật các đối tượng 
nước bề mặt trên ảnh quang học thông qua việc 
tăng cường sự khác biệt giữa các điểm ảnh mang 
thông tin nước và các điểm ảnh mang thông tin 
của các đối tượng khác liền kề, đồng thời loại bỏ 
các điểm ảnh nhiễu. Nghie n cư u của Hao và đòng 
nghie ̣p đã sử dụng hie ̣u quả phương pha p chỉ só 
nươ c đẻ la ̣ p bản đò ca c so ng và hò bàng ảnh 
Landsat (Hao et al., 2014). Tuy nhie n, ca c ta c giả 
cũng chỉ ra ca c nhược điẻm của phương pha p này 
như: (1) đo ̣ chi nh xa c pha n loại tháp vơ i ca c điẻm 
ảnh lãn giữa nươ c và ca c đói tượng kha c; (2) vơ i 
mõi khu vực kha c nhau thì đa ̣ t mo ̣ t ngưỡng pha n 
loại kha c nhau; (3) kho ng loại bỏ được ca c nhiẽu. 
Ma ̣ c dù mõi phương pha p co ưu nhược điẻm rie ng, 
nhưng sự đa dạng ca c phương pha p chiét ta ch 
nươ c bè ma ̣ t ne u tre n đã chư ng minh khả na ng ưu 
vie ̣ t của phương pha p viẽn tha m trong nghie n cư u 
tài nguye n nươ c ma ̣ t. 
Thua ̣ t toa n pha n cụm mờ (fuzzy c-means -
FCM) được ư ng dụng trong nhièu nghie n cư u của 
lĩnh vực viẽn tha m (Ghosh et al., 2011; Kersten et 
al., 2005). Ghosh và các đồng nghiệp (2011) đã sử 
dụng thua ̣ t toa n pha n cụm mờ na ng cao đo ̣ chi nh 
xa c pha n loại và pha t hie ̣n bién đo ̣ ng. Mo ̣ t só 
nghie n cư u kha c chỉ ra ràng thua ̣ t toa n pha n cụm 
mờ co ti ch hợp tho ng tin ca c điẻm ảnh la n ca ̣ n co 
thẻ xử ly được nhiẽu và ván đè vè gia trị tương 
phản phỏ tháp (Ghaffarian & Ghaffarian, 2014; 
Stavrakoudis et al., 2011). Ti nh chát bién đỏi lie n 
tục từ 0 đén 1 của gia trị thành vie n (membership) 
trong logic mờ (fuzzy) (Bezdek et al., 1984)co thẻ 
được sử dụng đẻ biẻu diẽn sự bién đỏi lie n tục vè 
gia trị đo ̣ ảm của khu vực chuyẻn tiép giữa nươ c 
và kho ng phải nươ c. Trên thế giới, việc kết hợp 
giữa FCM và WIs trên ảnh viễn thám nhằm chiết 
tách thông tin nước mặt đã được Yang et al. 
(2015) thực hiện thành công cho một số các đối 
tượng nước mặt khác nhau trên phạm vi toàn cầu. 
Tuy nhiên, nước là môi trường khá đa dạng và 
phức tạp, mỗi khu vực sẽ có đặc điểm lý hóa và 
sinh học khác nhau. Với điều kiện môi trường đặc 
trưng riêng như cửa sông, việc tìm ra một giải 
pháp phù hợp là cần thiết. Bài báo giới thiệu kết 
quả ứng dụng phương pháp FCM trên ảnh chỉ số 
nước WIs trong chiết tách nước mặt của khu vực 
cửa sông Việt Nam. 
2. Khu vực và dữ liệu nghiên cứu 
2.1. Khu vực nghiên cứu 
Khu vực được lựa chọn cho nghiên cứu nhằm
 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 57 
 đánh giá giải pháp đề xuất là khu vực cửa sông 
Bạch Đằng, thuộc địa bàn thành phố Hải Phòng và 
tỉnh Quảng Ninh (Hình 1). Đây là khu vực có sự 
hiện diện chủ yếu của rừng ngập mặn. Những năm 
gần đây, nhờ chính sách bảo vệ, phục hồi và phát 
triển rừng ngập mặn của Chính phủ Việt Nam, 
đồng thời với các dự án hỗ trợ quốc tế như dự án 
của tổ chức Chữ thập đỏ Nhật Bản (JRC) (Pham & 
Yoshino, 2016), rừng ngập mặn ở khu vực này 
phát triển tương đối tốt. 
2.2. Dữ liệu nghiên cứu 
Dữ liệu sử dụng cho nghiên cứu là ảnh 
Landsat 8 OLI ở mức xử lý L1 đã được nắn và hiệu 
chỉnh ảnh hưởng địa hình từ USGS EarthExplorer. 
Mô tả chi tiết về mức độ che phủ bởi mây, thời gian 
chụp, và các thông tin quan trọng khác được cung 
cấp trong bảng 1. 
Ảnh được chọn sau khi đã khảo sát tất cả các 
ảnh nhằm tránh ảnh hưởng của mây. Ảnh có định 
dạng GeoTIFF, trong hệ qui chiếu UTM được nắn 
với độ chính xác cỡ 0.4 pixel và được xem là chấp 
nhận được về độ chính xác không gian. 
Để đánh giá độ chính xác kết quả chiết tách 
nước, ảnh Planetscope có độ phân giải 3 m chụp 
vào cùng thời gian với ảnh Landsat được dùng để 
số hóa các đối tượng nước. Yêu cầu về độ chính xác 
của đồng đăng ký ảnh được đảm bảo nhờ thực 
hiện thủ công. Cơ sở dữ liệu số hóa được coi là dữ 
liệu chuẩn phục vụ đánh giá độ chính xác phân 
loại. 
3. Phương pháp nghiên cứu 
3.1. Phương pháp chỉ số nước trên tư liệu ảnh 
viễn thám 
Các chỉ số nước như Normalized Difference 
Water Index (NDWI) (McFeeters, 1996), Modified 
Normalized Difference Water Index (MNDWI) 
(Xu, 2006), và Automated Water Extraction Index 
(AWEI) (Feyisa et al., 2014) được xác định từ các 
kênh ảnh green (kênh 2), near-infrared (kênh 4), 
và SWIR1 (kênh 6) của Landsat 5 TM. 
Ảnh Path/row Thời gian chụp Mây che phủ (%) Độ phân giải (m) 
Landsat 8 OLI 126/46 17/09/2017 9.79 30 
LC81260462017260LGN00 03:17:45 
Planetscope Strip_id 17/09/2017 0 3 
20170917_024558_0f25 761211 02:45:58 
20170917_024559_0f25 02:45:59 
20170917_024600_0f25 02:46:00 
Hình 1. Khu vực nghiên cứu (ảnh Landsat 8 OLI tổ hợp RGB: 753). 
Bảng 1. Dữ liệu ảnh vệ tinh nghiên cứu. 
58 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 
Các chỉ số này được thiết kế nhằm làm nổi bật 
các đối tượng nước bề mặt trên ảnh quang học 
thông qua việc tăng cường sự khác biệt giữa các 
điểm ảnh mang thông tin nước và các điểm ảnh 
mang thông tin của các đối tượng khác liền kề, 
đồng thời loại bỏ các điểm ảnh nhiễu (Yang et al., 
2015). 
Năm 1996, McFeeters và đồng nghiệp đưa ra 
công thức tính chỉ số nước sử dụng hai kênh Green 
và NIR: 
𝑁𝐷𝑊𝐼 =
𝐺𝑟𝑒𝑒𝑛 − 𝑁𝐼𝑅
𝐺𝑟𝑒𝑒𝑛 + 𝑁𝐼𝑅
 (1) 
Việc lựa chọn các kênh ảnh này là nhằm: (1) 
Tối đa khả năng phản xạ ánh sáng có bước sóng 
trong dải xanh lá cây (green) của các đối tượng 
nước. (2) Giảm đến mức tối thiểu phản xạ của ánh 
sáng có bước sóng trong dải cận hồng ngoại (NIR) 
của các đối tượng nước. (3) Tận dụng tính phản xạ 
mạnh của tia NIR khi gặp thực vật và đất trống. 
Trên ảnh NDWI, các đối tượng nước sẽ có giá 
trị NDWI lớn hơn không, trong khi đất và thực phủ 
trên cạn có giá trị NDWI âm hoặc bằng không.Giá 
trị NDWI biến thiên từ -1 đến 1. 
Chỉ số MNDWI được đề xuất bởi Xu (2006), 
chỉ số nước MNDWI được phát triển từ chỉ số 
NDWI của McFeeters (1996). Tác giả chỉ ra nhược 
điểm của chỉ số NDWI là cho độ chính xác không 
cao đối với khu vực đất đô thị.Nước được chiết 
tách từ khu vực này thường bị lẫn với đất đô 
thị.Điều này có nghĩa là khu vực xây dựng cũng có 
giá trị NDWI lớn hơn không. Nguyên nhân là do giá 
trị phản xạ của cả đất xây dựng và nước hồ ở kênh 
Green mạnh hơn ở kênh NIR (Xu, 2006). Tuy 
nhiên, các khảo sát chi tiết về đặc điểm phản xạ 
phổ của đất đô thị ở kênh hồng ngoại trung (MIR) 
cho thấy giá trị phản xạ phổ ở kênh này lớn hơn 
kênh Green. Do đó, để phân biệt giữa đất xây dựng 
và nước, kênh MIR được sử dụng thay thế kênh 
NIR trong công thức tính NDWI. Sự thay đổi này 
cho ra chỉ số mới là MNDWI: 
𝑀𝑁𝐷𝑊𝐼 =
𝐺𝑟𝑒𝑒𝑛 −𝑀𝐼𝑅
𝐺𝑟𝑒𝑒𝑛 +𝑀𝐼𝑅
 (2) 
Các thực thể nước bề mặt rất đa dạng về kích 
thước, hình dạng và địa mạo, ví dụ hồ trên núi 
khác với hồ ở khu đô thì về hình dạng, bao quanh 
bởi thực phủ khác nhau và đặc trưng phổ khác 
nhau. Dựa vào ý tưởng này, cộng với các khảo sát 
cẩn thận và chi tiết, Feyisa et al. (2014) sử dụng 
năm kênh ảnh Landsat TM để tạo ra một chỉ số 
nước AWEI, chỉ số này gồm hai chỉ số là AWEIsh và 
AWEInsh. 
AWEIsh = ρband1 + 2.5 x ρband2 -1.5 x 
(ρband4 + ρband5) – 0.25 x ρband7 
(3) 
AWEInsh = 4 x (ρband2 - ρband5) –0.25 x 
ρband4 + 2.75 x ρband7 
(4) 
Trong đó, ρ là giá trị phản xạ phổ của 5 kênh 
ảnh Landsat TM sau: 
Band 1: kênh blue; band 2: kênh Green; band 
4: kênh NIR; band 5: kênh SWIR 1; band 7: kênh 
SWIR 2. 
3.2. Cơ sở toán học của phương pháp phân cụm 
mờ (FCM) 
Thuật toán FCM được đề xuất lần đầu tiên 
bởiDunn (1973), sau đó được phát triển 
bởiBezdek (1973). Đầu vào thuật toán là bộ dữ 
liệu X, thuật toán cho phép phân cụm không gian 
dữ liệu X. Với số lượng cụm cho trước là C (C ≥ 2), 
m là số thực (m > 1), sử dụng quá trình lặp để đưa 
hàm mục tiêu (J) đạt giá trị cực tiểu. 
2
1 1
|| ||
c n
m
kj k j
j k
J u x v
 
(5) 
Trong đó: m là số mờ hóa; c là số cụm, n là số 
phần tử dữ liệu, r là số chiều của dữ liệu; Ukj là giá 
trị thành viên của phần tử dữ liệu Xk trong cụm j; 
Xk∈ Rr là phần tử thứ k của X = x1, x2...xn; vj là tâm 
của cụm j. 
Để đưa hàm mục tiêu về cực tiểu, cần đảm bảo 
điều kiện ∑ 𝑢𝑖𝑘
𝐶
𝑖=1 = 1, ta có 
𝜕𝐽
𝜕𝑢
= 0 và 
𝜕𝐽
𝜕𝑣
= 0. Các 
điều kiện này cho ta các nghiệm sau: 
2
1
1
1
|| ||
|| ||
kj
c m
k j
i k i
u
x v
x v

(6) 
và 
1
1
n
m
kj k
k
j n
m
kj
k
u x
v
u


(7) 
Một số nghiên cứu đã chỉ ra rằng phân cụm là 
bài toán phân loại các phần tử thành các cụm cùng 
độ đồng nhất về thuộc tính nào đó (Adhikari et al., 
 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 59 
2015; Chuang et al., 2006).Thông thường các phần 
tử lân cận nhau (phần tử láng giềng) có sự tương 
quan lớn và phụ thuộc lẫn nhau.Trong khi thuật 
toán FCM truyền thống không tính tới sự tương 
quan giữa các phần tử láng giềng, dẫn tới độ chính 
xác phân cụm thấp.Để nâng cao độ chính xác phân 
cụm, mối quan hệ không gian giữa các phần tử 
láng giềng được sử dụng tính giá trị thành viên, 
phương pháp này được gọi là phân cụm mờ láng 
giềng thích nghi (MFCM).Các phần tử nào có càng 
nhiều các phần tử láng giềng có cùng thuộc tính 
với nó thì xác suất của các phần tử này thuộc về 
cùng cụm với các phần tử láng giềng càng cao.Việc 
đưa thông tin không gian sẽ giúp loại bỏ nhiễu. 
Công thức tính tới sự ảnh hưởng của các phần tử 
láng giềng được thể hiện như sau: 
𝑓𝑖𝑗 =
∑ 𝑢𝑖𝑘
𝑁𝑤
� ... xác định ngưỡng nào là tối ưu 
nhất cho từng chỉ số nước. Căn cứ vào biểu đồ 
histogram của các kênh ảnh chỉ số nước để lựa 
chọn các ngưỡng tham gia vào quá trình khảo sát 
xác định ngưỡng tối ưu. Các ngưỡng này được đưa 
vào phân loại, các điểm ảnh có giá trị nhỏ hơn 
ngưỡng khảo sát được đưa về lớp không phải 
nước, ngược lại nếu lớn hơn ngưỡng khảo sát thì 
sẽ thuộc về lớp nước. Các sai số lấy thừa và bỏ sót 
được tính nhằm tìm ra ngưỡng tối ưu. Việc quyết 
định ngưỡng nào là tối ưu đối với từng chỉ số 
nước, sẽ căn cứ vào sai số lấy thừa hoặc lẫn 
(commission) và sai số bỏ sót (omission). Thông 
thường khi sai số lấy thừa lớn thì sai số bỏ sót sẽ 
nhỏ và ngược lại. Do đó, ngưỡng tối ưu sẽ là 
ngưỡng mà cho kết quả phân loại có sai số lấy thừa 
bằng sai số bỏ sót. 
Công thức tính các sai số như sau: 
SLẫn = A/B*100% ; (12) 
Sbỏ sót = C/D*100% ; (13) 
Trong đó: A - là số pixel bị phân loại nhầm từ 
không phải nước sang nước; B - là tổng số pixel 
được phân loại thành nước; C - là số pixel bị phân 
loại nhầm từ nước sang không phải nước; D - là 
tổng số pixel nước tham khảo. 
4. Kết quả và thảo luận 
4.1. Xác định ngưỡng tối ưu cho các chỉ số nước 
Các ảnh chỉ số nước được xác định và thể hiện 
như trong Hình 3. Với ảnh chỉ số NDWI, các 
ngưỡng có giá trị từ -0.426 đến 0.128 được lựa 
chọn đưa vào phân loại. Kết quả cho thấy ngưỡng 
-0.138 cho kết quả phân loại với sai số lấy thừa và 
bỏ sót gần như bằng nhau. Do đó, ngưỡng ngày 
được chọn là ngưỡng tối ưu cho ảnh NDWI. Làm 
tương tự với các ảnh chỉ số nước còn lại, kết quả 
được như sau: với MNDWI có ngưỡng tối ưu là 
0.118, AWEIsh có ngưỡng tối ưu là -0.03, và 
AWEInsh có ngưỡng tối ưu là -0.028 (Bảng 4). Từ 
đây, kết quả phân loại của các ngưỡng này sẽ được 
so sánh với kết quả phân loại dùng phương pháp 
MFCM. 
4.2. Kết quả khảo sát xác định các tham số cho 
MFCM 
Quá trình khảo sát các tham số cho trong 
Bảng 3 cho kết quả như Bảng 5.
Bảng 3. Các tham số lựa chọn khảo sát. 
 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 61 
Chỉ số nước NDWI Chỉ số nước MNDWI 
Ngưỡng 
Sai số 
Ngưỡng 
Sai số 
Lẫn Bỏ sót Lẫn Bỏ sót 
0.128 0.4 25 -0.166 15.66 3.05 
0.002 1.11 20.69 -0.078 11.03 5.47 
-0.138 2.69 15.63 -0.006 8.49 7.68 
-0.342 8.26 8.27 0.011 7.97 8.23 
-0.355 8.8 7.8 0.021 7.71 8.5 
-0.395 10.74 6.38 0.305 2.63 17.65 
Chỉ số nước AWEIsh Chỉ số nước AWEInsh 
-0.055 14.68 2.83 -0.064 16.62 3.64 
-0.037 9.3 5.86 -0.052 16.31 4.99 
-0.030 7.5 7.44 -0.028 8.19 8.76 
0.013 1.01 22.01 -0.023 7.29 9.65 
 -0.008 4.76 13.18 
 0.046 0.3 36.41 
Hình 3. Các ảnh chỉ số nước khu vực nghiên cứu. 
Bảng 4. Kết quả khảo sát xác định ngưỡng tối ưu cho các chỉ số nước. 
62 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 
Bảng 5. Kết quả khảo sát tham số MFCM. 
m OA % T (“) N OA % 
1.5 92.912 815 3x3 92.910 
2 92.910 555 5x5 92.909 
2.5 92.909 995 7x7 92.908 
3 92.907 997 9x9 92.908 
3.5 92.905 1105 11x11 92.900 
4 92.901 1127 21x21 92.861 
(OA: sai số toàn cục; T: thời gian xử lý (giây). 
Kết quả khảo sát các tham số mờ hóa (m) cho 
thấy mặc dù sự khác biệt về độ chính xác phân loại 
là không đáng kể (khác biệt lớn nhất là 0.011%), 
tuy nhiên, vẫn có thể thấy được qui luật là khi m 
tăng thì độ chính xác giảm. Bên cạnh đó, xét về tốc 
độ tính toán, với m = 2 thì thời gian xử lý nhanh 
nhất T = 555 giây (cho ảnh kích thước 6290 x 
6460 trên MatlabTB 9.0 và máy tính Intel(R) 
Core(TM) i7 CPU 2.0 GHz). 
Kết quả khảo sát các kích thước cửa sổ cũng 
cho kết quả tương tự với sự khác biệt không đáng 
kể về độ chính xác (lớn nhất là 0.049%) và một xu 
hướng giảm dần về độ chính xác chiết tách khi 
kích thước cửa sổ tăng lên. Tuy nhiên, về thời gian 
xử lý thì gần như không có khác biệt. Kết quả khảo 
sát cho hai tham số tối ưu m = 2 và N = 3. 
4.3 Kết quả phân loại bằng phương pháp phân 
cụm mờ láng giềng thích nghi 
Đối với trường hợp chỉ sử dụng các chỉ số 
nước, kết quả đánh giá độ chính xác phân loại cho 
thấy các hệ số kappa (KC) từ 0.84 đến 0.86. Trong 
đó, chỉ số nước AWEIsh có độ chính xác cao nhất 
với KC = 0.86 và độ chính xác toàn cục (OA) là 
92.86%, chỉ số AWEInsh cho độ chính xác thấp 
nhất với KC = 0.84 và OE = 91.96% (Bảng 6). 
Kết quả chiết tách nước sử dụng chương trình 
phân cụm mờ láng giềng thích nghi cho kết quả 
như trong Bảng 6. Có thể thấy rằng, phương pháp 
MFCM và WIs cho kết quả chính xác cao hơn so với 
phương pháp sử dụng ngưỡng. 
Khảo sát bằng mắt, có thể thấy rằng phương 
pháp phân ngưỡng cho kết quả phân loại với 
nhiều điểm ảnh phân loại sai hơn so với phương 
pháp MFCM (Hình 4). 
Sai số 
Phương pháp 
NDWI FCM - NDWI MNDWI FCM - MNDWI AWEIsh FCM - AWEIsh AWEInsh FCM - AWEInsh 
KC 0.84 0.85 0.85 0.87 0.86 0.86 0.84 0.84 
OA (%) 92.13 92.37 92.3 93.08 92.89 92.91 91.96 92.02 
Bảng 6. So sánh độ chính xác phân loại của phương pháp WIs và phương pháp FCM. 
Hình 4. So sánh kết quả chiết tách nước mặt giữa phương pháp phân ngưỡng và MFCM. 
 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 63 
4.3 Thảo luận 
Trong thuật toán FCM láng giềng thích nghi, 
hai tham số quan trọng nhất có ảnh hưởng tới kết 
quả chiết tách thông tin nước mặt là tham số mờ 
hóa (fuzzification) và số lượng các điểm ảnh láng 
giềng được xác định thông qua kích thước cửa sổ 
trượt (N). Giá trị mờ hóa m làm giảm ảnh hưởng 
của nhiễu trong quá trình tính giá trị đại diện của 
mỗi cụm. Bên cạnh đó, vai trò của giá trị thành viên 
𝑢𝑖𝑘 cũng phụ thuộc vào tham số m. Giá trị m càng 
lớn sự phụ thuộc càng nhiều. (Lin et al., 1996). Kết 
quả thực nghiệm đã cho thấy khi giá trị mờ hóa 
tăng thì độ chính xác chiết tách thông tin sẽ giảm. 
Trong khi đó, kích thước cửa sổ trượt sử dụng tính 
trọng số không gian của các điểm ảnh xét sẽ quyết 
định số lượng các điểm ảnh láng giềng. Khi càng 
nhiều các điểm ảnh láng giềng tham gia quá trình 
tính µ thì khả năng loại bỏ nhiễu càng cao, tuy 
nhiên, khả năng phân loại sai cũng tăng lên 
(Adhikari et al., 2015). Kết quả thực nghiệm đã 
cho thấy điều này. 
Nước khu vực cửa sông là môi trường phức 
tạp chứa nhiều bùn, chất lơ lửng, phù du và thực 
vật (Fujii, 2012).Các thành phần này được xác 
định là nguồn sai số chính cho chiết tách nước bề 
mặt ở khu vực cửa sông.Mối liên hệ giữa độ chính 
xác kết quả phân loại và sinh vật phù du, hàm 
lượng chất lơ lửng trong nước được thể hiện rất 
rõ trong Hình 6 (Yang et al., 2015). 
Điều này đã được chứng minh trong nghiên 
cứu này, khi phương pháp chiết tách nước sử 
dụng kết hợp phân cụm mờ láng giềng thích nghi 
và chỉ số nước MND-WIs cho kết quả chính xác 
hơn các chỉ số nước khác. Đây một phần là do chỉ 
số MNDWI sử dụng kênh SWIR (kênh 5 với 
Landsat 5 TM, kênh 6 với Landsat 8 OLI), kênh này 
ít chịu ảnh hưởng của độ đục, các sinh vật phù du 
và chất lơ lửng trong quá trình thủy triều rút ở khu 
vực ven biển, trong khi đó, kênh NIR (kênh 4 với 
Landsat 5 TM, kênh 5 với Landsat 8 OLI) bị tác 
động mạnh bởi các điều kiện này (Ryu et al., 
2002). Chỉ số NDWI sử dụng kênh NIR nên kết quả 
chiết tách nước sông đục và nông có độ chính xác 
không cao (Yang et al., 2015).
Hình 5. Kết quả chiết tách nước bằng MFCMkết hợp các ảnh chỉ số: a. NDWI; b. MNDWI; c. AWEIsh; 
d. AWEInsh. 
64 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 
5. Kết luận 
Môi trường nước cửa sông phức tạp và ảnh 
hưởng rõ ràng tới độ chính xác chiết tách nước bề 
mặt trên tư liệu viễn thám. Phương pháp phân 
cụm mờ FCM áp dụng trên ảnh chỉ số nước WIs là 
một giải pháp nhanh, chính xác, và hiệu quả.Các 
tham số mờ hóa và số điểm ảnh láng giềng là hai 
trong số những tham số cơ bản của thuật toán 
MFCM.Hai tham số có ảnh hưởng tuy không lớn về 
độ chính xác nhưng rất rõ ràng về thời gian xử lý. 
Trong nghiên cứu này, mờ hóa m =2 và kích thước 
cửa sổ N = 3 (số điểm ảnh láng giềng là 8) được 
xác định là tối ưu. Phương pháp sử dụng cho độ 
chính xác cao hơn phương pháp đặt ngưỡng nhờ 
kết hợp ưu điểm của cả hai kỹ thuật tạo ảnh chỉ số 
nước và phân cụm mờ láng giềng thích nghi. Bên 
cạnh đó, quá trình xử lý được tự động hoàn toàn, 
tiết kiệm được thời gian và công sức so với 
phương pháp đặt ngưỡng. Việc sử dụng kết hợp 
giữa cửa sổ trượt và histogram khởi tính giá trị 
tâm cụm hay giá trị đại diện của cụm đã giúp cải 
thiện đáng kế quá trình khởi tạo của thuật toán 
FCM. Với khu vực cửa sông chứa nhiều phù sa, 
chất lơ lửng, và sinh vật phù du, chỉ số nước 
MNDWI, AWEIsh cho độ chính xác chiết tách nước 
mặt cao hơn NDWI. 
Tài liệu tham khảo 
Adhikari, S. K., Sing, J. K., Basu, D. K., Nasipuri, M., 
2015. Conditional spatial fuzzy C-means 
clustering algorithm for segmentation of MRI 
images. Applied Soft Computing, 34, 758-769. 
doi:
038 
Alsdorf, D. E., Lettenmaier, D. P., 2003. Tracking 
Fresh Water from Space. Science, 301(5639), 
1491-1494. Retrieved from  
jstor.org/stable/3835066 
Bezdek, J. C., 1973. Fuzzy Mathematics in Pattern 
Classification. (Doctor of Philosophy), Cornell 
University, Ithaca, New York. 
Bezdek, J. C., Ehrlich, R., Full, W., 1984. FCM: The 
fuzzy c-means clustering algorithm. Computers 
and Geosciences, 10(2), 191-203. 
doi:10.1016/0098-3004(84)90020-7 
Chuang, K. S., Tzeng, H. L., Chen, S., Wu, J., Chen, T. 
J., 2006. Fuzzy c-means clustering with spatial 
information for image segmentation. 
Computerized Medical Imaging and Graphics, 
30(1), 9-15. doi:10.1016/j.compmedimag 
.2005.10.001 
Dunn, J. C., 1973. A Fuzzy Relative of the ISODATA 
Process and Its Use in Detecting Compact Well-
Separated Clusters. Journal of Cybernetics, 3(3), 
32-57. doi:10.1080/01969727308546046 
Feyisa, G. L., Meilby, H., Fensholt, R., Proud, S. R., 
2014. Automated Water Extraction Index: A 
new technique for surface water mapping 
using Landsat imagery. Remote Sensing of 
Environment, 140, 23-35. doi: https:// doi.org 
/10.1016/j.rse.2013.08.029 
Frazier, P., Page, K., Louis, J., Briggs, S., Robertson, 
A. I., 2003. Relating wetland inundation to 
river flow using Landsat TM data. International 
Journal of Remote Sensing, 24(19), 3755-3770. 
doi:10.1080 /01431160 21000023916 
Fujii, T., 2012. Climate Change, Sea-Level Rise and 
Implications for Coastal and Estuarine 
Shoreline Management with Particular 
Reference to the Ecology of Intertidal Benthic 
Macrofauna in NW Europe. Biology, 1(3), 597-
616. doi:10.3390/biology1030597 
Hình 6. Ảnh hưởng của sinh vật phù du trong 
nước tới độ chính xác phân loại(Yang et al., 2015). 
 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 65 
Ghaffarian, S., Ghaffarian, S., 2014. Automatic 
histogram-based fuzzy C-means clustering for 
remote sensing imagery. ISPRS Journal of 
Photogrammetry and Remote Sensing, 97, 46-
57. doi:10.1016/j.isprsjprs.2014.08.006 
Ghosh, A., Mishra, N. S., Ghosh, S., 2011. Fuzzy 
clustering algorithms for unsupervised change 
detection in remote sensing images. 
Information Sciences, 181(4), 699-715. 
doi:10.1016/j.ins.2010.10.016 
Hao, J., Min, F., Yunqiang, Z., Ning, L., Jianxi, H., 
Tong, X., 2014. An Automated Method for 
Extracting Rivers and Lakes from Landsat 
Imagery. Remote Sensing, 6(6), 5067-5089. 
doi:10.3390/rs6065067 
Kersten, P. R., Jong-Sen, L., Ainsworth, T. L., 2005. 
Unsupervised classification of polarimetric 
synthetic aperture Radar images using fuzzy 
clustering and EM clustering. Geoscience and 
Remote Sensing, IEEE Transactions on, 43(3), 
519-527. doi:10.1109/TGRS.2004.842108 
Lin, J.-S., Cheng, K.-S., Mao, C.W., 1996. 
Segmentation of Multispectral Magnetic 
Resonance Image Using Penalized Fuzzy 
Competitive Learning Network. Computers 
and Biomedical Research, 29(4), 314-326. 
doi:https://doi.org/10.1006/cbmr.1996.0023 
McFeeters, S. K., 1996. The use of the Normalized 
Difference Water Index (NDWI) in the 
delineation of open water features. 
International Journal of Remote Sensing, 17(7), 
1425-1432. doi:10.1080/0143116960894 
8714 
McKeon, C. S., Tunberg, B. G., Johnston, C. A., 
Barshis, D. J., 2015. Ecological drivers and 
habitat associations of estuarine bivalves. 
PeerJ, 3, e1348. doi:10.7717/peerj.1348 
Pham, T. D., Yoshino, K., 2016. Impacts of 
mangrove management systems on mangrove 
changes in the Northern Coast of Vietnam. 
Tropics, 24(4), 141-151. 
doi:10.3759/tropics.24.141 
Ryu, J.-H., Won, J.-S., Min, K. D., 2002. Waterline 
extraction from Landsat TM data in a tidal flat: 
A case study in Gomso Bay, Korea. Remote 
Sensing of Environment, 83(3), 442-456. 
doi:10.1016/S0034-4257(02)00059-7 
Stavrakoudis, D. G., Theocharis, J. B., Zalidis, G. C., 
2011. A Boosted Genetic Fuzzy Classifier for 
land cover classification of remote sensing 
imagery. ISPRS Journal of Photogrammetry and 
Remote Sensing, 66(4), 529-544. 
doi:10.1016/j.isprsjprs.2011.01.010 
Verpoorter, C., Kutser, T., Seekell, D. A., Tranvik, L. 
J., 2014. A global inventory of lakes based on 
high-resolution satellite imagery. Geophysical 
Research Letters, 41(18), 6396-6402. 
doi:10.1002/2014GL060641 
White, K., El Asmar, H. M., 1999. Monitoring 
changing position of coastlines using thematic 
mapper imagery, an example from the Nile 
delta. Geomorphology, 29, 93-105. 
Xu, H., 2006. Modification of normalised 
difference water index (NDWI) to enhance 
open water features in remotely sensed 
imagery. International Journal of Remote 
Sensing, 27(14), 3025-3033. 
doi:10.1080/01431160600589179 
Yang, Y., Liu, Y., Zhou, M., Zhang, S., Zhan, W., Sun, 
C., Duan, Y., 2015. Landsat 8 OLI image based 
terrestrial water extraction from 
heterogeneous backgrounds using a 
reflectance homogenization approach. Remote 
Sensing of Environment, 171, 14-32. 
doi:10.1016/j.rse.2015.10.005 
66 Cao Xuân Cường, Võ Ngọc Dũng/Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 59 (4), 55-66 
ABSTRACT 
Modified fuzzy c - means based approach for water body extraction 
from water index images 
Cuong Xuan Cao, Dung Ngoc Vo 
Faculty of Geomatics and Land Administration, Hanoi University of Mining and Geology, Vietnam 
While surface waters play a crucial role on terrestrial life, this resource is under threats due to both 
human and natural activities. Extracting water bodies is an important task for the management of water 
resource. Traditional remote sensing based methods have difficulties in the water body extraction 
because of the coarse spatial resolution and spectral reflectance heterogeneity of satellite images. This 
paper presents a new approach for detecting water bodies from water index images based on the 
modified fuzzy c-means (MFCM). The approach was designed to improve the water extraction accuracy. 
It was applied to Landsat 8 OLI images captured over the Bach Dang estuary situated in Hai Phong and 
Quang Ninh. Results showed the MFCM method improved the accuracy of water extraction in comparison 
to the density slicing method in term of kappa coefficients, with 0.87 and 0.84, respectively. 

File đính kèm:

  • pdfung_dung_thuat_toan_phan_cum_mo_tren_anh_chi_so_nuoc_trong_c.pdf