Đánh giá hiệu năng của phương pháp phân tích thành phần chính PCA trong nhận dạng khuôn mặt có biến đổi về sắc thái

Tóm tắt – Các phương pháp nhận dạng mặt

người dựa trên vẻ ngoài thường gặp các khó khăn

khi khuôn mặt được nhận dạng có sự thay đổi

về sắc thái như khóc, cười, há miệng,. . . Trong

trường hợp này, các phương pháp nhận dạng

toàn phần có hiệu năng tốt hơn. Bài báo này

trình bày một số đánh giá dựa trên phương pháp

nhận dạng toàn phần trên mặt người có biến đổi

về sắc thái, sử dụng phương pháp rút gọn số

chiều PCA và các thuật toán phân lớp. Kết quả

thực nghiệm cho thấy độ chính xác phân lớp tốt

nhất khi sử dụng rất ít eigenvectors và thuật toán

KNN (khi k=1) cho kết quả tốt hơn SVM

6 trang yennguyen 880

Download

Bạn đang xem tài liệu "Đánh giá hiệu năng của phương pháp phân tích thành phần chính PCA trong nhận dạng khuôn mặt có biến đổi về sắc thái", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Đánh giá hiệu năng của phương pháp phân tích thành phần chính PCA trong nhận dạng khuôn mặt có biến đổi về sắc thái

TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018
61
ĐÁNH GIÁ HIỆU NĂNG CỦA PHƯƠNG PHÁP PHÂN TÍCH
THÀNH PHẦN CHÍNH PCA TRONG
NHẬN DẠNG KHUÔNMẶT CÓ BIẾN ĐỔI VỀ SẮC THÁI
Dương Ngọc Vân Khanh1, Nguyễn Bảo Ân2
AN EVALUATION ON PERFORMANCE OF PCA IN FACE RECOGNITION
WITH EXPRESSION VARIATIONS
Duong Ngoc Van Khanh1, Nguyen Bao An2
Tóm tắt – Các phương pháp nhận dạng mặt
người dựa trên vẻ ngoài thường gặp các khó khăn
khi khuôn mặt được nhận dạng có sự thay đổi
về sắc thái như khóc, cười, há miệng,. . . Trong
trường hợp này, các phương pháp nhận dạng
toàn phần có hiệu năng tốt hơn. Bài báo này
trình bày một số đánh giá dựa trên phương pháp
nhận dạng toàn phần trên mặt người có biến đổi
về sắc thái, sử dụng phương pháp rút gọn số
chiều PCA và các thuật toán phân lớp. Kết quả
thực nghiệm cho thấy độ chính xác phân lớp tốt
nhất khi sử dụng rất ít eigenvectors và thuật toán
KNN (khi k=1) cho kết quả tốt hơn SVM.
Từ khóa: nhận dạng khuôn mặt có biến đổi
sắc thái, phân tích thành phần chính, thuật
toán KNN
Abstract – Appearance-based recognition
methods often encounter difficulties when the
input images contain facial expression variations
such as laughing, crying or wide mouth open-
ing. In these cases, holistic methods give bet-
ter performance than appearance-based methods.
This paper presents some evaluation on face
recognition under variation of facial expression
1,2Bộ môn Công nghệ Thông tin, Khoa Kĩ thuật và Công
nghệ, Trường Đại học Trà Vinh
Ngày nhận bài: 21/12/2017; Ngày nhận kết quả bình
duyệt: 22/02/2018; Ngày chấp nhận đăng: 30/7/2018
Email: vankhanh@tvu.edu.vn
1,2School of Information Technology, School of Engineer-
ing and Technology, Tra Vinh University
Received date: 21st December 2017; Revised date:
22nd February 2018; Accepted date: 30th July 2018
using the combination of PCA and classification
algorithms. The experimental results showed that
the best accuracy can be obtained with very
few eigenvectors and KNN algorithm (with k=1)
performs better than SVM in most test cases.
Keywords: face recognition under expression
variations, principle component analysis, KNN
algorithm
I. GIỚI THIỆU
Nhận dạng khuôn mặt (facial recognition) là
một bài toán tiêu biểu của học máy (machine
learning) và nhận dạng mẫu (pattern recognition).
Thao tác nhận dạng thường được cài đặt bằng
một thuật toán phân lớp (classification) dưới mô
hình học có giám sát (supervised learning). Một
cách tổng quát, ảnh đầu vào luôn chịu ảnh hưởng
bởi một hoặc nhiều sự biến đổi so với ảnh được
lưu trong cơ sở dữ liệu. Một số biến đổi có
thể kể đến là điều kiện ánh sáng (illumination
variation – trong đó bao gồm hướng và cường
độ của nguồn sáng), góc chụp (pose variation),
trang điểm (make-up), tuổi tác (aging), biểu cảm
của khuôn mặt (facial expression),... Các nghiên
cứu nhận dạng mặt người đều cố gắng thích nghi
với nhiều sự biến đổi nhất có thể. Bài báo này
trình bày kết quả việc ứng dụng phương pháp
phân tích thành phần chính Principal Component
Analysis (PCA) trong rút gọn số chiều dữ liệu để
nhận dạng khuôn mặt người có biến đổi về sắc
thái với nhiều thuật toán phân lớp khác nhau. Kết
quả cho thấy khi xử lí rút gọn số chiều bằng PCA,
thuật toán phân lớp K-nearest neighbors (KNN)
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG
(với k=1) cho kết quả trong tập dữ liệu kiểm thử
tốt hơn so với thuật toán Support Vector Machine
(SVM) trong hầu hết thí nghiệm.
II. TỔNG QUAN NGHIÊN CỨU
A. Các kĩ thuật nhận dạng khuôn mặt
Các kĩ thuật nhận dạng khuôn mặt có thể chia
thành ba nhóm chính: nhận dạng từ ảnh tĩnh,
nhận dạng từ chuỗi ảnh động (video) và nhận
dạng theo mô hình ba chiều (với ảnh của đối
tượng được ghi nhận bởi một camera hồng ngoại
3D). Phạm vi bài báo này chỉ trình bày chi tiết
phương pháp nhận dạng ảnh tĩnh. Các kĩ thuật
nhận dạng khuôn mặt từ ảnh tĩnh có thể chia ra
hai nhóm: nhận dạng dựa vào đặc trưng (từng
phần – feature based recognition) và nhận dạng
toàn phần (holistic).
1) Các kĩ thuật nhận dạng dựa vào đặc trưng
(feature based): Trong các kĩ thuật này, người
ta thường cố gắng trích ra những đặc trưng trên
khuôn mặt như mũi, mắt, miệng, chân mày và
tính mối liên hệ về hình học giữa các điểm này,
sau đó rút gọn ảnh đầu vào bằng một vector biểu
thị đặc trưng hình học của khuôn mặt. Tiếp theo,
chúng ta sử dụng các vector này để so khớp trong
bộ nhận dạng. Cách rút trích đặc trưng khuôn
mặt sử dụng trong nhiều phương pháp khác nhau
được biểu diễn trong các Hình 1 và 2. Năm 1993,
Brunelli và Poggio [1] xây dựng một mô hình
nhận dạng gồm 35 đặc trưng hình học của khuôn
mặt từ một cơ sở dữ liệu khuôn mặt của 47 người.
Mô hình này cho tần số nhận dạng khoảng 90%.
Năm 1996, Cox và cộng sự [4] xây dựng một mô
hình phức tạp hơn là sử dụng một vector 30 chiều
trích xuất từ mô hình 35 đặc trưng và cho tần số
nhận dạng đến 95%. Một cách tiếp cận khác là
sử dụng đồ thị co giãn (elastic bunch graph) để
biểu thị đặc trưng của khuôn mặt [2], một số điểm
chuẩn trên khuôn mặt được chọn, các cạnh nối
các điểm chuẩn này sẽ tạo thành một đồ thị dạng
lưới bao trùm hết khuôn mặt, khi có một khuôn
mặt mới cần nhận dạng, đồ thị cho khuôn mặt
mới sẽ được hình thành bằng thuật toán Elastic
Bunch Graph Matching. Phương pháp này cho độ
chính xác lên đến 98%. Nhưng cách tiếp cận dễ
hơn đã được đề xuất bởi Liposcak và Loncaric
[3] với vector 21 đặc trưng sử dụng phương pháp
Hình 1: a) Các đặc trưng hình học - (Nguồn:
Theo R. Brunelli và T. Poggio [1])
b) Mô hình 35 đặc trưng - (Nguồn: Theo I. J.
Cox và cộng sự [4])
c) Lưới các đặc trưng - (Nguồn: Theo L. Wiskott
[2])
d) Mô hình 12 điểm đặc trưng - (Nguồn: Theo
Z. Liposcak [3])
e) Mô hình 21 vector đặc trưng – (Nguồn: Theo
Z. Liposcak [3])
lọc subspace filtering và cho độ chính xác khoảng
90%.
Các phương pháp nhận dạng dựa trên đặc
trưng, do chỉ trích xuất các đặc trưng từng phần
của khuôn mặt, có ưu điểm là mạnh mẽ với sự
thay đổi của vị trí khuôn mặt trong ảnh, kích
thước của ảnh cũng như hướng và điều kiện ánh
sáng và tốc độ so khớp khi nhận dạng nhanh. Tuy
nhiên, khó khăn của các phương pháp này là sự
phức tạp trong các thao tác xử lí ảnh để trích xuất
các đặc trưng và xác định mức độ quan trọng của
từng đặc trưng.
2) Các kĩ thuật nhận dạng toàn phần (holistic):
Kĩ thuật nhận dạng toàn phần dùng toàn bộ khuôn
mặt để làm dữ liệu đầu vào. Để nhận dạng,
người ta thường dùng các thuật toán máy học
như SVM (Support Vector Machine) [5], mạng
Neuron, KNN (K nearest neighbors – K láng
giềng gần nhất). . . Thông thường, chúng ta phải
dùng một hàm đo độ tương tự giữa hai đối tượng
dữ liệu, phổ biến nhất là khoảng cách Euclidean
(Euclidean distance). Tuy nhiên, do ảnh có số
62
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG
chiều lớn (trên dưới 100x100) nên cần có một
phương pháp rút gọn số chiều để đưa dữ liệu
về một không gian có số chiều nhỏ hơn so với
không gian gốc và tiến hành các thao tác nhận
dạng trên dữ liệu mới này mà không ảnh hưởng
đến kết quả phân lớp (thậm chí mang lại hiệu
quả cao hơn khi tiến hành trên không gian gốc).
Hai phương pháp rút gọn số chiều thường được
sử dụng là PCA (Principle Component Analysis)
[6], [7] và LDA (Linear Discriminant Analysis)
[8].
Ưu điểm của phương pháp nhận dạng toàn
phần là lấy toàn bộ dữ liệu của khuôn mặt làm
dữ liệu nhận dạng, tránh mất mát thông tin. Tuy
nhiên, điều này cũng hạn chế khi một số phương
pháp xem rằng tất cả pixel trong ảnh đều có độ
quan trọng như nhau. Hơn nữa, độ phức tạp tính
toán khi tính độ tương quan giữa toàn bộ các ảnh
cũng rất cao cũng như hiệu năng của nhận dạng
khi điều kiện ánh sáng, góc chụp thay đổi cũng
không tốt.
Với dữ liệu mặt người có sự biến đổi về sắc
thái, chúng tôi cho rằng sự sai biệt giữa phần của
khuôn mặt tạo nên các sắc thái khác nhau, ví dụ
như miệng và mắt của một người khi cười sẽ rất
khác biệt so với khi khóc. Do đó, chúng ta sẽ rất
khó tìm được sự tương quan khi sử dụng phương
pháp nhận dạng dựa trên đặc trưng. Ngược lại,
khi sử dụng phương pháp nhận dạng toàn phần,
các biến đổi về sắc thái này được kì vọng không
ảnh hưởng nghiêm trọng đến độ đo sự tương tự
giữa các ảnh. Nếu chiếu lên không gian tọa độ,
ta kì vọng rằng các ảnh của cùng một người với
biến đổi sắc thái khác nhau vẫn nằm gần nhau.
Đó là lí do chúng tôi chọn PCA để xử lí trường
hợp ảnh khuôn mặt có biến đổi sắc thái, vì PCA
là phương pháp rút gọn số chiều nhưng vẫn duy
trì sự phân bố của dữ liệu rất tốt. Bài báo này
nhằm đánh giá hiệu năng của phương pháp PCA
và so sánh giữa thuật toán KNN và SVM trong
phân lớp dữ liệu mặt người có biến đổi sắc thái
trong một số kịch bản khác nhau.
B. Phương pháp PCA (Principle Component
Analysis)
Phân tích thành phần chính (Priciple Compo-
nent Analysis – PCA) được đề xuất lần đầu tiên
bởi Karl Pearson vào năm 1901 [8] và được ứng
dụng trong các lĩnh vực khác nhau dưới nhiều
tên gọi khác nhau. Trong phân tích dữ liệu, PCA
được sử dụng rộng rãi để khám phá dữ liệu (data
exploring), rút gọn dữ liệu (data reduction), nén
dữ liệu (data compression) đối với dữ liệu có số
chiều lớn, khó trực quan hóa và tính toán.
Mục đích chính của PCA là giảm số chiều dữ
liệu với các mục tiêu: i) tìm một không gian mới
với số chiều ít hơn so với không gian gốc nhưng
vẫn giữ được khả năng biểu diễn phân bố của dữ
liệu tương đương hoặc tốt hơn trong không gian
cũ, tức là đảm bảo độ biến thiên (variability) của
dữ liệu trên số chiều mới; ii) các trục tọa độ trong
không gian mới phải trực giao với nhau và được
tính toán dựa vào dữ liệu quan sát được ở không
gian cũ; iii) kì vọng đặt ra với không gian mới
là tính tương quan của dữ liệu được thể hiện tốt
hơn trong không gian gốc. Như vậy, ta phải tìm
các vector trực giao ω sao cho khi ta chiếu dữ
liệu lên các vector này thì phương sai của dữ liệu
được tối đa hóa.
Với X là ma trận dữ liệu gốc ta muốn tối đa
hóa Var(ωT X), với ràng buộc ||ω||=1, bài toán
tối đa hóa trên có hàm mục tiêu J(ω)=Var(ωT X)
(1)
Theo công thức của phương sai, ta có thể thế
vào (1), với µ là trung bình của X
J(ω) = E(ωTX − ωTµ)2 = E(ωTX −
ωTµ)(XTω−µTω) = ωTE(X−µ)(X−µ)Tω =
ωTΣ
với Σ= E(X-µ) (X-µ)T là ma trận hiệp phương
sai.
Với mục tiêu là cực đại hóa J(ω) theo biến ω,
với ω được chuẩn hóa sao cho thỏa ràng buộc
||ω||=1, điều này có thể được giải quyết bởi thao
tác tối ưu hóa Lagrangian với các ràng buộc đã
nêu: L(ω,λ)= ωT σω-λ(ωT ω-1).
Tạo phương trình L′ (ω,λ)=0 với L′ (ω,λ) là
đạo hàm của L(ω,λ) theo biến ω, ta có:
∂L(ω, λ)
∂Lω
= 2Σω − 2λω = 0↔ Σω = λω
Lúc này, mục tiêu của bài toán trở về tìm biến
ω thỏa mãn Σω = λω. Dựa vào định nghĩa của
eigenvector và eigenvalue, ta thấy, mục tiêu là tìm
các eigenvector ω và eigenvalue của ma trận hiệp
phương sai Σ. Với dữ liệu có n chiều, ta có thể tìm
được n eigenvector và n eigenvalue. Tuy nhiên,
63
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG
ta không cần sử dụng hết tất cả các eigenvector
mà chỉ cần chọn một số eigenvector sao cho tại
đó eigenvalue đạt một giá trị tương đối cao. Điều
này có thể thực hiện bằng cách sắp xếp lại các
eigenvector theo thứ tự giảm dần của eigenvalue
tương ứng, sau đó chọn ra n eigenvectors để đại
diện cho không gian mới, với n rất nhỏ so số
chiều của không gian gốc. Ta gọi các eigenvector
được chọn là FeatureVector, vậy:
FeatureV ector = (eig1, eig2eig3. . . eign)
C. Thủ thuật Gram Matrix
Giả sử ta có bộ dữ liệu ảnh với kích thước
200×200 (40.000 chiều), vậy kích thước của ma
trận hiệp phương sai Σ = E(X − µ)(X − µ)T
là 400002. Trong thực tế, ta không thể khởi tạo
một ma trận có số chiều cực lớn như vậy khi lập
trình. Hơn nữa, với tập dữ liệu có N mẫu (N rất
nhỏ so với số chiều của dữ liệu), chúng ta chỉ
cần tối đa N-1 eigenvectors. Để giải quyết vấn
đề này, ta sử dụng thủ thuật Gram Matrix.
Ta biết Σ = E(X − µ)(X − µ)T . Ta phải giải
bài toán tìm v và λ sao cho: Σ v= λ v ↔ XXT
v=λ v.
Nhân cả hai vế cho XT ta có: XT XXT v=λ
XT v.
Đặt v′ = XT v, ta được: XTXv′ = λv′. Vậy,
bài toán được đưa về tìm eigenvector v’. Ma trận
XT X được gọi là ma trận Gram. Kích thước
của nó không phụ thuộc vào số chiều của dữ liệu
nhưng phụ thuộc vào số mẫu dữ liệu trong bộ dữ
liệu đào tạo. Số chiều của nó bằng N×N, với N
là số đối tượng dữ liệu trong tập dữ liệu.
Vậy, thay vì tìm các eigenvectors v cho một
ma trận hiệp phương sai khổng lồ, ta chỉ cần
tìm các eigenvector v’ cho ma trận Gram có số
chiều NxN. Như vậy, ta chỉ cần tìm tối đa N-1
eigenvector để biểu diễn không gian mới. Vấn đề
còn lại là làm sao phục hồi lại được v từ v’
Ta có:
XXT v = λv (1)
v′ = XT v (2)
Thế (2) vào (1) ta được Xv′=′ v, vậy v=Xv′ (ta
không quan tâm đến hằng số λ vốn kéo dài v ra
λ lần, vì ||v||=1)
III. CÀI ĐẶT THỰC NGHIỆM
Thử nghiệm được cài đặt bằng Matlab. Dữ
liệu thử nghiệm được lấy từ bộ dữ liệu Face
Expression Database (CMU AMP Lab) [9] bao
gồm ảnh gương mặt của 13 người khác nhau với
nhiều nét biểu cảm khác nhau, mỗi người có 74
ảnh với kích thước 64×64 pixels (Hình 2). Thí
nghiệm được tiến hành như sau:
Bước 1: Chọn 5 ảnh đầu tiên của mỗi người
làm dữ liệu đào tạo, vậy tập dữ liệu Dtraining có
13×5 = 65 ảnh.
Bước 2: Thực hiện PCA trên tập Dtraining để
tìm các eigenvector và eigenvalue, ta có tất cả 65-
1= 64 eigenvectors và eigenvalues, ảnh của các
eigenvector đầu tiên thể hiện trong Hình 3.
Hình 2: Một số ảnh trong bộ dữ liệu thử nghiệm
(Nguồn: Electrical & Computer engineering [9])
Bước 3: Lấy 3 eigenvector quan trọng nhất (có
eigenvalue lớn nhất) biểu diễn không gian mới.
Vậy, dữ liệu được rút gọn từ 64x64=4096 chiều
xuống còn 3 chiều.
Bước 4: Chiếu tập dữ liệu đào tạo lên không
gian ba chiều vừa hình thành, ta được 65 mẫu
dữ liệu ba chiều. Hình 4 thể hiện phân bố của
các mẫu dữ liệu đào tạo ba lớp 1, 2, và 3 trong
không gian ba chiều. Dễ thấy, trong không gian
đã rút gọn, phân bố của các đối tượng tương đối
tách biệt giữa các lớp.
Bước 5: Dùng tập 13×69 ảnh còn làm tập dữ
liệu kiểm thử, ta cũng rút gọn bộ dữ liệu này bằng
cách chiếu lên không gian ba chiều đã chọn. Phân
bố của toàn bộ 3×75 ảnh của ba lớp đầu tiên khi
chiếu lên không gian ba chiều được biểu diễn ở
Hình 4. Ta có thể thấy ảnh của ba lớp phân bố
ở ba cụm phân biệt rất rõ ràng. Điều này chứng
tỏ không gian mới, dù chỉ ba chiều, thể hiện sự
biến thiên của dữ liệu rất tốt và có thể làm tăng
hiệu quả phân lớp.
64
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG
Hình 3: Ảnh trung bình và ảnh của các
eigenvector.
(Nguồn: Kết quả thí nghiệm)
Hình 4: a) Hình chiếu trong không gian ba chiều
của dữ liệu đào tạo ba lớp 1, 2 và 3
b) Phân bố của tất cả các ảnh thuộc ba lớp 1, 2
và 3
(Nguồn: Kết quả thí nghiệm)
Bước cuối cùng là sử dụng thuật toán KNN để
phân lớp: dựa vào khoảng cách Euclidean trong
không gian ba chiều, ta có thể gán nhãn cho một
ảnh đang xét dựa vào nhãn chiếm đa số trong k
láng giềng gần nhất của nó. Do số lớp tương đối
lớn, khi sử dụng k>1 sẽ gây tình trạng cạnh tranh
giữa các nhãn dữ liệu được gán, do đó chúng tôi
chọn k=1 trong tất cả thí nghiệm.
IV. KẾT QUẢ THỰC NGHIỆM VÀ
THẢO LUẬN
A. Lựa chọn số eigen vector tối ưu cho PCA
Để chọn số eigen vector tối ưu cho PCA, chúng
tôi thử nghiệm thay đổi số eigen vectors từ 2 đến
30 và sử dụng hai thuật toán KNN và SVM để
phân lớp và được kết quả như trong Hình 5. Thực
nghiệm cho thấy PCA không cần quá nhiều eigen
vectors để tái tạo dữ liệu nhưng vẫn đảm bảo
tính chính xác của phép phân lớp. Trong tất cả
64 eigenvector có được từ bộ dữ liệu đào tạo, với
thuật toán KNN, ta chỉ cần sử dụng 4 vectors để
có được kết quả tốt nhất, tuy nhiên với thuật toán
SVM khi tăng số eigenvector lên trên 10 vectors,
hiệu năng phân lớp sẽ giảm dần.
Hình 5: Độ chính xác phân lớp khi sử dụng số
eigenvector khác nhau.
(Nguồn: Kết quả thí nghiệm)
B. Các đánh giá hiệu năng trên tập dữ liệu
không đầy đủ
Để đánh giá hiệu năng của PCA trên các bộ
dữ liệu khuôn mặt không hoàn chỉnh và với các
thuật toán phân lớp khác nhau, chúng tôi tạo
các bộ dữ liệu khuôn mặt mới dựa vào tập dữ
liệu AMP. Trong đó, tất cả các ảnh sẽ được che
một phần bằng màu đen hoặc thêm nhiễu ngẫu
nhiên theo cả hai hướng đứng và ngang, tên và
ví dụ các bộ dữ liệu được thể hiện trong Hình 6a
(con số trong tên bộ dữ liệu thể hiện số cột/dòng
bị che).
Sau khi tạo bộ dữ liệu không hoàn chỉnh,
chúng tôi thực hiện theo quy trình đã mô tả ở
trên và phân lớp theo bằng cả hai thuật toán
KNN (k=1) và SVM. Độ chính xác của các thao
tác thể hiện ở Hình 6. Đối với ảnh bị che theo
chiều ngang, trong cả hai trường hợp khi bị che
khoảng 30% phía trên, cả hai thuật toán đều cho
kết quả trên 90%. Khi tăng phần khuôn mặt bị
che lên đến 50%, độ chính xác của bộ ảnh bị che
bằng nhiễu ngẫu nhiên giảm đi đáng kể, đặc biệt
65
TẠP CHÍ KHOA HỌC TRƯỜNG ĐẠI HỌC TRÀ VINH, SỐ 30, THÁNG 6 NĂM 2018 KHOA HỌC CÔNG NGHỆ - MÔI TRƯỜNG
Hình 6: a) Ảnh khuôn mặt che bằng nhiều ngẫu
nhiên; so sánh độ chính xác phân lớp với dữ liệu
khuôn mặt bị che ngang bằng màu đen (a), che
ngang bằng nhiễu ngẫu nhiên (b) và che bên trái
bằng nhiễu ngẫu nhiên (c)
(Nguồn: Kết quả thí nghiệm)
là với thuật toán SVM. Còn đối với bộ ảnh bị
che theo chiều dọc bên trái, khi phần bị che lên
đến 25%, thuật toán KNN vẫn cho độ chính xác
trên 90%, trong khi SVM chỉ cho độ chính xác
khoảng 80%.
Nhìn chung, kết quả thực nghiệm cho thấy
thuật toán KNN cho hiệu năng phân lớp khuôn
mặt tốt nhất khi k=1 và trong phần lớn trường
hợp KNN đều cho kết quả tốt hơn SVM. Đối với
các bộ dữ liệu khuôn mặt không hoàn chỉnh, dễ
thấy trường hợp khuôn mặt bị che theo chiều dọc
ảnh hưởng lớn đến khả năng phân lớp hơn trường
hợp vùng khuôn mặt bị che theo chiều ngang và
vùng bị che bằng nhiễu ngẫu nhiên sẽ ảnh hưởng
lên hiệu năng phân lớp lớn hơn so với bị che
bằng màu đen.
V. KẾT LUẬN
Bài báo này trình bày một phương pháp hữu
hiệu để nhận dạng khuôn mặt có độ chính xác
đáng kể khi thực thi trên bộ dữ liệu khuôn mặt
có biến đổi về sắc thái. Thực nghiệm chứng tỏ
khi sử dụng PCA để rút gọn số chiều và đưa dữ
liệu gốc về một không gian ít chiều hơn, phân bố
của dữ liệu vẫn đảm bảo tính biến thiên như kì
vọng. Đặc biệt với bộ dữ liệu ảnh có biến đổi về
sắc thái khuôn mặt, dữ liệu được rút gọn thuộc
các lớp khác nhau phân bố ở các cụm rất rõ ràng
và tách biệt trong không gian mới, điều này giúp
tăng hiệu quả phân lớp so với trong không gian
gốc. Khi tiến hành phân lớp với hai thuật toán
KNN và SVM, thuật toán KNN với k =1 cho kết
quả tốt trong hầu hết trường hợp. Sau khi thực
hiện PCA, độ phức tạp tính toán giảm đi đáng
kể (với bộ dữ liêu thử nghiệm, có thể giảm từ
4096 chiều về ba chiều), nhờ đó có thể dễ dàng
cài đặt ở các thiết bị có hiệu năng tính toán thấp
và cần thời gian đáp ứng nhanh. Tuy hiệu năng
phân lớp ở các trường hợp dữ liệu không hoàn
chỉnh vẫn chưa cao nhưng sự kết hợp giữa PCA
và KNN vẫn là một cách tiếp cận rất đáng quan
tâm nghiên cứu như một mô hình tham chiếu
trong các nghiên cứu nhận dạng mặt người.
TÀI LIỆU THAM KHẢO
[1] Brunelli R, Poggio T. Face recognition: features versus
templates. IEEE Transactions on Pattern Analysis and
Machine Intelligence. 1993;15:1042–1052.
[2] Wiskott L, Fellous J M, Kru¨ger N, von der Malsburg C.
Face Recognition by Elastic Bunch Graph Matching.
In: L C Jain, U Halici, I Hayashi, S B Lee, , Jae-Ho,
editors. Intelligent Biometric Techniques in Fingerprint
and Face Recognition. CRC Press; 1999. p. 355–396.
[3] Liposcak Z, Loncaric S. A scale-space approach to
face recognition from profiles. In: Proceedings of the
8th International Conference on Computer Analysis of
Images and Patterns. London, UK: Springer- Verlag;
1999. p. 243–250.
[4] Cox I J Ghosn J, Yianilos P N. Feature- based face
recognition using mixture-distance. In: Proceedings
of IEEE Conference on Computer Vision and Pattern
Recognition; 1996. p. 209–216.
[5] Cortes C, Vapnik V. Support-vector networks. Machine
Learning. 1995;20(3):273–297.
[6] Jain A K, Dubes R C. Algorithms for Clustering Data.
vol. 152. New Jersey: Prentice-Hall; 1988.
[7] Fukunaga K. Introduction to Statistical Pattern Recog-
nition. 2nd ed. MA: Academic Press; 1990.
[8] Pearson K. On Lines and Planes of Closest Fit to
Systems of Points in Space. Philosophical Magazine.
1901;p. 1042–1052.
[9] Electrical & Computer Engineering. Face Au-
thentication Project ; 2018. Truy cập từ:
/FaceAuthentication/download.html [Ngày truy cập:
14/11/2017].
66

File đính kèm:

danh_gia_hieu_nang_cua_phuong_phap_phan_tich_thanh_phan_chin.pdf