Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo

ABSTRACT

In this paper, we proposed computer vision and machine learning

algorithms for an automatic road-sign detection and recognition system

using HOG feature and Neural networks. Our system is able to detect and

recognize almost road sign categories such as prohibition, danger,

warning and information which are not overlapped. The experiments are

carried out on the dataset of 31 video files. The average time to detect and

identify the road signs on a frame image is approximately 0.021 seconds

when using the classification model with the MLP neural network model,

and approximately 0.099 seconds when using the SVM classification

model. The accuracy rate for road sign identification is about 94% for

both models

pdf 8 trang yennguyen 9520
Bạn đang xem tài liệu "Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo

Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 47 
PHÁT HIỆN VÀ NHẬN DẠNG BIỂN BÁO GIAO THÔNG ĐƯỜNG BỘ 
SỬ DỤNG ĐẶC TRƯNG HOG VÀ MẠNG NƠRON NHÂN TẠO 
Trương Quốc Bảo1, Trương Hùng Chen2 và Trương Quốc Định3 
1 Khoa Công nghệ, Trường Đại học Cần Thơ 
2 Khoa Kỹ thuật - Công nghệ, Trường Cao đẳng Cần Thơ 
3 Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ 
Thông tin chung: 
Ngày nhận: 19/09/2015 
Ngày chấp nhận: 10/10/2015 
Title: 
Road traffic sign detection 
and recognition using HOG 
feature and Artificial Neural 
network 
Từ khóa: 
Hệ thống giao thông thông 
minh, biển báo giao thông 
đường bộ, đặc trưng HOG, 
mạng Nơron, máy học vectơ 
hỗ trợ 
Keywords: 
Intelligent transport system, 
Road traffic signs, HOG 
features, Neural network, 
support vector machine 
(SVM) 
ABSTRACT 
In this paper, we proposed computer vision and machine learning 
algorithms for an automatic road-sign detection and recognition system 
using HOG feature and Neural networks. Our system is able to detect and 
recognize almost road sign categories such as prohibition, danger, 
warning and information which are not overlapped. The experiments are 
carried out on the dataset of 31 video files. The average time to detect and 
identify the road signs on a frame image is approximately 0.021 seconds 
when using the classification model with the MLP neural network model, 
and approximately 0.099 seconds when using the SVM classification 
model. The accuracy rate for road sign identification is about 94% for 
both models. 
TÓM TẮT 
Trong bài báo này, chúng tôi trình bày thuật toán xử lý ảnh và máy học để 
tự động phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng 
đặc trưng cục bộ HOG và mạng Nơron nhân tạo. Hệ thống của chúng tôi 
có khả năng phát hiện và nhận dạng hầu hết các loại biển báo giao thông 
như biển báo cấm, biển báo nguy hiểm, biển hiệu lệnh và biển chỉ dẫn 
không bị chồng lấp. Thực nghiệm được tiến hành với 31 video với thời 
gian trung bình để phát hiện và nhận dạng các biển báo giao thông trên 
một frame ảnh xấp xỉ 0.021 giây khi sử dụng mô hình phân lớp với mạng 
nơron nhân tạo và khoảng 0.099 giây khi dùng mô hình phân lớp SVM và 
độ chính xác nhận dạng khoảng 94%. 
1 GIỚI THIỆU 
Việc ứng dụng công nghệ thông tin để giải 
quyết các vấn đề trong lĩnh vực giao thông đang là 
một chủ đề nóng ở nước ta hiện nay. Vấn đề phát 
triển giao thông thông minh để giảm thiểu ùn tắc, 
tai nạn và tiết kiệm nguồn lực cũng được thảo luận 
trong nhiều hội thảo, diễn đàn như diễn đàn cấp 
cao Công nghệ Thông tin – Truyền thông Việt 
Nam (Vietnam ICT Summit), 2015. Phát hiện và 
nhận dạng biển báo giao thông là một công cụ hỗ 
trợ trong hệ thống giao thông thông minh. Các hệ 
thống như vậy đang được phát triển và ứng 
dụng trong ngành công nghiệp tự động hóa, thông 
minh ở một số quốc gia phát triển trên thế giới với 
nhiều công trình nghiên cứu của (Arturo de la 
Escalera et al., 1997; Auranuch Lorsakul et al., 
2007; Andrzej Ruta, 2009; Andrzej Ruta, 2011; 
hay Gauri A. Tagunde et al., 2012). Ở Việt Nam, 
cũng có một số nghiên cứu về lĩnh vực này như 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 48 
nghiên cứu của (Lê Thanh Tâm et al., 2009 hay 
Nguyễn Duy Khánh et al., 2011). 
Bài báo này trình bày phương pháp phát hiện và 
nhận dạng các biển báo giao thông đường bộ sử 
dụng kết hợp các kỹ thuật phân đoạn ảnh, phát hiện 
biên và phân tích hình dáng đối tượng để phát hiện 
vùng ứng viên có thể là biển báo giao thông. Sau 
đó, rút trích đặc trưng HOG và huấn luyện mạng 
Nơron nhân tạo để nhận dạng biển báo. Quy trình 
xử lý tổng quát của phương pháp được trình bày 
như trong hình 1. Đầu tiên, ảnh đầu vào sẽ được 
phân đoạn để loại bỏ nền nhằm làm nổi bật các đối 
tượng có thể là biển báo giao thông, biên của các 
đối tượng này sẽ được xử lý lọc kích thước và phân 
tích hình dáng để chọn ra các vùng ứng viên là biển 
báo giao thông. Tiếp theo, các vùng ứng viên sẽ 
được trích đặc trưng HOG, các đặc trưng trích ra 
được phân lớp với mô hình mạng Nơron đã được 
huấn luyện trước đó để nhận dạng loại biển báo. 
Kết quả huấn luyện và nhận dạng cũng được so 
sánh với mô hình phân lớp sử dụng SVM để xác 
định mô hình nhận dạng phù hợp nhất. Mục tiếp 
theo của bài báo trình bày chi tiết phương pháp 
nghiên cứu, mục này bao gồm kỹ thuật phân đoạn 
ảnh dựa trên không gian màu RGB và IHLS, 
phương pháp ước lượng kích thước và hình dáng 
của biển báo giao thông dựa trên biên đối tượng để 
chọn ra các vùng ứng viên, thuật toán trích đặc 
trưng HOG của các vùng ứng viên là biển báo giao 
thông, huấn luyện mạng Nơron. Trước khi trình 
bày chi tiết các nội dung, chúng tôi giới thiệu sơ 
lược một số loại biển báo giao thông đường bộ 
đang sử dụng ở Việt Nam. Các kết quả thực 
nghiệm và thảo luận được trình bài trong mục 3. 
Mục 4 là kết luận và các định hướng tiếp theo của 
bài báo. 
Hình 1: Quy trình tổng quát của thuật toán 
phát hiện và nhận dạng biển báo giao thông 
đường bộ 
2 PHƯƠNG PHÁP NGHIÊN CỨU 
2.1 Biển báo giao thông đường bộ Việt Nam 
Biển báo giao thông là phương tiện được dùng 
để thông báo, chỉ dẫn người tham giao thông điều 
khiển phương tiện lưu thông nhằm đảm bảo an 
toàn giao thông và được quy chuẩn trong “Quy 
chuẩn kỹ thuật quốc gia về báo hiệu đường bộ”. 
Quy chuẩn này được ban hành kèm theo Thông tư 
số 17/2012/TT-BGTVT với mã số đăng ký là: 
QCVN 41: 2012/BGTVT. Theo đó, biển báo giao 
thông đường bộ ở nước ta được chia thành 4 nhóm 
chính, Bảng 1 trình bày một số biển báo tương ứng 
với mỗi nhóm. 
Bảng 1: Bốn nhóm biển báo chính ở nước ta 
TT Tên nhóm Nội dung 
1 Biển báo cấm 
Gồm 40 biển báo được đánh số thứ tự từ 101 đến 140 và tên tương ứng. Các biển 
báo trong nhóm này biểu thị các điều cấm hoặc hạn chế mà người sử dụng đường 
phải chấp hành. Một số biển thuộc nhóm này là: , , , ,  
2 Biển báo nguy hiểm 
Gồm 47 biển báo đượcđánh thứ tự từ 201 đến 247 và tên tương ứng. Các biển này 
được dùng để cảnh báo các tình huống nguy hiểm. Một số biển trong nhóm là: 
, , , , ,  
3 Biển hiệu lệnh Gồm 10 biển có số thứ tự từ 301 đến 310 và tên tương ứng, được dùng để báo các hiệu lệnh cho người sử dụng đường. Một số biển trong nhóm này là: , ,  
4 Biển chỉ dẫn Gồm có 47 biển được đánh thứ tự từ 401 đến 447 và tên tương ứng, dùng để chỉ hướng đi và các điều cần thiết. Một số biển trong nhóm , ,  
2.2 Phân đoạn ảnh 
Phân đoạn ảnh là một bước quan trọng trong 
các ứng dụng xử lý ảnh. Trong nghiên cứu này, 
chúng tôi tiến hành phân đoạn ảnh dựa vào màu đỏ 
(Red) trên các biển báo cấm và nguy hiểm; màu 
xanh lam (Blue) trên các biển hiệu lệnh và chỉ dẫn. 
Đầu tiên, ảnh đầu vào trong không gian màu RGB 
được chuyển sang không gian màu IHLS bằng 
công thức (1), (2) và (3).Trong đó, R là thành phần 
đỏ (Red), G là xanh lục (Green), B là xanh lam 
(Blue) trong không gian màu RGB và H là thành 
phần màu sắc (Hue), L là độ sáng (Lightness), S là 
độ bão hòa trong không gian màu IHLS. 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 49 
ۖە
۔
ۖۓ ܪ ൌ ߠ	݂݅	ܤ ൑ ܩܪ ൌ 360 െ ߠ	݂݅	ܤ ൐ ܩ
ߠ ൌ ܿ݋ݏିଵ ቆ ቂோି
ಸ
మି
ಳ
మቃ
ඥோమାீమା஻మିோீିோ஻ିீ஻ቇ
 (1) 
L = 0.2126R + 0.7152G + 0.0722B (2) 
S = max(R, G, B) – min(R, G, B) (3) 
Sau khi chuyển ảnh sang không gian màu 
IHLS, giá trị H và S được chọn tương ứng với màu 
đỏ hoặc màu xanh lam trên biển báo giao thông. 
Đối với màu đỏ, những điểm ảnh (pixels) có giá trị 
H183 và S>16 được thể hiện trong 
ảnh trắng đen với màu trắng (giá trị 1), những điểm 
ảnh còn lại được thể hiện với màu đen (giá trị 0). 
Đối với màu xanh lam, tương tự như trên, những 
pixels có giá trị 14336 được thể hiện 
bằng màu trắng, những pixels còn lại được thể hiện 
bằng màu đen. Hình 2, Hình 3 và Hình 4 lần lượt là 
các ảnh RGB, IHLS và ảnh trắng đen khi phân 
đoạn dựa màu đỏ trên biển báo. 
Hình 2: Ảnh trong không gian màu RGB 
Hình 3: Ảnh chuyển từ RGB sang IHLS 
Hình 4: Ảnh trắng đen 
2.3 Phát hiện vùng ứng viên 
Ảnh trắng đen thu được ở giai đoạn trước được 
lọc bằng bộ lọc Median kích thước 5x5 để loại bớt 
các vùng nhiễu. Tiếp theo, chúng tôi sử dụng hàm 
findContours() trong thư viện OpenCV để dò biên 
của các đối tượng trong ảnh. Hình 5 trình bày kết 
quả tìm biên của các đối tượng trong ảnh trắng đen 
đã trình bày ở Hình 4. 
Hình 5: Kết quả tìm biên của các đối tượng 
Do hình dạng của các biển báo giao thông đều 
là các đa giác lồi, để tìm các đa giác lồi này, hàm 
isContourConvex() trong thư viện OpenCV được 
sử dụng. Mặc dù kích thước của vùng ứng viên 
biển báo giao thông thực sự có tỷ lệ w/h xấp xỉ 1 
nhưng khi truy xuất các frame ảnh từ tập tin video, 
tỉ lệ này sẽ thay đổi tùy theo khoảng cách, thời gian 
và góc nhìn. Tùy theo góc nhìn mà có thể chiều cao 
sẽ lớn hơn chiều rộng và ngược lại. Thực nghiệm 
cho thấy tỷ lệ phù hợp cho các vùng ứng viên với 
các góc nhìn khác nhau thỏa w/h < 1/3 và h/w < 
1/7. Vì vậy, sau khi trích được các vùng ứng viên, 
chúng tôi sử dụng ràng buộc tỷ lệ chiều rộng w và 
chiều cao h thỏa w/h < 1/3 và h/w < 1/7 để chọn 
các vùng ứng viên thực sự. 
2.4 Đặc trưng HOG 
Đặc trưng HOG được đề xuất bởi N.Dalal, et 
al., 2005. Ý tưởng đặc trưng HOG xuất phát từ 
hình dạng và trạng thái của vật có thể được đặc 
trưng bằng sự phân bố về cường độ và hướng của 
cạnh. Đặc trưng HOG gồm một số loại như: R-
HOG, R2-HOG và C-HOG. Theo J. Stallkamp, et 
al., 2012 đặc trưng HOG cho phép mô tả tốt cho 
các dạng biển báo giao thông có hình dạng khác 
nhau. Vì vậy, trong nghiên cứu này, chúng tôi sử 
dụng đặc trưng HOG cho mục đích trích đặc trưng 
biển báo phục vụ cho thao tác nhận dạng. Nội dung 
kế tiếp, chúng tôi trình bày các bước thực hiện để 
trích đặc trưng R-HOG cho các vùng ảnh ứng viên 
được sử dụng trong nghiên cứu này. 
2.4.1 Các bước trích đặc trưng HOG trên ảnh 
Bước 1: Tính cường độ và hướng biến thiên tại 
mỗi pixel bằng công thức (4), (5). 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 50 
Cường độ: |ܩ| ൌ ඥܫ௫ଶ ൅ ܫ௬ଶ (4) 
Hướng: ߠ ൌ ௔௥௖௧௔௡ூೣூ೤ (5) 
Bước 2: Chia ảnh đầu ra ở bước trên thành 
nhiều khối (block), mỗi khối có số ô bằng nhau, 
mỗi ô có số pixels bằng nhau. Các khối được xếp 
chồng lên nhau một ô như ở Hình 6. Số khối được 
tính bằng công thức (6). Trong đó, Wimage, 
Himage,Wblock, Hblock, Wcell, Hcell lần lượt là chiều 
rộng, chiều cao của ảnh, khối và ô. 
Hình 6: Chia khối trích đặc trưng HOG 
)+
H
HHH
()+
W
WWW
(=n
cell
cellblockimage
cell
cellblockimage
imageblock 11/
 (6) 
Bước 3: Tính vectơ đặc trưng cho từng khối 
Tính vectơ đặc trưng từng ô trong khối 
 Chia không gian hướng thành p bin (số 
chiều vectơ đặc trưng của ô). 
 Góc hướng nghiêng tại pixel (x,y) có độ lớn 
α(x,y) được rời rạc hóa vào một trong p bin. 
Rời rạc hóa unsigned-HOG (p=9): 
p)π
y)α(x,pround(=y)B(x, mod (7) 
Rời rạc hóa signed-HOG (p=18): 
p)π
y)α(x,pround(=y)B(x, mod2
 (8) 
Giá trị bin được định lượng bởi tổng cường độ 
biến thiên của các pixels thuộc về bin đó. 
Nối các vectơ đặc trưng ô để được vectơ đặc 
trưng khối. Số chiều vectơ đặc trưng của khối tính 
theo công thức sizefeature/block=ncells*sizefeature/cell. 
Trong đó, ncells là số ô trong khối và sizefeature/cell là 
số chiều vectơ đặc trưng của ô bằng 9 (unsigned-
HOG) hoặc 18 (signed-HOG). 
Bước 4: Tính vectơ đặc trưng cho ảnh 
 Chuẩn hóa vectơ đặc trưng các khối bằng 
một trong các công thức (9), (10), (11). Theo N. 
Dalal và B. Triggs, kết quả chuẩn hóa khi dùng 
L2-norm và L1-sprt là như nhau, L1-norm thì 
kém hơn. 
L2-norm: 
2e+v
v=f 2
2
 (9) 
L1-norm: e)+v(
v=f
1 (10) 
L1-sqrt: e)+v(
v=f
1 (11) 
Trong các công thức trên, v là vectơ đặc trưng 
ban đầu của khối, kv là k-norm của v ( k = 1, 2), 
e là hằng số nhỏ. 
 Ghép các vectơ đặc trưng khối tạo nên ảnh 
để được đặc trưng R-HOG cho ảnh. Số chiều vectơ 
đặc trưng của ảnh tính theo công thức sizefeature/image 
= nblocks/image * sizefeature/block,với nblocks/image là khối 
và sizefeature/blocklà số chiều vectơ đặc trưng mỗi 
khối. 
2.4.2 Áp dụng các bước trích đặc trưng HOG 
trên vùng ảnh ứng viên 
Mỗi vùng ảnh ứng viên ở giai đoạn trước được 
đưa về kích thước 32x32 và tiến hành các bước 
trích đặc trưng HOG. 
Cụ thể là, ảnh được chia thành 49 khối, mỗi 
khối chứa 2x2 ô, mỗi ô trong khối chứa 4x4 pixels 
và các khối xếp chồng lên nhau một ô. 
Số chiều vectơ đặc trưng tại mỗi ô là 9 (sử dụng 
9 bin) và số chiều vectơ đặc trưng mỗi khối là 
9x2x2 = 36 chiều (vì mỗi khối có 2x2 ô). Do đó, số 
chiều vectơ đặc trưng của ảnh là 49x36 = 1764 
chiều. 
2.5 Phân lớp 
Phân lớp là một giai đoạn trong bài toán nhận 
dạng. Quá trình phân lớp nhằm gán dữ liệu đầu vào 
(thường là vectơ n chiều) vào lớp mong muốn bằng 
các giải thuật máy học. Trong bài báo này, mạng 
Nơron nhân tạo (ANNs) được dùng để huấn luyện 
mô hình phân lớp dữ liệu cho mục đích nhận dạng 
các biển báo giao thông trích ra ở giai đoạn trước. 
Tiếp theo, chúng tôi trình bày tổng quát mạng 
Perceptron đa tầng (MLP). 
MLP là loại mạng nơron truyền thẳng gồm 
nhiều tầng. Hình 7 minh họa kiến trúc tổng quát 
mạng nơron MLP 3 tầng. 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 51 
Hình 7: Mạng nơron MLP 3 tầng 
Trên hình, mỗi vòng cùng với số biểu diễn một 
nơron, các nơron được tổ chức thành nhiều tầng 
(tầng đầu vào, tầng ẩn và tầng đầu ra). Tầng đầu 
vào (input layer) không chứa nơron nào cả, các 
hình ngũ giác ở tầng đầu vào biểu diễn các điểm 
nhận giá trị đầu vào và truyền cho các nơron ở tầng 
ẩn 1. Các tầng không là đầu vào hay đầu ra được 
gọi là các tầng ẩn (hidden layer) vì chúng trong 
suốt với người dùng, kết quả đầu ra của các nơron 
ở tầng ẩn được chuyển đến các nơron của tầng kế 
tiếp hoặc các nơ ron tầng đầu ra, người dùng không 
thấy được các giá trị trung gian này mà chỉ biết 
được kết quả của các nơron đầu ra. 
3 KẾT QUẢ VÀ THẢO LUẬN 
3.1 Các tập dữ liệu 
Chúng tôi đã thu thập các tập dữ liệu biển báo 
giao thông, Bảng 2 và Bảng 3 tương ứng trình bày 
các tập dữ liệu dùng để huấn luyện hai mô hình 
phân lớp cho mục đích nhận dạng các biển báo 
được phát hiện ứng với phân đoạn ảnh dựa vào 
màu đỏ và màu xanh lam. 
Bảng 2: Tập dữ liệu 1 
Mẫu Số lượng trong tập huấn luyện 
Số lượng trong 
tập kiểm tra 
Nhãn 
(lớp) Mẫu 
Số lượng trong 
tập huấn luyện 
Số lượng trong 
tập kiểm tra 
Nhãn 
(lớp) 
Không là 
biển báo 1511 618 0 570 201 12 
 2064 281 1 115 21 13 
258 169 2 145 21 14 
 245 124 3 76 22 15 
 513 61 4 149 78 16 
 375 211 5 464 215 17 
 135 54 6 80 123 18 
 899 191 7 528 83 19 
 746 120 8 1050 222 20 
 153 88 9 152 26 21 
484 165 10 60 41 22 
 267 170 11 91 39 23 
Bảng 3: Tập dữ liệu 2 
Mẫu Số lượng trong tập huấn luyện 
Số lượng trong 
tập kiểm tra 
Nhãn 
(lớp) Mẫu 
Số lượng trong 
tập huấn luyện 
Số lượng trong 
tập kiểm tra 
Nhãn 
(lớp) 
Không là 
biển báo 810 666 0 652 43 3 
 75 41 1 1857 378 4 
 1462 178 2 271 52 5 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 52 
3.2 Kết quả huấn luyện 
Đối với tập dữ liệu 1, chúng tôi huấn luyện mô 
hình phân lớp biển báo bằng mạng MLP 3 tầng. Cụ 
thể là, tầng 1 nhận vào một vectơ 1764 chiều (đặc 
trưng HOG của các mẫu trong tập huấn luyện). 
Tầng 2 (tầng ẩn) có 193 nơron nhận dữ liệu ở tầng 
đầu vào và tính toán để được đầu ra mong muốn. 
Tầng đầu ra gồm 24 nơron (24 lớp), mỗi nơron đầu 
ra nhận một trong các giá trị trong khoảng 0 đến 23 
(là nhãn của mẫu). 
Đối với tập dữ liệu 2, chúng tôi cũng dùng 
mạng MLP 3 tầng để huấn luyện mô hình phân lớp. 
Tầng 1 (tầng đầu vào) thì tương tự như trên, còn số 
nơron ở tầng 2 (tầng ẩn) là 80 và tầng 3 (tầng 
đầu ra) có 6 nơron tương ứng với 6 lớp từ lớp 0 đến 
lớp 5. 
Kết quả huấn luyện khi dùng tập kiểm tra tương 
ứng được trình bày ở Bảng 4 bên dưới. 
Bảng 4: Kết quả huấn luyện mạng MLP với đặc trưng HOG 
 Số mẫu phân lớp đúng Số mẫu phân lớp sai 
Tập dữ liệu 1 Tập huấn luyện (11130 mẫu) 3130/3344 (chiếm 93.6%) 
214/3344 
(chiếm 6.4%) Tập kiểm tra (3344 mẫu) 
Tập dữ liệu 2 Tập huấn luyện (5127 mẫu) 1350/1358 (chiếm 99.41%) 
8/1358 
(chiếm 0.59%) 
Ngoài ra, chúng tôi còn sử dụng thư viện 
libsvm huấn luyện mô hình phân lớp trên các tập 
dữ liệu, đây là một thư viện máy học vectơ hỗ trợ 
(SVM) được phát triển bởi Chil-Chung Chang và 
Chil-Jen Lin. Giá trị các tham số của hàm svm-
train trong thư viện dùng để huấn luyện trên cả hai 
tập dữ liệu là: -s = 0 (loại bài toán huấn luyện là 
phân đa lớp), -t = 2 (hàm nhân sử dụng là hàm 
Radial Basis Function (RBF)), -g = 0.0078125 ( 
của hàm nhân là 0.0078125), -c = 32 (hằng số c 
(chi phí) là 32). Các giá trị này được chọn bằng 
công cụ grid.py trong thư viện LibSVM. Kết quả 
huấn huyện được trình bày trong Bảng 5 (Trương 
Hùng Chen, 2015). 
Bảng 5: Kết quả huấn luyện mô hình với SVM và đặc trưng HOG 
 Số mẫu phân lớp đúng Số mẫu phân lớp sai 
Tập dữ liệu 1 Tập huấn luyện (11130 mẫu) 3155/3344 (chiếm 94.35%) 
189/3344 
(chiếm 5.65%) Tập kiểm tra (3344 mẫu) 
Tập dữ liệu 2 Tập huấn luyện (5127 mẫu) 1353/1358 (chiếm 99.63%) 
3/1358 
(chiếm 0.37%) 
Chúng tôi đã tiến hành thực nghiệm với 31 
video được quay bằng máy ảnh Canon IXUS 130 
và máy ảnh NIKON COOLPIX S2600 trong điều 
kiện ánh sáng ban ngày bình thường trên các tuyến 
đường tại thành phố Cần Thơ, Hậu Giang, Kiên 
Giang và Sóc Trăng. Máy ảnh được đặt cố định 
thẳng với hướng di chuyển với tốc độ quay 30 
frames/giây. Chúng tôi tiến hành trích từng frame 
ảnh với độ phân giải là 1360x1024 pixel trên các 
tập tin video và được đưa về ảnh 640x480 để xử lý. 
Cả hai mô hình nhận dạng SVM và mạng nơron 
đều cho kết quả khá tốt (độ chính xác khoảng 
94%). Về thời gian, mô hình mạng nơron thực hiện 
tương đối nhanh trung bình khoảng 0.021 
giây/frame so với mô hình SVM là khoảng 0.099 
giây/frame. 
Một số hình ảnh minh họa quá trình phát hiện 
và nhận dạng một số biển báo hiệu giao thông được 
trình bày trong Hình 8. Kết quả phát hiện và nhận 
dạng là khá tốt đáp ứng yêu cầu của hệ thống nhận 
dạng biển báo giao thông đường bộ. Tuy nhiên, 
trường hợp các biển báo bị hư hỏng nặng hoặc 
chồng lấp nhau tương đối lớn hệ thống sẽ không 
phát hiện được vì bước phân đoạn ảnh sẽ không 
xây dựng được các đa giác lồi là các vùng ứng viên 
cho biển báo. 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 53 
Hình 8: Một số kết quả phát hiện và nhận dạng biển báo giao thông đường bộ. Ảnh bên trái với các 
vùng ứng viên được phát hiện tương ứng ảnh bên phải là kết quả nhận dạng 
4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 
4.1 Kết luận 
Trong nghiên cứu này, chúng tôi đã sử dụng 
các kỹ thuật xử lý ảnh và máy học để phát hiện và 
nhận dạng một số loại biển báo giao thông đường 
bộ ở nước ta. Kết quả huấn luyện các mô hình máy 
học (mạng nơron nhân tạo và SVM) sử dụng đặc 
trưng HOG trên các tập dữ liệu do chúng tôi thu 
thập khá cao (khoảng 94%). Kết quả thực nghiệm 
cho thấy thời gian trung bình để phát hiện và nhận 
dạng các biển báo trên một frame ảnh xấp xỉ 0.021 
giây khi sử dụng mô hình phân lớp với mạng nơron 
nhân tạo và khoảng 0.099 giây khi dùng mô hình 
phân lớp SVM. Các kết quả nghiên cứu này đầy 
hứa hẹn và có thể áp dụng vào phát hiện và nhận 
dạng các biển báo giao thông trong thực tế. 
4.2 Hướng phát triển 
Trong tương lai, chúng tôi sẽ nghiên cứu cải 
tiến phương pháp phát hiện vùng ứng viên để giải 
quyết trường hợp các biển báo bị hư hỏng hoặc 
chồng lấp. Đổng thời nghiên cứu so sánh và tìm 
đặc trưng phù hợp, tăng số lượng mẫu huấn luyện 
và kiểm tra để nâng cao độ chính xác của hệ thống. 
Mở rộng hệ thống để phát hiện và nhận dạng thêm 
các kiểu biển báo khác. 
TÀI LIỆU THAM KHẢO 
1. Diễn đàn Cấp cao Công nghệ Thông tin – 
Truyền thông Việt Nam (Vietnam ICT 
Summit), 2015. CNTT và Quản trị thông minh. 
2. Arturo de la Escalera, Luis E. Moreno, 
Miguel Angel Salichs, JoséMaría Armingol, 
1997. Road Traffic Sign Detection and 
Classification, IEEE Transactions on 
Industrial Electronics, 44(6): 848-859. 
3. Auranuch Lorsakul, Jackrit Suthakorn, 
Traffic Sign Recognition Using Neural 
Network on OpenCV: Toward Intelligent 
Vehicle/Driver Assistance System, Center 
for Biomedical and Robotics Technology 
(BARTLAB), Department of Biomedical 
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54 
 54 
Engineering, Faculty of Engineering, 
Mahidol University, ThaiLand. 
4. Andrzej Ruta, 2009. Video-based Traffic 
Sign Detection, Tracking and Recognition, 
Doctor of Philosophy, Brunel University, 
West London. 
5. Andrzej Ruta, Fatih Porikli, Shintaro 
Watanabe, Yongmin Li , 2011. In Vehicle 
Camera Traffic Sign Detection and 
Recognition, Machine Vision and 
Applications (22):359-375. 
6. Gauri A. Tagunde, C.O.Banchhor, Nilesh J. 
Uke, Detection Classification and Recognition 
of Road Traffic Signs Using Color and Shape 
feature, International Journal of Advanced 
Technology & Engineering Research 
(IJATER), 2(4): 202-206. 
7. Lê Thanh Tâm, Trần Thái Sơn, Seichii 
Mita, 2009. Phát hiện và phân loại biển báo 
giao thông dựa trên SVM trong thời gian 
thực. Tuyển tập công nghệ thông tin và 
truyền thông 2009: 44-50. 
8. Nguyễn Duy Khánh, Lê Đình Duy, Dương 
Anh Đức, 2011. Phát hiện biển báo giao 
thông dùng đặc trưng cục bộ (local features). 
Hội thảo FAIR (Fundamental And Applied 
IT Research) lần V, Tháng 08-2011. 
9. Bộ Giao thông vận tải, Bộ Khoa học Công 
nghệ, Tổng cục Đường bộ Việt Nam, 2015. 
Quy chuẩn kỹ thuật quốc gia về báo hiệu 
đường bộ, Hà Nội. 
10. N.Dalal and B.Triggs, 2005. Histograms of 
Oriented Gradients for Human Detection, 
Proceeding on IEEE Computer Society 
Conference on Computer Vision and Pattern 
Recognition, CVPR (1):886-893. 
11. J. Stallkampa, M. Schlipsinga, J. Salmena, 
C. Igelb, 2012. Man vs. Computer: 
Benchmarking Machine Learning 
Algorithms for Traffic Sign Recognition, 
Preprint submitted to Elsevier. 
12. Chil-Chung Chang and Chil-Jen Lin, 2014. 
LibSVM – A Library for Support Vector Machines. 
13. Trương Hùng Chen, 2015. Xây dựng bộ 
công cụ phát hiện và nhận dạng bảng hiệu 
điều khiển giao thông. Luận văn Thạc sĩ 
ngành Công nghệ thông tin, Trường Đại học 
Cần Thơ. Thành phố Cần Thơ. 

File đính kèm:

  • pdfphat_hien_va_nhan_dang_bien_bao_giao_thong_duong_bo_su_dung.pdf