Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo

ABSTRACT

In this paper, we proposed computer vision and machine learning

algorithms for an automatic road-sign detection and recognition system

using HOG feature and Neural networks. Our system is able to detect and

recognize almost road sign categories such as prohibition, danger,

warning and information which are not overlapped. The experiments are

carried out on the dataset of 31 video files. The average time to detect and

identify the road signs on a frame image is approximately 0.021 seconds

when using the classification model with the MLP neural network model,

and approximately 0.099 seconds when using the SVM classification

model. The accuracy rate for road sign identification is about 94% for

both models

8 trang yennguyen 25040 Free

Download

Bạn đang xem tài liệu "Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HOG và mạng nơron nhân tạo

Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
47
PHÁT HIỆN VÀ NHẬN DẠNG BIỂN BÁO GIAO THÔNG ĐƯỜNG BỘ
SỬ DỤNG ĐẶC TRƯNG HOG VÀ MẠNG NƠRON NHÂN TẠO
Trương Quốc Bảo1, Trương Hùng Chen2 và Trương Quốc Định3
1 Khoa Công nghệ, Trường Đại học Cần Thơ
2 Khoa Kỹ thuật - Công nghệ, Trường Cao đẳng Cần Thơ
3 Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ
Thông tin chung:
Ngày nhận: 19/09/2015
Ngày chấp nhận: 10/10/2015
Title:
Road traffic sign detection
and recognition using HOG
feature and Artificial Neural
network
Từ khóa:
Hệ thống giao thông thông
minh, biển báo giao thông
đường bộ, đặc trưng HOG,
mạng Nơron, máy học vectơ
hỗ trợ
Keywords:
Intelligent transport system,
Road traffic signs, HOG
features, Neural network,
support vector machine
(SVM)
ABSTRACT
In this paper, we proposed computer vision and machine learning
algorithms for an automatic road-sign detection and recognition system
using HOG feature and Neural networks. Our system is able to detect and
recognize almost road sign categories such as prohibition, danger,
warning and information which are not overlapped. The experiments are
carried out on the dataset of 31 video files. The average time to detect and
identify the road signs on a frame image is approximately 0.021 seconds
when using the classification model with the MLP neural network model,
and approximately 0.099 seconds when using the SVM classification
model. The accuracy rate for road sign identification is about 94% for
both models.
TÓM TẮT
Trong bài báo này, chúng tôi trình bày thuật toán xử lý ảnh và máy học để
tự động phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng
đặc trưng cục bộ HOG và mạng Nơron nhân tạo. Hệ thống của chúng tôi
có khả năng phát hiện và nhận dạng hầu hết các loại biển báo giao thông
như biển báo cấm, biển báo nguy hiểm, biển hiệu lệnh và biển chỉ dẫn
không bị chồng lấp. Thực nghiệm được tiến hành với 31 video với thời
gian trung bình để phát hiện và nhận dạng các biển báo giao thông trên
một frame ảnh xấp xỉ 0.021 giây khi sử dụng mô hình phân lớp với mạng
nơron nhân tạo và khoảng 0.099 giây khi dùng mô hình phân lớp SVM và
độ chính xác nhận dạng khoảng 94%.
1 GIỚI THIỆU
Việc ứng dụng công nghệ thông tin để giải
quyết các vấn đề trong lĩnh vực giao thông đang là
một chủ đề nóng ở nước ta hiện nay. Vấn đề phát
triển giao thông thông minh để giảm thiểu ùn tắc,
tai nạn và tiết kiệm nguồn lực cũng được thảo luận
trong nhiều hội thảo, diễn đàn như diễn đàn cấp
cao Công nghệ Thông tin – Truyền thông Việt
Nam (Vietnam ICT Summit), 2015. Phát hiện và
nhận dạng biển báo giao thông là một công cụ hỗ
trợ trong hệ thống giao thông thông minh. Các hệ
thống như vậy đang được phát triển và ứng
dụng trong ngành công nghiệp tự động hóa, thông
minh ở một số quốc gia phát triển trên thế giới với
nhiều công trình nghiên cứu của (Arturo de la
Escalera et al., 1997; Auranuch Lorsakul et al.,
2007; Andrzej Ruta, 2009; Andrzej Ruta, 2011;
hay Gauri A. Tagunde et al., 2012). Ở Việt Nam,
cũng có một số nghiên cứu về lĩnh vực này như
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
48
nghiên cứu của (Lê Thanh Tâm et al., 2009 hay
Nguyễn Duy Khánh et al., 2011).
Bài báo này trình bày phương pháp phát hiện và
nhận dạng các biển báo giao thông đường bộ sử
dụng kết hợp các kỹ thuật phân đoạn ảnh, phát hiện
biên và phân tích hình dáng đối tượng để phát hiện
vùng ứng viên có thể là biển báo giao thông. Sau
đó, rút trích đặc trưng HOG và huấn luyện mạng
Nơron nhân tạo để nhận dạng biển báo. Quy trình
xử lý tổng quát của phương pháp được trình bày
như trong hình 1. Đầu tiên, ảnh đầu vào sẽ được
phân đoạn để loại bỏ nền nhằm làm nổi bật các đối
tượng có thể là biển báo giao thông, biên của các
đối tượng này sẽ được xử lý lọc kích thước và phân
tích hình dáng để chọn ra các vùng ứng viên là biển
báo giao thông. Tiếp theo, các vùng ứng viên sẽ
được trích đặc trưng HOG, các đặc trưng trích ra
được phân lớp với mô hình mạng Nơron đã được
huấn luyện trước đó để nhận dạng loại biển báo.
Kết quả huấn luyện và nhận dạng cũng được so
sánh với mô hình phân lớp sử dụng SVM để xác
định mô hình nhận dạng phù hợp nhất. Mục tiếp
theo của bài báo trình bày chi tiết phương pháp
nghiên cứu, mục này bao gồm kỹ thuật phân đoạn
ảnh dựa trên không gian màu RGB và IHLS,
phương pháp ước lượng kích thước và hình dáng
của biển báo giao thông dựa trên biên đối tượng để
chọn ra các vùng ứng viên, thuật toán trích đặc
trưng HOG của các vùng ứng viên là biển báo giao
thông, huấn luyện mạng Nơron. Trước khi trình
bày chi tiết các nội dung, chúng tôi giới thiệu sơ
lược một số loại biển báo giao thông đường bộ
đang sử dụng ở Việt Nam. Các kết quả thực
nghiệm và thảo luận được trình bài trong mục 3.
Mục 4 là kết luận và các định hướng tiếp theo của
bài báo.
Hình 1: Quy trình tổng quát của thuật toán
phát hiện và nhận dạng biển báo giao thông
đường bộ
2 PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Biển báo giao thông đường bộ Việt Nam
Biển báo giao thông là phương tiện được dùng
để thông báo, chỉ dẫn người tham giao thông điều
khiển phương tiện lưu thông nhằm đảm bảo an
toàn giao thông và được quy chuẩn trong “Quy
chuẩn kỹ thuật quốc gia về báo hiệu đường bộ”.
Quy chuẩn này được ban hành kèm theo Thông tư
số 17/2012/TT-BGTVT với mã số đăng ký là:
QCVN 41: 2012/BGTVT. Theo đó, biển báo giao
thông đường bộ ở nước ta được chia thành 4 nhóm
chính, Bảng 1 trình bày một số biển báo tương ứng
với mỗi nhóm.
Bảng 1: Bốn nhóm biển báo chính ở nước ta
TT Tên nhóm Nội dung
1 Biển báo cấm
Gồm 40 biển báo được đánh số thứ tự từ 101 đến 140 và tên tương ứng. Các biển
báo trong nhóm này biểu thị các điều cấm hoặc hạn chế mà người sử dụng đường
phải chấp hành. Một số biển thuộc nhóm này là: , , , ,
2 Biển báo nguy hiểm
Gồm 47 biển báo đượcđánh thứ tự từ 201 đến 247 và tên tương ứng. Các biển này
được dùng để cảnh báo các tình huống nguy hiểm. Một số biển trong nhóm là:
, , , , ,
3 Biển hiệu lệnh Gồm 10 biển có số thứ tự từ 301 đến 310 và tên tương ứng, được dùng để báo các hiệu lệnh cho người sử dụng đường. Một số biển trong nhóm này là: , ,
4 Biển chỉ dẫn Gồm có 47 biển được đánh thứ tự từ 401 đến 447 và tên tương ứng, dùng để chỉ hướng đi và các điều cần thiết. Một số biển trong nhóm , ,
2.2 Phân đoạn ảnh
Phân đoạn ảnh là một bước quan trọng trong
các ứng dụng xử lý ảnh. Trong nghiên cứu này,
chúng tôi tiến hành phân đoạn ảnh dựa vào màu đỏ
(Red) trên các biển báo cấm và nguy hiểm; màu
xanh lam (Blue) trên các biển hiệu lệnh và chỉ dẫn.
Đầu tiên, ảnh đầu vào trong không gian màu RGB
được chuyển sang không gian màu IHLS bằng
công thức (1), (2) và (3).Trong đó, R là thành phần
đỏ (Red), G là xanh lục (Green), B là xanh lam
(Blue) trong không gian màu RGB và H là thành
phần màu sắc (Hue), L là độ sáng (Lightness), S là
độ bão hòa trong không gian màu IHLS.
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
49
ۖە
۔
ۖۓ ܪ ൌ ߠ ݂݅ ܤ ൑ ܩܪ ൌ 360 െ ߠ ݂݅ ܤ ൐ ܩ
ߠ ൌ ܿ݋ݏିଵ ቆ ቂோି
ಸ
మି
ಳ
మቃ
ඥோమାீమା஻మିோீିோ஻ିீ஻ቇ
(1)
L = 0.2126R + 0.7152G + 0.0722B (2)
S = max(R, G, B) – min(R, G, B) (3)
Sau khi chuyển ảnh sang không gian màu
IHLS, giá trị H và S được chọn tương ứng với màu
đỏ hoặc màu xanh lam trên biển báo giao thông.
Đối với màu đỏ, những điểm ảnh (pixels) có giá trị
H183 và S>16 được thể hiện trong
ảnh trắng đen với màu trắng (giá trị 1), những điểm
ảnh còn lại được thể hiện với màu đen (giá trị 0).
Đối với màu xanh lam, tương tự như trên, những
pixels có giá trị 14336 được thể hiện
bằng màu trắng, những pixels còn lại được thể hiện
bằng màu đen. Hình 2, Hình 3 và Hình 4 lần lượt là
các ảnh RGB, IHLS và ảnh trắng đen khi phân
đoạn dựa màu đỏ trên biển báo.
Hình 2: Ảnh trong không gian màu RGB
Hình 3: Ảnh chuyển từ RGB sang IHLS
Hình 4: Ảnh trắng đen
2.3 Phát hiện vùng ứng viên
Ảnh trắng đen thu được ở giai đoạn trước được
lọc bằng bộ lọc Median kích thước 5x5 để loại bớt
các vùng nhiễu. Tiếp theo, chúng tôi sử dụng hàm
findContours() trong thư viện OpenCV để dò biên
của các đối tượng trong ảnh. Hình 5 trình bày kết
quả tìm biên của các đối tượng trong ảnh trắng đen
đã trình bày ở Hình 4.
Hình 5: Kết quả tìm biên của các đối tượng
Do hình dạng của các biển báo giao thông đều
là các đa giác lồi, để tìm các đa giác lồi này, hàm
isContourConvex() trong thư viện OpenCV được
sử dụng. Mặc dù kích thước của vùng ứng viên
biển báo giao thông thực sự có tỷ lệ w/h xấp xỉ 1
nhưng khi truy xuất các frame ảnh từ tập tin video,
tỉ lệ này sẽ thay đổi tùy theo khoảng cách, thời gian
và góc nhìn. Tùy theo góc nhìn mà có thể chiều cao
sẽ lớn hơn chiều rộng và ngược lại. Thực nghiệm
cho thấy tỷ lệ phù hợp cho các vùng ứng viên với
các góc nhìn khác nhau thỏa w/h < 1/3 và h/w <
1/7. Vì vậy, sau khi trích được các vùng ứng viên,
chúng tôi sử dụng ràng buộc tỷ lệ chiều rộng w và
chiều cao h thỏa w/h < 1/3 và h/w < 1/7 để chọn
các vùng ứng viên thực sự.
2.4 Đặc trưng HOG
Đặc trưng HOG được đề xuất bởi N.Dalal, et
al., 2005. Ý tưởng đặc trưng HOG xuất phát từ
hình dạng và trạng thái của vật có thể được đặc
trưng bằng sự phân bố về cường độ và hướng của
cạnh. Đặc trưng HOG gồm một số loại như: R-
HOG, R2-HOG và C-HOG. Theo J. Stallkamp, et
al., 2012 đặc trưng HOG cho phép mô tả tốt cho
các dạng biển báo giao thông có hình dạng khác
nhau. Vì vậy, trong nghiên cứu này, chúng tôi sử
dụng đặc trưng HOG cho mục đích trích đặc trưng
biển báo phục vụ cho thao tác nhận dạng. Nội dung
kế tiếp, chúng tôi trình bày các bước thực hiện để
trích đặc trưng R-HOG cho các vùng ảnh ứng viên
được sử dụng trong nghiên cứu này.
2.4.1 Các bước trích đặc trưng HOG trên ảnh
Bước 1: Tính cường độ và hướng biến thiên tại
mỗi pixel bằng công thức (4), (5).
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
50
Cường độ: |ܩ| ൌ ඥܫ௫ଶ ൅ ܫ௬ଶ (4)
Hướng: ߠ ൌ ௔௥௖௧௔௡ூೣூ೤ (5)
Bước 2: Chia ảnh đầu ra ở bước trên thành
nhiều khối (block), mỗi khối có số ô bằng nhau,
mỗi ô có số pixels bằng nhau. Các khối được xếp
chồng lên nhau một ô như ở Hình 6. Số khối được
tính bằng công thức (6). Trong đó, Wimage,
Himage,Wblock, Hblock, Wcell, Hcell lần lượt là chiều
rộng, chiều cao của ảnh, khối và ô.
Hình 6: Chia khối trích đặc trưng HOG
)+
H
HHH
()+
W
WWW
(=n
cell
cellblockimage
cell
cellblockimage
imageblock 11/
(6)
Bước 3: Tính vectơ đặc trưng cho từng khối
Tính vectơ đặc trưng từng ô trong khối
Chia không gian hướng thành p bin (số
chiều vectơ đặc trưng của ô).
Góc hướng nghiêng tại pixel (x,y) có độ lớn
α(x,y) được rời rạc hóa vào một trong p bin.
Rời rạc hóa unsigned-HOG (p=9):
p)π
y)α(x,pround(=y)B(x, mod (7)
Rời rạc hóa signed-HOG (p=18):
p)π
y)α(x,pround(=y)B(x, mod2
(8)
Giá trị bin được định lượng bởi tổng cường độ
biến thiên của các pixels thuộc về bin đó.
Nối các vectơ đặc trưng ô để được vectơ đặc
trưng khối. Số chiều vectơ đặc trưng của khối tính
theo công thức sizefeature/block=ncells*sizefeature/cell.
Trong đó, ncells là số ô trong khối và sizefeature/cell là
số chiều vectơ đặc trưng của ô bằng 9 (unsigned-
HOG) hoặc 18 (signed-HOG).
Bước 4: Tính vectơ đặc trưng cho ảnh
Chuẩn hóa vectơ đặc trưng các khối bằng
một trong các công thức (9), (10), (11). Theo N.
Dalal và B. Triggs, kết quả chuẩn hóa khi dùng
L2-norm và L1-sprt là như nhau, L1-norm thì
kém hơn.
L2-norm:
2e+v
v=f 2
2
(9)
L1-norm: e)+v(
v=f
1 (10)
L1-sqrt: e)+v(
v=f
1 (11)
Trong các công thức trên, v là vectơ đặc trưng
ban đầu của khối, kv là k-norm của v ( k = 1, 2),
e là hằng số nhỏ.
Ghép các vectơ đặc trưng khối tạo nên ảnh
để được đặc trưng R-HOG cho ảnh. Số chiều vectơ
đặc trưng của ảnh tính theo công thức sizefeature/image
= nblocks/image * sizefeature/block,với nblocks/image là khối
và sizefeature/blocklà số chiều vectơ đặc trưng mỗi
khối.
2.4.2 Áp dụng các bước trích đặc trưng HOG
trên vùng ảnh ứng viên
Mỗi vùng ảnh ứng viên ở giai đoạn trước được
đưa về kích thước 32x32 và tiến hành các bước
trích đặc trưng HOG.
Cụ thể là, ảnh được chia thành 49 khối, mỗi
khối chứa 2x2 ô, mỗi ô trong khối chứa 4x4 pixels
và các khối xếp chồng lên nhau một ô.
Số chiều vectơ đặc trưng tại mỗi ô là 9 (sử dụng
9 bin) và số chiều vectơ đặc trưng mỗi khối là
9x2x2 = 36 chiều (vì mỗi khối có 2x2 ô). Do đó, số
chiều vectơ đặc trưng của ảnh là 49x36 = 1764
chiều.
2.5 Phân lớp
Phân lớp là một giai đoạn trong bài toán nhận
dạng. Quá trình phân lớp nhằm gán dữ liệu đầu vào
(thường là vectơ n chiều) vào lớp mong muốn bằng
các giải thuật máy học. Trong bài báo này, mạng
Nơron nhân tạo (ANNs) được dùng để huấn luyện
mô hình phân lớp dữ liệu cho mục đích nhận dạng
các biển báo giao thông trích ra ở giai đoạn trước.
Tiếp theo, chúng tôi trình bày tổng quát mạng
Perceptron đa tầng (MLP).
MLP là loại mạng nơron truyền thẳng gồm
nhiều tầng. Hình 7 minh họa kiến trúc tổng quát
mạng nơron MLP 3 tầng.
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
51
Hình 7: Mạng nơron MLP 3 tầng
Trên hình, mỗi vòng cùng với số biểu diễn một
nơron, các nơron được tổ chức thành nhiều tầng
(tầng đầu vào, tầng ẩn và tầng đầu ra). Tầng đầu
vào (input layer) không chứa nơron nào cả, các
hình ngũ giác ở tầng đầu vào biểu diễn các điểm
nhận giá trị đầu vào và truyền cho các nơron ở tầng
ẩn 1. Các tầng không là đầu vào hay đầu ra được
gọi là các tầng ẩn (hidden layer) vì chúng trong
suốt với người dùng, kết quả đầu ra của các nơron
ở tầng ẩn được chuyển đến các nơron của tầng kế
tiếp hoặc các nơ ron tầng đầu ra, người dùng không
thấy được các giá trị trung gian này mà chỉ biết
được kết quả của các nơron đầu ra.
3 KẾT QUẢ VÀ THẢO LUẬN
3.1 Các tập dữ liệu
Chúng tôi đã thu thập các tập dữ liệu biển báo
giao thông, Bảng 2 và Bảng 3 tương ứng trình bày
các tập dữ liệu dùng để huấn luyện hai mô hình
phân lớp cho mục đích nhận dạng các biển báo
được phát hiện ứng với phân đoạn ảnh dựa vào
màu đỏ và màu xanh lam.
Bảng 2: Tập dữ liệu 1
Mẫu Số lượng trong tập huấn luyện
Số lượng trong
tập kiểm tra
Nhãn
(lớp) Mẫu
Số lượng trong
tập huấn luyện
Số lượng trong
tập kiểm tra
Nhãn
(lớp)
Không là
biển báo 1511 618 0 570 201 12
2064 281 1 115 21 13
258 169 2 145 21 14
245 124 3 76 22 15
513 61 4 149 78 16
375 211 5 464 215 17
135 54 6 80 123 18
899 191 7 528 83 19
746 120 8 1050 222 20
153 88 9 152 26 21
484 165 10 60 41 22
267 170 11 91 39 23
Bảng 3: Tập dữ liệu 2
Mẫu Số lượng trong tập huấn luyện
Số lượng trong
tập kiểm tra
Nhãn
(lớp) Mẫu
Số lượng trong
tập huấn luyện
Số lượng trong
tập kiểm tra
Nhãn
(lớp)
Không là
biển báo 810 666 0 652 43 3
75 41 1 1857 378 4
1462 178 2 271 52 5
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
52
3.2 Kết quả huấn luyện
Đối với tập dữ liệu 1, chúng tôi huấn luyện mô
hình phân lớp biển báo bằng mạng MLP 3 tầng. Cụ
thể là, tầng 1 nhận vào một vectơ 1764 chiều (đặc
trưng HOG của các mẫu trong tập huấn luyện).
Tầng 2 (tầng ẩn) có 193 nơron nhận dữ liệu ở tầng
đầu vào và tính toán để được đầu ra mong muốn.
Tầng đầu ra gồm 24 nơron (24 lớp), mỗi nơron đầu
ra nhận một trong các giá trị trong khoảng 0 đến 23
(là nhãn của mẫu).
Đối với tập dữ liệu 2, chúng tôi cũng dùng
mạng MLP 3 tầng để huấn luyện mô hình phân lớp.
Tầng 1 (tầng đầu vào) thì tương tự như trên, còn số
nơron ở tầng 2 (tầng ẩn) là 80 và tầng 3 (tầng
đầu ra) có 6 nơron tương ứng với 6 lớp từ lớp 0 đến
lớp 5.
Kết quả huấn luyện khi dùng tập kiểm tra tương
ứng được trình bày ở Bảng 4 bên dưới.
Bảng 4: Kết quả huấn luyện mạng MLP với đặc trưng HOG
Số mẫu phân lớp đúng Số mẫu phân lớp sai
Tập dữ liệu 1 Tập huấn luyện (11130 mẫu) 3130/3344 (chiếm 93.6%)
214/3344
(chiếm 6.4%) Tập kiểm tra (3344 mẫu)
Tập dữ liệu 2 Tập huấn luyện (5127 mẫu) 1350/1358 (chiếm 99.41%)
8/1358
(chiếm 0.59%)
Ngoài ra, chúng tôi còn sử dụng thư viện
libsvm huấn luyện mô hình phân lớp trên các tập
dữ liệu, đây là một thư viện máy học vectơ hỗ trợ
(SVM) được phát triển bởi Chil-Chung Chang và
Chil-Jen Lin. Giá trị các tham số của hàm svm-
train trong thư viện dùng để huấn luyện trên cả hai
tập dữ liệu là: -s = 0 (loại bài toán huấn luyện là
phân đa lớp), -t = 2 (hàm nhân sử dụng là hàm
Radial Basis Function (RBF)), -g = 0.0078125 (
của hàm nhân là 0.0078125), -c = 32 (hằng số c
(chi phí) là 32). Các giá trị này được chọn bằng
công cụ grid.py trong thư viện LibSVM. Kết quả
huấn huyện được trình bày trong Bảng 5 (Trương
Hùng Chen, 2015).
Bảng 5: Kết quả huấn luyện mô hình với SVM và đặc trưng HOG
Số mẫu phân lớp đúng Số mẫu phân lớp sai
Tập dữ liệu 1 Tập huấn luyện (11130 mẫu) 3155/3344 (chiếm 94.35%)
189/3344
(chiếm 5.65%) Tập kiểm tra (3344 mẫu)
Tập dữ liệu 2 Tập huấn luyện (5127 mẫu) 1353/1358 (chiếm 99.63%)
3/1358
(chiếm 0.37%)
Chúng tôi đã tiến hành thực nghiệm với 31
video được quay bằng máy ảnh Canon IXUS 130
và máy ảnh NIKON COOLPIX S2600 trong điều
kiện ánh sáng ban ngày bình thường trên các tuyến
đường tại thành phố Cần Thơ, Hậu Giang, Kiên
Giang và Sóc Trăng. Máy ảnh được đặt cố định
thẳng với hướng di chuyển với tốc độ quay 30
frames/giây. Chúng tôi tiến hành trích từng frame
ảnh với độ phân giải là 1360x1024 pixel trên các
tập tin video và được đưa về ảnh 640x480 để xử lý.
Cả hai mô hình nhận dạng SVM và mạng nơron
đều cho kết quả khá tốt (độ chính xác khoảng
94%). Về thời gian, mô hình mạng nơron thực hiện
tương đối nhanh trung bình khoảng 0.021
giây/frame so với mô hình SVM là khoảng 0.099
giây/frame.
Một số hình ảnh minh họa quá trình phát hiện
và nhận dạng một số biển báo hiệu giao thông được
trình bày trong Hình 8. Kết quả phát hiện và nhận
dạng là khá tốt đáp ứng yêu cầu của hệ thống nhận
dạng biển báo giao thông đường bộ. Tuy nhiên,
trường hợp các biển báo bị hư hỏng nặng hoặc
chồng lấp nhau tương đối lớn hệ thống sẽ không
phát hiện được vì bước phân đoạn ảnh sẽ không
xây dựng được các đa giác lồi là các vùng ứng viên
cho biển báo.
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
53
Hình 8: Một số kết quả phát hiện và nhận dạng biển báo giao thông đường bộ. Ảnh bên trái với các
vùng ứng viên được phát hiện tương ứng ảnh bên phải là kết quả nhận dạng
4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
4.1 Kết luận
Trong nghiên cứu này, chúng tôi đã sử dụng
các kỹ thuật xử lý ảnh và máy học để phát hiện và
nhận dạng một số loại biển báo giao thông đường
bộ ở nước ta. Kết quả huấn luyện các mô hình máy
học (mạng nơron nhân tạo và SVM) sử dụng đặc
trưng HOG trên các tập dữ liệu do chúng tôi thu
thập khá cao (khoảng 94%). Kết quả thực nghiệm
cho thấy thời gian trung bình để phát hiện và nhận
dạng các biển báo trên một frame ảnh xấp xỉ 0.021
giây khi sử dụng mô hình phân lớp với mạng nơron
nhân tạo và khoảng 0.099 giây khi dùng mô hình
phân lớp SVM. Các kết quả nghiên cứu này đầy
hứa hẹn và có thể áp dụng vào phát hiện và nhận
dạng các biển báo giao thông trong thực tế.
4.2 Hướng phát triển
Trong tương lai, chúng tôi sẽ nghiên cứu cải
tiến phương pháp phát hiện vùng ứng viên để giải
quyết trường hợp các biển báo bị hư hỏng hoặc
chồng lấp. Đổng thời nghiên cứu so sánh và tìm
đặc trưng phù hợp, tăng số lượng mẫu huấn luyện
và kiểm tra để nâng cao độ chính xác của hệ thống.
Mở rộng hệ thống để phát hiện và nhận dạng thêm
các kiểu biển báo khác.
TÀI LIỆU THAM KHẢO
1. Diễn đàn Cấp cao Công nghệ Thông tin –
Truyền thông Việt Nam (Vietnam ICT
Summit), 2015. CNTT và Quản trị thông minh.
2. Arturo de la Escalera, Luis E. Moreno,
Miguel Angel Salichs, JoséMaría Armingol,
1997. Road Traffic Sign Detection and
Classification, IEEE Transactions on
Industrial Electronics, 44(6): 848-859.
3. Auranuch Lorsakul, Jackrit Suthakorn,
Traffic Sign Recognition Using Neural
Network on OpenCV: Toward Intelligent
Vehicle/Driver Assistance System, Center
for Biomedical and Robotics Technology
(BARTLAB), Department of Biomedical
Tap̣ chı́ Khoa hoc̣ Trường Đaị hoc̣ Cần Thơ Số chuyên đề: Công nghệ Thông tin (2015): 47-54
54
Engineering, Faculty of Engineering,
Mahidol University, ThaiLand.
4. Andrzej Ruta, 2009. Video-based Traffic
Sign Detection, Tracking and Recognition,
Doctor of Philosophy, Brunel University,
West London.
5. Andrzej Ruta, Fatih Porikli, Shintaro
Watanabe, Yongmin Li , 2011. In Vehicle
Camera Traffic Sign Detection and
Recognition, Machine Vision and
Applications (22):359-375.
6. Gauri A. Tagunde, C.O.Banchhor, Nilesh J.
Uke, Detection Classification and Recognition
of Road Traffic Signs Using Color and Shape
feature, International Journal of Advanced
Technology & Engineering Research
(IJATER), 2(4): 202-206.
7. Lê Thanh Tâm, Trần Thái Sơn, Seichii
Mita, 2009. Phát hiện và phân loại biển báo
giao thông dựa trên SVM trong thời gian
thực. Tuyển tập công nghệ thông tin và
truyền thông 2009: 44-50.
8. Nguyễn Duy Khánh, Lê Đình Duy, Dương
Anh Đức, 2011. Phát hiện biển báo giao
thông dùng đặc trưng cục bộ (local features).
Hội thảo FAIR (Fundamental And Applied
IT Research) lần V, Tháng 08-2011.
9. Bộ Giao thông vận tải, Bộ Khoa học Công
nghệ, Tổng cục Đường bộ Việt Nam, 2015.
Quy chuẩn kỹ thuật quốc gia về báo hiệu
đường bộ, Hà Nội.
10. N.Dalal and B.Triggs, 2005. Histograms of
Oriented Gradients for Human Detection,
Proceeding on IEEE Computer Society
Conference on Computer Vision and Pattern
Recognition, CVPR (1):886-893.
11. J. Stallkampa, M. Schlipsinga, J. Salmena,
C. Igelb, 2012. Man vs. Computer:
Benchmarking Machine Learning
Algorithms for Traffic Sign Recognition,
Preprint submitted to Elsevier.
12. Chil-Chung Chang and Chil-Jen Lin, 2014.
LibSVM – A Library for Support Vector Machines.
13. Trương Hùng Chen, 2015. Xây dựng bộ
công cụ phát hiện và nhận dạng bảng hiệu
điều khiển giao thông. Luận văn Thạc sĩ
ngành Công nghệ thông tin, Trường Đại học
Cần Thơ. Thành phố Cần Thơ.

File đính kèm:

phat_hien_va_nhan_dang_bien_bao_giao_thong_duong_bo_su_dung.pdf