Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung

TÓM TẮT

Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong

toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng

lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá

trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ

yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy

chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng

và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên

quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn

ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp

khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận

nhằm nâng cao chất lượng bản dịch.

pdf 11 trang yennguyen 6180
Bạn đang xem tài liệu "Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung

Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung
71KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
1. ĐẶT VẤN ĐỀ
Dịch là hoạt động phức tạp, có mục đích, trong 
đó, năng lực dịch được đặt ra là một loại năng lực 
đặc biệt mang tính tổng hợp liên quan đến nhiều 
kiến thức và kỹ năng khác nhau. Trước đây các 
nhà nghiên cứu trên cơ sở quan sát hoạt động của 
dịch giả trong toàn bộ quá trình dịch đã phân năng 
lực dịch thành năng lực song ngữ, năng lực chuyển 
đổi và kiến thức chuyên ngành. Bước vào thế kỷ 
21, nhóm PACTE trong đề tài nghiên cứu về quá 
trình rèn luyện năng lực dịch đã đưa ra mô thức 
gồm 6 bộ phận cấu thành là năng lực song ngữ, 
năng lực phi ngôn ngữ, năng lực kiến thức chuyên 
ngành, năng lực sử dụng công cụ hỗ trợ, năng lực 
phương pháp và yếu tố tâm sinh lý, trong đó năng 
lực sử dụng công cụ hỗ trợ được hiểu là năng lực 
TỐNG VĂN TRƯỜNG*
*Học viện Khoa học Quân sự, tongtruong@hotmail.com
Ngày nhận bài: 25/10/2018; ngày sửa chữa: 07/01/2019; ngày duyệt đăng: 25/02/2019
KHAI THÁC NGUỒN NGỮ LIỆU INTERNET 
TRONG DỊCH TÀI LIỆU VIỆT-TRUNG
khai thác tài liệu và ứng dụng kỹ thuật thông tin 
vào dịch (陈李春, 2012, tr.175). Các nhà nghiên 
cứu dịch thuật Trung Quốc cũng chỉ ra rằng, người 
làm công tác dịch thuật hiện nay cần học cách sử 
dụng khai thác công cụ hỗ trợ dịch thuật như công 
nghệ thông tin vào quá trình dịch nhằm nâng cao 
chất lượng bản dịch và hiệu quả công tác dịch (连
淑能, 2006, tr.6). 
Cùng với sự phát triển mạnh mẽ của khoa học 
kỹ thuật, Internet được ứng dụng rộng rãi trong 
toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch 
thuật, năng lực dịch thuật có thêm những nội hàm 
mới, năng lực sử dụng công cụ hỗ trợ cũng có 
thêm nội dung như sử dụng phần mềm dịch thuật, 
tra cứu từ điển trực tuyến, tìm kiếm và khai thác 
nguồn ngữ liệu Internet. Ngữ liệu Internet được 
TÓM TẮT
Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong 
toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng 
lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá 
trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ 
yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy 
chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng 
và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên 
quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn 
ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp 
khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận 
nhằm nâng cao chất lượng bản dịch.
Từ khóa: dịch Việt-Trung, gia công ngữ liệu, ngữ liệu Internet, tương đương ngôn ngữ 
72 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
v Dịch thuật
hiểu là “tài liệu điện tử/tài liệu số được lưu trữ trên 
các server, được thể hiện trên các trang web và để 
đọc hay tải tài liệu này người dùng tin phải truy cập 
Internet”1. Nguồn ngữ liệu này có tác dụng hỗ trợ 
rất lớn đến quá trình dịch, bao gồm từ khâu lý giải 
nguyên văn đến biểu đạt và hiệu chỉnh bản dịch. 
Cụ thể, khai thác nguồn ngữ liệu Internet có thể 
giúp lý giải sâu hơn về từ ngữ, thuật ngữ, các kiến 
thức có liên quan đến nội dung văn bản nguồn; có 
thể giúp tìm ra cách biểu đạt tương đương, chuẩn 
xác, phù hợp với phong cách diễn ngôn và quy 
phạm của ngôn ngữ đích; có thể giúp hiệu đính, 
chỉnh sửa bản dịch có hiệu quả.
Trong khi dịch một văn bản từ ngôn ngữ nguồn 
sang ngôn ngữ đích, dịch giả phải làm việc với 
cả hai ngôn ngữ bao gồm toàn bộ các thuộc tính hệ 
thống, cấu trúc phức tạp và khác biệt của chúng: 
các quy tắc ngữ pháp chuẩn mực cùng các biến 
thể ngữ pháp, vốn từ ngữ với toàn bộ các biến thể 
từ vựng, ngữ nghĩa hay phong cách của chúng 
(Nguyễn Hồng Cổn, 2004), đồng thời chịu tác 
động trực tiếp của các nhân tố liên quan đến hoạt 
động dịch thuật như hoàn cảnh (hoàn cảnh giao 
tiếp và bối cảnh văn hoá xã hội), người tham gia 
(tác giả, dịch giả và người tiếp nhận), văn hoá 
(văn hoá nguồn và văn hoá đích), kiến thức chuyên 
ngành... Như vậy, người dịch phải đáp ứng được 
các yêu cầu về năng lực song ngữ, năng lực chuyển 
đổi, đồng thời có kiến thức nền vững chắc và am 
hiểu về nhiều lĩnh vực. Tuy nhiên, thực tế cho thấy 
người dịch không phải ai cũng có được tất cả các 
kỹ năng trên, đặc biệt là kỹ năng ngôn ngữ đích với 
vai trò là ngoại ngữ cũng như các kiến thức về các 
lĩnh vực. Kỹ năng này cùng với các tri thức nhiều 
lĩnh vực hoàn toàn có thể được trợ giúp thông qua 
khai thác nguồn ngữ liệu Internet.
2. CƠ SỞ LÝ LUẬN CÓ LIÊN QUAN
Ứng dụng của ngữ liệu Internet vào quá trình 
dịch thể hiện ở 3 phương diện: cung cấp các đơn 
vị ngôn ngữ tương đương, cung cấp ngữ liệu cho 
việc gia công và cung cấp các kiến thức nền có 
liên quan. Cơ sở cho việc ứng dụng này có thể tìm 
thấy trong lý thuyết “Tương đương dịch thuật” và 
lý thuyết Chức năng trong dịch thuật.
2.1. Lý thuyết “Tương đương dịch thuật”
Lý thuyết “Tương đương dịch thuật” chỉ ra 
rằng các văn bản trong các ngôn ngữ khác nhau có 
thể tương đương ở các mức độ khác nhau (tương 
đương tuyệt đối hoặc tương đương một phần), về 
các bình diện trình bày (tương đương về từ vựng, 
ngữ nghĩa, ngữ cảnh, chức năng, số lượng,) và 
ở các cấp độ khác nhau (từ với từ, ngữ với ngữ, 
câu với câu, diễn ngôn với diễn ngôn,). Nida & 
Taber cho rằng, dịch thuật là tái tạo lại trong ngôn 
ngữ đích sự tương đương tự nhiên và sát với thông 
điệp của ngôn ngữ nguồn, trước hết là về nghĩa 
và sau đó là phong cách (杰里米·芒迪, 2007, 
tr.63). Như vậy, người dịch khi tiến hành công việc 
dịch, cũng đồng nghĩa với việc đi tìm ra sự tương 
đương hoặc tiệm cận nhất nhưng vẫn giữ được 
nghĩa và phong cách giữa các đơn vị ngôn ngữ. 
Để tìm được sự tương đương trong dịch thuật, 
người dịch ngoài kiến thức về ngôn ngữ đã học 
được, cần phải có kho ngữ liệu để tra cứu và so 
sánh. Thực tế cho thấy việc xây dựng các kho ngữ 
liệu là việc làm hết sức công phu và không phải ai 
cũng có thể tiếp cận được. Trong bối cảnh đó, ngữ 
liệu Internet chính là kho ngữ liệu trực tuyến hoàn 
toàn mới và toàn diện trên tất cả các lĩnh vực, giúp 
người dịch dễ dàng tìm được sự tương đương về 
các phương diện từ vựng, ngữ pháp, ngữ nghĩa, 
phong cách...
2.2. Lý thuyết Chức năng trong dịch thuật
Trong các nền văn hoá khác nhau, cách hình 
thành ý tưởng và thể hiện ý tưởng bằng lời cũng 
khác nhau. Người dịch cần sáng tạo ra phương tiện 
để chuyển tải những đặc thù của ngôn ngữ và văn 
hoá của văn bản gốc mà không làm cho bạn đọc 
thuộc ngôn ngữ và văn hoá của văn bản dịch cảm 
thấy xa lạ; đồng thời phải tránh cả hai thái cực: 
thái cực thứ nhất là tái tạo lại nguyên xi một quá 
trình lập luận mà có thể độc giả bản dịch không 
hiểu được, và thái cực kia là biến đổi hoàn toàn 
quá trình lập luận đó thành một quá trình mà độc 
giả thấy quen thuộc nhưng lại đánh mất những đặc 
trưng của ngôn ngữ nguồn. Không có câu trả lời 
sẵn cho câu hỏi người dịch nên đứng ở đâu giữa 
73KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
hai thái cực này, vì mỗi một văn bản là một tác 
phẩm với đặc thù riêng.
Lý thuyết Chức năng cho rằng, chính người 
dịch phải quyết định vai trò của nguyên tác trong 
việc truyền đạt thông điệp, và chính mục đích 
hay chức năng của việc dịch sẽ quyết định người 
dịch sẽ theo phương pháp hay quan điểm nào khi 
chuyển ngữ. Văn bản gốc có chức năng là chuyển 
một thông điệp nào đó cho người đọc nguyên bản, 
khi chuyển ngữ, thông điệp đó phải nhắm vào độc 
giả của ngôn ngữ đích. Quan điểm nghiêng về 
ngôn ngữ nguồn (giữ các yếu tố lạ), hay chú trọng 
ngôn ngữ đích (sao cho phù hợp với người đọc 
bản dịch) không quan trọng, miễn sao bản dịch đạt 
được mục đích: mục đích hay ý định của người 
dịch, bản dịch dùng để làm gì. Như vậy người dịch 
sẽ tìm giải pháp chuyển ngữ nào thích hợp nhất đối 
với đối tượng người đọc bản dịch (Hồ Đắc Túc, 
2012, tr.94). 
Lý thuyết này có thể giúp người dịch tìm được 
một mức độ trung hoà giữa sự trong sáng về ngôn 
ngữ và tính đặc trưng về hình thức trong văn bản 
của hai ngôn ngữ. Người dịch nên mở rộng những 
giới hạn về phong cách trong ngôn ngữ của bản 
dịch đến mức tối đa có thể để phản ánh được tính 
đặc thù trong ngôn ngữ của văn bản gốc, nhưng 
vẫn phải dễ hiểu, đạt được sự hợp lý và đáng tin 
cậy đến mức tối đa, dù không nhất thiết phải giống 
như được viết bởi tác giả thuộc ngôn ngữ đích. 
Để làm được điều đó, việc tiến hành gia công ngữ 
liệu liên quan ở ngôn ngữ đích trên khuôn khổ các 
yếu tố nội dung, hình thức của ngôn ngữ nguồn là 
phương án tối ưu. Internet chính là nơi cung cấp 
ngữ liệu cho sự sáng tạo đó của người dịch.
3. NỘI DUNG KHAI THÁC NGỮ LIỆU 
INTERNET TRONG DỊCH TÀI LIỆU VIỆT-TRUNG
Ngữ liệu phục vụ cho quá trình dịch được tìm 
kiếm thông qua các công cụ tìm kiếm trực tuyến. 
Trong dịch Việt-Trung, các công cụ tìm kiếm được 
sử dụng nhiều nhất là baidu (
com), google ( sogou 
( youdao (
youdao.com), yahoo ( 
Hiện nay, Google đang là công cụ tìm kiếm hàng 
đầu trên thế giới với tốc độ tìm kiếm cao, độ chính 
xác lớn, kết quả nhiều và đặc biệt với giao diện có 
tính năng dịch tự động, bản dịch có tính tham khảo 
cao, là một trong những công cụ tìm kiếm được 
nhiều người sử dụng nhất. Tuy nhiên, do Google bị 
hạn chế hoạt động tại Trung Quốc, trang tìm kiếm 
ngữ liệu tiếng Trung Quốc được ưu tiên dùng cho 
người dịch là trang baidu. Baidu hiện đang là trang 
web tìm kiếm hàng đầu tại Trung Quốc, hoàn toàn 
có thể khai thác, ứng dụng vào quá trình dịch tư 
liệu Việt-Trung.
3.1. Tìm kiếm cách dịch danh từ riêng, từ 
ngữ chuyên ngành
Danh từ riêng thường gắn với một đối tượng 
nhất định, có thể là tên người, chức vụ, địa danh, 
tên cơ quan, tổ chức, tên sách, tên phim ảnh, tên 
thương hiệu Hệ thống các danh từ riêng này 
không chỉ số lượng lớn mà bao quát nhiều lĩnh 
vực, người dịch ở bất cứ lĩnh vực nào đều có thể 
gặp phải. Trong thực tế dịch, sẽ rất hạn chế để tra 
cứu cách dịch danh từ riêng này ở từ điển hoặc các 
tài liệu in, mạng Internet chính là một cứu cánh 
cho người dịch. Người dịch nên khai thác nguồn 
ngữ liệu Internet, không nên tùy ý sáng tạo, bởi 
những danh từ riêng này có thể đã được dịch và 
được sử dụng rộng rãi. Đặc biệt đối với chức vụ 
hoặc tên các cơ quan tổ chức, người dịch không 
nên đơn thuần dịch theo mặt chữ mà nên tra cứu 
trên nguồn ngữ liệu Internet, đây là phương pháp 
thông minh, tiết kiệm thời gian và có thể đưa lại 
kết quả chính xác nhất. Sử dụng công cụ tìm kiếm 
người dịch có thể tìm thấy nguồn ngữ liệu chứa 
cách biểu đạt tương đương trong ngôn ngữ đích 
của của các danh từ riêng, bao gồm cả những danh 
từ riêng mà người dịch chưa từng biết đến.
Ví dụ, khi dịch cụm danh từ riêng “Đồng chí 
Trương Thị Mai, Ủy viên Bộ Chính trị, Bí thư 
Trung ương Đảng, Trưởng Ban Dân vận Trung 
ương”, nếu dịch theo mặt chữ người dịch có thể 
sẽ gặp khó khăn khi dịch cụm từ “Bí thư Trung 
ương Đảng”. Nếu dịch “Bí thư Trung ương Đảng” 
74 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
v Dịch thuật
thành “党中央书记”, thì khi tra cứu trong baidu 
không cho ra bất cứ kết quả nào. Phương án tối 
ưu là tra cứu bằng từ khóa “政治部委员张氏梅”, 
tức bằng những từ quen thuộc có thể dịch chính 
xác ngay, kết quả hiện ra sau khi tìm kiếm trong 
baidu là “越共中央政治部委员、中央书记处
书记、中央民运部部长张氏梅”, chính là cách 
dịch mà người dịch đang cần tìm. Rõ ràng “中央
书记处书记” tương ứng với “Bí thư Trung ương 
Đảng”, điều mà người dịch nếu chỉ loay hoay với 
mặt chữ văn bản nguồn không thể ngờ tới. Đối 
với những danh từ riêng như tên các nhà lãnh đạo 
các nước, tên các nhân vật, tên sách báo, phim ảnh 
nổi tiếng, việc tra cứu Internet sẽ nhanh chóng 
mang lại kết quả chính xác. Ví dụ, khi dịch tên tổng 
thống Indonesia Joko Widodo trong câu “Nhận 
lời mời của Tổng thống Indonesia Joko Widodo, 
Thủ tướng Chính phủ Nguyễn Xuân Phúc dẫn đầu 
Đoàn cấp cao Việt Nam tham dự cuộc gặp các nhà 
lãnh đạo ASEAN nhân dịp Hội nghị thường niên 
Quỹ Tiền tệ Quốc tế (IMF) – Ngân hàng Thế giới 
(WB) tại thành phố Bali, Indonesia và thăm làm 
việc Indonesia từ ngày 11 đến 12-10-2018” thì chỉ 
cần nhập vào ô tìm kiếm của baidu cụm từ “印度
尼西亚现任总统” sẽ tìm được tên của Tổng thống 
Indonesia bằng tiếng Trung là “佐科·维多多”. 
Đối với tên các tổ chức, các chương trình, việc tìm 
kiếm vẫn có thể theo cách dịch mặt chữ, tìm kiếm 
theo chủ đề, thậm chí tìm theo yếu tố liên quan, từ 
viết tắt... Ví dụ: “Chương trình đào tạo cán bộ thực 
thi pháp luật khu vực Châu Á (ARLEMP)” có thể 
chỉ cần tra cứu bằng từ viết tắt “ARLEMP” trong 
baidu sẽ cho ra cụm từ “亚洲地区执法管理培训
项目”. 
Khi tra cứu cho ra nhiều kết quả thì người dịch 
phải biết phân tích và lựa chọn, việc phân tích và 
lựa chọn luôn phải luôn quy chiếu với ý nghĩa và 
hình thức ngôn ngữ của ngôn ngữ nguồn. Ví dụ, 
khi dịch “Bộ Lao động, Thương binh và Xã hội” 
sang tiếng Trung, việc tra cứu trên baidu sẽ cho 
ra 4 kết quả dịch là: “越南劳动、残废军人和社
会部”, “越南劳动伤兵-社会部”, “越南劳动
荣军与社会部”, “越南劳动、荣军和社会部”. 
Căn cứ vào nguồn gốc ngữ liệu có thể thấy các 
trang tiếng Trung của Việt Nam hay dùng cách 
biểu đạt “越南劳动荣军与社会部”, các trang 
web trong đó có các cổng thông tin điện tử các 
cơ quan của Trung Quốc hay dùng “越南劳动、
荣军和社会部”. Căn cứ vào thời gian xuất hiện, 
các kết quả “越南劳动、残废军人和社会部”, 
“越南劳动伤兵-社会部” xuất hiện trong các ngữ 
liệu có từ khá sớm, còn các kết quả “越南劳动伤
兵-社会部”, “越南劳动荣军与社会部”, “越
南劳动、荣军和社会部” gần đây được sử dụng 
nhiều hơn. Trên hai cơ sở này, kết hợp với hình 
thức ngôn ngữ của cụm từ “Bộ Lao động, Thương 
binh và Xã hội”, sự lựa chọn nên là “越南劳动、
荣军和社会部”. Ngoài ra người dịch vẫn có thể 
kiểm tra lại khái niệm “荣军”, kết quả tra cứu trên 
baidu cho ra: “荣誉军人”简称“荣军”,根据新
华字典的名词释义解释为:荣誉军人是对残废
军人的尊称。根据现实生活中应用对象一般是
对伤病残军人的尊称, tức tương đương với nghĩa 
“thương binh” trong tiếng Việt.
Đối với thuật ngữ, từ ngữ chuyên ngành, việc 
tra cứu ngữ liệu Internet cũng mang lại cho quá 
trình dịch ích lợi to lớn. Đặc biệt đối với từ ngữ 
chuyên ngành, các thuật ngữ khoa học, người 
dịch không nên tùy ý sáng tạo mà nên tra cứu 
xem chúng tương đương với thuật ngữ hay từ ngữ 
chuyên ngành nào trong ngôn ngữ đích. Quá trình 
tìm kiếm trên Internet có thể sử dụng các kỹ xảo 
tìm kiếm như với danh từ riêng, ví dụ thuật ngữ 
“ra-da khẩu độ tổng hợp”, tra cứu trên google ta 
được tên tiếng Anh là “synthetic aperture radar”, 
sử dụng tính năng dịch tự động của google ta được 
thuật ngữ “合成孔径雷达”, kiểm tra lại thuật ngữ 
này trên baidu và đối chiếu với phần giải thích 
bằng tiếng Việt trên google sẽ xác định được đây 
là tên chính xác của thuật ngữ cần dịch.
Đối với từ ngữ văn hóa, từ ngữ mới, hoặc từ 
ngữ biểu thị sự vật, hiện tượng đặc trưng của Việt 
Nam, việc tra cứu có thể không cho ra kết quả trực 
tiếp nhưng cũng có thể đưa ra những cách dịch hợp 
lý hơn, bởi sáng tạo ra từ ngữ mới cũng luôn phải 
tôn trọng quy tắc ngôn ngữ của ngôn ngữ đích, góp 
ph ... 享” vừa thể hiện được ý 
trong nguyên văn tiếng Việt, vừa xúc tích, ngắn 
gọn hơn cách dịch “本报《读者桥梁》专栏谨
向读者简略介绍其中若干切实有效的意见”. 
Ngoài ra, người dịch cũng có thể học cách diễn 
đạt đơn giản, đễ hiểu trong ngôn ngữ báo chí tiếng 
Trung Quốc, những cách biểu đạt như “今天,
是”, “在这个值得纪念的日子里” Như vậy, 
thông qua quá trình tìm kiếm và khai thác ngữ liệu, 
bản dịch ban đầu có thể biểu đạt lại thành: “6月
21日是越南革命新闻诞生88周年的纪念日。在
这些日子里,全国各地的热心读者已给《人民
军队报》发来了许多热情洋溢的祝福,不少读
者还热情提出了许多好的建议和意见,本报《
读者桥梁》选择部分刊登,与读者共享”. Cách 
xử lý này góp phần đưa ra một bản dịch có ngôn 
ngữ biểu đạt súc tích hơn, sát hợp với thói quen 
ngôn ngữ của độc giả Trung Quốc, đồng thời cũng 
đảm bảo được tính trung thực, chính xác, hiệu quả 
và trong sáng của phong cách viết báo. Đây cũng 
là quy ước căn bản về ngôn ngữ mà dịch thuật báo 
chí phải tuân theo khi ứng dụng lý thuyết chức 
năng (Hồ Đắc Túc, 2012, tr.160).
3.5. Tra cứu kiến thức nền có liên quan
Dịch là một quá trình lý giải và biểu đạt lại, 
trong đó nhấn mạnh tính chính xác, triệt để và toàn 
78 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
v Dịch thuật
diện. Để làm được điều này, người dịch không chỉ 
dừng lại ở việc lý giải câu, từ mà còn phải hiểu 
được các bối cảnh về văn hóa, lịch sử, xã hội 
có liên quan. Đây chính là kiến thức nền mà mọi 
người hay nhắc đến, nó liên quan đến các vấn đề 
ngoài ngôn ngữ như tình huống giao tiếp và các 
yếu tố có liên quan như chính trị, lịch sử, quân 
sự, kinh tế, văn hóa, giáo dục, khoa học, y tế, đạo 
đức, tôn giáo, phong tục tập quán Những kiến 
thức này người dịch rất khó có thể tìm thấy trong 
từ điển. Trong khi đó các nội dung dịch rất rộng 
lớn, liên quan đến hầu hết các vấn đề có trong 
xã hội, do kinh nghiệm, quốc tịch, bối cảnh văn 
hóa của tác giả và người dịch không giống nhau, 
có những nội dung trong văn bản gốc người dịch 
không thể dễ dàng lý giải, lúc đó kiến thức nền 
của người dịch sẽ phát huy tác dụng. Tuy nhiên, 
không phải lĩnh vực nào người dịch cũng có đầy 
đủ kiến thức liên quan, kho kiến thức tổng hợp này 
có trên Internet, chỉ cần người dịch biết cách khai 
thác là có thể giải quyết được vấn đề gặp phải khi 
dịch, đồng thời bổ sung thêm kiến thức vào kho 
kiến thức của riêng mình. Ngoài ra, trong quá trình 
dịch, người dịch thường hay gặp phải những nội 
dung mới, lĩnh vực mới, thậm chí khá xa lạ. Lúc 
đó, người dịch phải biết cách tìm kiếm tư liệu có 
liên quan, đọc và bổ sung những kiến thức về lĩnh 
vực đó, và mạng Internet là một kênh tra cứu tiện 
lợi và nhanh chóng. Sử dụng công cụ tìm kiếm trên 
google, baidu, nhập vào từ khóa tìm kiếm, trong 
khoảng thời gian rất ngắn người dịch đã có thể tiếp 
cận với nguồn tư liệu khổng lồ. Đương nhiên để 
đưa ra kết quả đúng với cái mà người dịch định 
tìm kiếm thì việc điều chỉnh từ khóa là việc nên 
làm. Nguồn tư liệu tìm được có thể là các bài viết 
chuyên ngành, giúp người dịch hiểu rõ được về nội 
dung đang cần dịch.
Việc tra cứu kiến thức nền thường được tiến 
hành khi người dịch gặp phải các thuật ngữ hoặc 
các khái niệm chuyên ngành. Như để dịch chính 
xác thuật ngữ “vùng tiếp giáp lãnh hải” thì phải 
tra cứu các kiến thức có liên quan đến lãnh hải, 
thậm chí còn phải làm rõ trên cơ sở đối chiếu với 
các thuật ngữ như vùng chồng lấn, vùng giáp ranh, 
vùng đặc quyền kinh tế, thềm lục địa Hoặc như 
dịch cụm từ “Giấy xác nhận nhân sự” sang tiếng 
Trung Quốc, nếu dịch theo mặt chữ là “人事确
认书” thì đưa vào tìm kiếm trên baidu không cho 
ra kết quả nào, do đó, cần phải tra cứu khái niệm 
giấy xác nhận nhân sự là gì. Tra cứu trên google 
sẽ cho ra kết quả: “Giấy xác nhận nhân sự là một 
trong những nội dung cần thiết để xác nhận nhân 
sự tham gia vào các giao dịch dân sự, chứng minh 
một phần nhân thân về việc chấp hành pháp luật. 
Nói cách khác, loại giấy này giống như một bản 
cam kết nhằm chứng minh bản thân người làm thủ 
tục không vi phạm các quy định của pháp luật”. 
Trong các mẫu giấy xác nhận nhân sự tiếng Việt 
luôn có câu: “bản thân người làm đơn không vi 
phạm những quy định của pháp luật và địa phương 
đang sống, tức không có án tích (ghi chép trong hồ 
sơ về vi phạm pháp luật)”. Trên cơ sở này, người 
dịch mới biết được đây là giấy chứng nhận không 
vi phạm pháp luật và nếu tìm kiếm trên baidu với 
từ khóa “无犯法证明书”, sẽ được tên văn bản 
tương đương là “无犯罪记录证明书”.
4. KỸ NĂNG TÌM KIẾM VÀ KHAI THÁC NGỮ 
LIỆU INTERNET TRONG QUÁ TRÌNH DỊCH
4.1. Những điểm cần lưu ý trong tìm kiếm và 
khai thác ngữ liệu Internet vào quá trình dịch
Khai thác ngữ liệu Internet có tác dụng vô cùng 
lớn trong quá trình dịch, không chỉ giúp người dịch 
tiết kiệm được thời gian và công sức mà còn có 
tác dụng nâng cao chất lượng bản dịch. Tuy nhiên, 
ngoài những ưu điểm trên, nguồn tài liệu Internet 
cũng có một số hạn chế mà người dịch phải luôn 
lưu ý.
Đối với nguồn ngữ liệu phục vụ tra cứu thông 
tin, kiến thức nền hoặc kiến thức chuyên ngành, 
người dịch khi tra cứu trên Internet sẽ phải đối diện 
với những thông tin không chính thống, mang tính 
cá nhân, thiếu chọn lọc, dàn trải, vụn vặt, khó xác 
định nguồn tin, khó kiểm chứng; không ít những 
thông tin sai với các tính chất khác nhau, thậm chí 
có các thông tin xuyên tạc có tính chất chính trị...; 
có những bài viết, bài nghiên cứu nhưng lại lồng 
ghép ý đồ cá nhân, thậm chí trong việc giải thích 
một số khái niệm, đặc biệt là các khái niệm có liên 
79KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
quan đến lĩnh vực có tranh chấp, cách giải thích 
đôi khi không khách quan mà hướng tới việc có lợi 
cho bên giải thích. Vì thế, khi tham khảo các kiến 
thức có liên quan, việc thu thập thông tin cần chú 
ý đến những đặc điểm này để loại bỏ những yếu 
tố cảm tính, tìm ra những yếu tố có ý nghĩa thông 
tin khách quan, bảo đảm tính chính xác và có độ 
tin cậy cao. 
Đối với nguồn ngữ liệu phục vụ đối chiếu và 
chuyển đổi ngôn ngữ, khi khai thác nguồn ngữ 
liệu này người dịch cũng phải đối diện với tình 
trang hỗn độn của ngôn ngữ mạng. Giống như 
nhiều quốc gia khác, hiện nay Trung Quốc cũng 
đang phải đối mặt với tình hình ngôn ngữ mạng 
không chuẩn xác đến từ những trang mạng dịch 
tự động, những cách biểu đạt không phù hợp với 
văn phạm tiếng Hán tại các diễn đàn, các trang 
blog cá nhân Đỗ Tiến Quân, Hà Nguyễn Hằng 
Nga (2018, tr.43) khi bàn về mặt tiêu cực của ngôn 
ngữ mạng tiếng Trung cũng chỉ ra việc sử dụng 
cách biểu đạt lủng củng, biểu đạt thừa làm cho 
quy tắc, quy phạm ngữ pháp của tiếng Trung Quốc 
trở nên lộn xộn, sử dụng các từ ngữ vô nghĩa, thô 
thiển, ảnh hưởng đến tính thuần khiết của ngôn 
ngữ. Ngô Tiểu Long cũng nhận định, những hành 
vi ngôn ngữ này “không những không làm phong 
phú ngôn ngữ mà ngược lại còn làm ô nhiễm tiếng 
Trung Quốc”. Xuất phát từ tình trạng này, ở một số 
nơi của Trung Quốc đã phải ban bố các quy định 
nhằm quy phạm hành vi ngôn ngữ mạng (吴小龙, 
2008, tr.58). Do đó, khi khai thác ngữ liệu Internet, 
người dịch cần phải xác định được tính chân thực, 
chuẩn xác của ngữ liệu như tính chính xác khoa 
học, tính quy phạm của ngôn ngữ, tốt nhất nên 
khai thác nguồn ngữ liệu đã được thẩm định.
4.2. Các kỹ năng cơ bản trong tra cứu và 
khai thác ngữ liệu Internet vào quá trình dịch
4.2.1. Kỹ năng tìm kiếm
Đầu tiên, nên sử dụng các trang mạng tìm kiếm 
lớn như google, yahoo, baidu Tuy nhiên, người 
dịch cần xác định chính xác từ khóa để việc tìm 
kiếm có hiệu quả hơn. Từ khóa ở đây có thể là 
phương án dịch đầu tiên, có thể là dịch theo mặt 
chữ khi mà người dịch chưa có phương án khác. 
Sau khi đưa vào tìm kiếm, nếu từ khóa đó không 
đưa ra kết quả chính xác thì cũng có thể có các 
gợi ý khác thông qua việc đọc nhanh các kết quả 
liên quan đã hiện ra để tìm kiếm các từ khóa khác. 
Ngoài ra cũng có thể tìm kiếm theo chủ đề, thậm 
chí có thể tận dụng từ ngữ viết tắt, cách dịch ra 
tiếng Anh, tra cứu theo sự kiện, mở rộng hoặc thu 
hẹp phạm vi tìm kiếm của từ khóa, tra cứu các bài 
viết liên quan, đọc để tìm ra cái tương đương 
Tuy nhiên, đối với những từ ngữ mới, việc tra cứu 
chủ yếu để tìm hiểu nội hàm ý nghĩa của từ ngữ đó, 
để tìm được cái tương đương tuyệt đối đôi khi rất 
khó vì nó có thể có ở ngôn ngữ này mà không có 
ở ngôn ngữ kia.
Việc tìm kiếm tài liệu còn để phục vụ cho việc 
kiểm tra tính chính xác của bản dịch. Kiểm tra tính 
chính xác của bản dịch được bắt đầu bằng từ khóa 
là những từ ngữ hoặc cách biểu đạt mà bản thân 
người dịch khi đọc lại vẫn cảm thấy chưa bằng 
lòng. Với các từ ngữ, khái niệm, đôi khi phải kiểm 
tra bằng công cụ tìm kiếm hình ảnh, hoặc tìm kiếm 
sự vật, hiện tượng đó trong thực tế, từ đó mới tìm 
ra được tên gọi, cách biểu đạt tương đương.
4.2.2. Kỹ năng đánh giá ngữ liệu
Người dịch nên truy cập, xem các tài liệu tại 
các trang web uy tín, chất lượng, các trang web 
của các cơ quan nhà nước, Chính phủ, Quốc hội, 
các trang web có địa chỉ cụ thể, tránh sử dụng 
tài liệu của các trang web nhỏ, không uy tín, không 
có địa chỉ cụ thể, để thu thập thông tin và tìm hiểu 
kiến thức có liên quan. Nguồn ngữ liệu được đăng 
trên các trang thông tin chính thức, trang điện tử 
của các tờ báo lớn, các tạp chí nghiên cứu đa 
số đều được kiểm duyệt một cách chặt chẽ về mặt 
nội dung cũng như ngôn ngữ, cách biểu đạt cơ bản 
là chuẩn mực, phù hợp với quy phạm văn phong 
ngôn ngữ.
4.2.3. Kỹ năng lựa chọn và phân tích
Với mỗi lần tìm kiếm, thông thường kết quả 
cho ra là khổng lồ, nếu không có phương pháp, 
người dịch rất dễ chìm vào một đống thông tin hỗn 
80 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
v Dịch thuật
độn. Việc đọc lướt phần chữ xuất hiện kèm từ khóa 
trong các kết quả, xem nhanh nguồn gốc trang web 
sẽ cho người dịch một ấn tượng nên đọc kết quả 
nào. Người dịch nên chọn đọc những trang chính 
thống hoặc của các cơ quan thông tấn, báo chí 
hạn chế đọc các kết quả trong các diễn đàn hay 
blog cá nhân Ngoài ra, với một từ hay một cụm 
từ có thể tìm được nhiều kết quả dịch khác nhau. 
Khi đó, tiêu chí để lựa chọn đó là tính phổ biến 
(kết quả hiện lên có nhiều không), tính chính thống 
(xuất hiện trên các trang web chính thống, có uy 
tín), tính bản địa (trang web đó là của nước nào)
4.2.4. Kỹ năng gia công ngữ liệu
Dịch là một quá trình chuyển một hình thức 
biểu đạt trong ngôn ngữ nguồn sang một hình thức 
biểu đạt tương ứng trong ngôn ngữ đích trong sự 
đảm bảo về nội dung và chức năng. Trong dịch, 
cái mà người dịch hay mắc không phải là lỗi về 
ngữ pháp mà là sự tương thích về biểu đạt giữa hai 
ngôn ngữ. Để tạo được sự tương thích này, nguồn 
ngữ liệu Internet có thể giúp người dịch xây dựng 
được ngữ liệu khả sánh. Đọc ngữ liệu đã tìm được 
có liên quan về nội dung, về ý, về phong cách văn 
bản trong sự so sánh với văn bản gốc, người 
dịch có thể tìm ra được những cụm từ, những cách 
biểu đạt tương đương hoặc những câu, đoạn có thể 
cải biến lại cho phù hợp với ý nghĩa và mục đích 
của văn bản gốc. Đây cũng chính là quá trình tìm 
kiếm và gia công ngữ liệu. Việc gia công ngữ liệu 
có thể là mô phỏng cách biểu đạt gắn với ý nghĩa 
của văn bản nguồn để đưa ra được một văn bản 
dịch vừa đủ ý, vừa có cách biểu đạt lưu loát, lời 
dịch không bị lai căng hoặc biểu đạt theo hướng 
“tiếng Trung Quốc kiểu Việt Nam”.
4. KẾT LUẬN
Đánh giá vai trò quan trọng của Internet với 
dịch thuật, Timothy R. Hunt nhấn mạnh: “Máy 
tính sẽ không bao giờ thay thế người dịch nhưng 
người dịch sử dụng Internet sẽ thay thế người dịch 
không dùng chúng”2. Phương pháp tra cứu ngữ 
liệu truyền thống trong quá trình dịch đã tỏ ra kém 
hiệu quả trong thời đại bùng nổ Internet, nguồn 
ngữ liệu Internet hiện nay có thể mang lại những 
lợi ích vô cùng to lớn cho người dịch. Xuất phát từ 
những yêu cầu cao của công việc dịch, người dịch 
càng phải biết tận dụng những lợi ích mà nguồn 
ngữ liệu Internet mang lại, biết khai thác ngữ liệu 
Internet, biết thông qua ngữ liệu Internet để sử 
dụng thành quả lao động của những người dịch 
trước. Việc khai thác nguồn ngữ liệu Internet vào 
quá trình dịch không chỉ giúp nâng cao hiệu quả 
công việc dịch cũng như chất lượng bản dịch mà 
còn mở ra những hướng nghiên cứu mới cả về lý 
luận và thực tiễn./.
Chú thích:
1. Tham khảo định nghĩa “Tài liệu trực tuyến” của 
Nguyễn Lê Phương Hoài (2015) trong Nguồn tài 
liệu trực tuyến: quá trình và xu hướng phát triển 
trong các thư viện trên thế giới, Tạp chí Thư viện 
Việt Nam, số 2.
2. Dẫn theo Nguyễn Phước Vĩnh Cố (2017), Nguồn tư 
liệu Internet và người dịch chuyên ngành, truy cập 
ngày 06/10/2018, < https://nguyenphuocvinhco.
com/2017 /05/09/the-internet-resources-and-
specialised-translators-nguon-tu-lieu-tren-internet-
va-nguoi-dich-chuyen-nganh/>.
 Tài liệu tham khảo:
Nguyễn Hồng Cổn (2004), “Cơ sở ngôn ngữ học của 
nghiên cứu dịch thuật và bộ môn Dịch thuật học”, 
Tạp chí Ngôn ngữ, số 11, tr.32-38.
Nguyễn Lê Phương Hoài (2015), “Nguồn tài liệu 
trực tuyến: quá trình và xu hướng phát triển trong 
các thư viện trên thế giới”, Tạp chí Thư viện Việt 
Nam, số 2, tr.11-15.
Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018), “Bàn về 
một số đặc điểm của ngôn ngữ mạng trong tiếng 
Hán”, Tạp chí Khoa học Ngoại ngữ Quân sự, số 
15, tr.39-46.
Lê Hùng Tiến (2010), “Tương đương dịch thuật và 
tương đương trong dịch Anh-Việt”, Tạp chí khoa 
học ĐHQGHN, Ngoại ngữ 26, tr.64-71.
Hồ Đắc Túc (2012), Dịch thuật và tự do, NXB Hồng 
Đức, Hà Nội.
陈李春(2012),浅析网络时代的翻译能力培养,海
外英语,第10期,175-176。
81KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
USING INTERNET AS A DATA SOURCE IN VIETNAMESE-CHINESE TRANSLATION 
TONG VAN TRUONG
Asbtract: Parallel with the stormy development of science and technology, Internet is now 
applied in any aspect of our lives and translation is not an exception. If properly used, Internet 
can provide enormous linguistic data that not only help translators find equivalents but also make 
their translation smoother and more appropriate. Making use of Internet in translation mainly 
includes: finding equivalents between the source and the target languages; looking up structures 
and codes of the target language; checking the accuracy of translation products; comparing 
translation products with linguistic data to make sure that the translation is smooth and of better 
quality; looking up related specialist knowledge However, when using Internet as a source 
of linguistic data for translation, one has to mind the backwards in terms of cyber language 
and cyber information. Based on convincing arguments relating to the topic, the article suggests 
several ways of using Internet as a linguistic data source in Vietnamese-Chinese translation. 
This can be a new access to using Internet in translation that translators can use to better their 
translation products.
Keywords: Internet linguistic data, linguistic equivalents, processing linguistic data, Vietnamese-
Chinese translation.
Received: 25/10/2018; Revised: 07/01/2019; Accepted for publication: 25/02/2019
杰里米·芒迪、李德风译 (2007), 翻译学导论, 商
务印书馆, 北京。
连淑能(2006),英译汉教程,北京高等教育出版社
北京。
万兆元(2008),因特网辅助翻译,上海翻译,第3
期,77-80。
吴小龙(2008),利用网络资源为翻译工作服务的
理论和实践探讨,文教资料,第12期, 57-59。

File đính kèm:

  • pdfkhai_thac_nguon_ngu_lieu_internet_trong_dich_tai_lieu_viet_t.pdf