Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung
TÓM TẮT
Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong
toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng
lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá
trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ
yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy
chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng
và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên
quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn
ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp
khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận
nhằm nâng cao chất lượng bản dịch.
Tóm tắt nội dung tài liệu: Khai thác nguồn ngữ liệu Internet trong dịch tài liệu Việt - Trung
71KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v 1. ĐẶT VẤN ĐỀ Dịch là hoạt động phức tạp, có mục đích, trong đó, năng lực dịch được đặt ra là một loại năng lực đặc biệt mang tính tổng hợp liên quan đến nhiều kiến thức và kỹ năng khác nhau. Trước đây các nhà nghiên cứu trên cơ sở quan sát hoạt động của dịch giả trong toàn bộ quá trình dịch đã phân năng lực dịch thành năng lực song ngữ, năng lực chuyển đổi và kiến thức chuyên ngành. Bước vào thế kỷ 21, nhóm PACTE trong đề tài nghiên cứu về quá trình rèn luyện năng lực dịch đã đưa ra mô thức gồm 6 bộ phận cấu thành là năng lực song ngữ, năng lực phi ngôn ngữ, năng lực kiến thức chuyên ngành, năng lực sử dụng công cụ hỗ trợ, năng lực phương pháp và yếu tố tâm sinh lý, trong đó năng lực sử dụng công cụ hỗ trợ được hiểu là năng lực TỐNG VĂN TRƯỜNG* *Học viện Khoa học Quân sự, tongtruong@hotmail.com Ngày nhận bài: 25/10/2018; ngày sửa chữa: 07/01/2019; ngày duyệt đăng: 25/02/2019 KHAI THÁC NGUỒN NGỮ LIỆU INTERNET TRONG DỊCH TÀI LIỆU VIỆT-TRUNG khai thác tài liệu và ứng dụng kỹ thuật thông tin vào dịch (陈李春, 2012, tr.175). Các nhà nghiên cứu dịch thuật Trung Quốc cũng chỉ ra rằng, người làm công tác dịch thuật hiện nay cần học cách sử dụng khai thác công cụ hỗ trợ dịch thuật như công nghệ thông tin vào quá trình dịch nhằm nâng cao chất lượng bản dịch và hiệu quả công tác dịch (连 淑能, 2006, tr.6). Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật, năng lực dịch thuật có thêm những nội hàm mới, năng lực sử dụng công cụ hỗ trợ cũng có thêm nội dung như sử dụng phần mềm dịch thuật, tra cứu từ điển trực tuyến, tìm kiếm và khai thác nguồn ngữ liệu Internet. Ngữ liệu Internet được TÓM TẮT Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận nhằm nâng cao chất lượng bản dịch. Từ khóa: dịch Việt-Trung, gia công ngữ liệu, ngữ liệu Internet, tương đương ngôn ngữ 72 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) v Dịch thuật hiểu là “tài liệu điện tử/tài liệu số được lưu trữ trên các server, được thể hiện trên các trang web và để đọc hay tải tài liệu này người dùng tin phải truy cập Internet”1. Nguồn ngữ liệu này có tác dụng hỗ trợ rất lớn đến quá trình dịch, bao gồm từ khâu lý giải nguyên văn đến biểu đạt và hiệu chỉnh bản dịch. Cụ thể, khai thác nguồn ngữ liệu Internet có thể giúp lý giải sâu hơn về từ ngữ, thuật ngữ, các kiến thức có liên quan đến nội dung văn bản nguồn; có thể giúp tìm ra cách biểu đạt tương đương, chuẩn xác, phù hợp với phong cách diễn ngôn và quy phạm của ngôn ngữ đích; có thể giúp hiệu đính, chỉnh sửa bản dịch có hiệu quả. Trong khi dịch một văn bản từ ngôn ngữ nguồn sang ngôn ngữ đích, dịch giả phải làm việc với cả hai ngôn ngữ bao gồm toàn bộ các thuộc tính hệ thống, cấu trúc phức tạp và khác biệt của chúng: các quy tắc ngữ pháp chuẩn mực cùng các biến thể ngữ pháp, vốn từ ngữ với toàn bộ các biến thể từ vựng, ngữ nghĩa hay phong cách của chúng (Nguyễn Hồng Cổn, 2004), đồng thời chịu tác động trực tiếp của các nhân tố liên quan đến hoạt động dịch thuật như hoàn cảnh (hoàn cảnh giao tiếp và bối cảnh văn hoá xã hội), người tham gia (tác giả, dịch giả và người tiếp nhận), văn hoá (văn hoá nguồn và văn hoá đích), kiến thức chuyên ngành... Như vậy, người dịch phải đáp ứng được các yêu cầu về năng lực song ngữ, năng lực chuyển đổi, đồng thời có kiến thức nền vững chắc và am hiểu về nhiều lĩnh vực. Tuy nhiên, thực tế cho thấy người dịch không phải ai cũng có được tất cả các kỹ năng trên, đặc biệt là kỹ năng ngôn ngữ đích với vai trò là ngoại ngữ cũng như các kiến thức về các lĩnh vực. Kỹ năng này cùng với các tri thức nhiều lĩnh vực hoàn toàn có thể được trợ giúp thông qua khai thác nguồn ngữ liệu Internet. 2. CƠ SỞ LÝ LUẬN CÓ LIÊN QUAN Ứng dụng của ngữ liệu Internet vào quá trình dịch thể hiện ở 3 phương diện: cung cấp các đơn vị ngôn ngữ tương đương, cung cấp ngữ liệu cho việc gia công và cung cấp các kiến thức nền có liên quan. Cơ sở cho việc ứng dụng này có thể tìm thấy trong lý thuyết “Tương đương dịch thuật” và lý thuyết Chức năng trong dịch thuật. 2.1. Lý thuyết “Tương đương dịch thuật” Lý thuyết “Tương đương dịch thuật” chỉ ra rằng các văn bản trong các ngôn ngữ khác nhau có thể tương đương ở các mức độ khác nhau (tương đương tuyệt đối hoặc tương đương một phần), về các bình diện trình bày (tương đương về từ vựng, ngữ nghĩa, ngữ cảnh, chức năng, số lượng,) và ở các cấp độ khác nhau (từ với từ, ngữ với ngữ, câu với câu, diễn ngôn với diễn ngôn,). Nida & Taber cho rằng, dịch thuật là tái tạo lại trong ngôn ngữ đích sự tương đương tự nhiên và sát với thông điệp của ngôn ngữ nguồn, trước hết là về nghĩa và sau đó là phong cách (杰里米·芒迪, 2007, tr.63). Như vậy, người dịch khi tiến hành công việc dịch, cũng đồng nghĩa với việc đi tìm ra sự tương đương hoặc tiệm cận nhất nhưng vẫn giữ được nghĩa và phong cách giữa các đơn vị ngôn ngữ. Để tìm được sự tương đương trong dịch thuật, người dịch ngoài kiến thức về ngôn ngữ đã học được, cần phải có kho ngữ liệu để tra cứu và so sánh. Thực tế cho thấy việc xây dựng các kho ngữ liệu là việc làm hết sức công phu và không phải ai cũng có thể tiếp cận được. Trong bối cảnh đó, ngữ liệu Internet chính là kho ngữ liệu trực tuyến hoàn toàn mới và toàn diện trên tất cả các lĩnh vực, giúp người dịch dễ dàng tìm được sự tương đương về các phương diện từ vựng, ngữ pháp, ngữ nghĩa, phong cách... 2.2. Lý thuyết Chức năng trong dịch thuật Trong các nền văn hoá khác nhau, cách hình thành ý tưởng và thể hiện ý tưởng bằng lời cũng khác nhau. Người dịch cần sáng tạo ra phương tiện để chuyển tải những đặc thù của ngôn ngữ và văn hoá của văn bản gốc mà không làm cho bạn đọc thuộc ngôn ngữ và văn hoá của văn bản dịch cảm thấy xa lạ; đồng thời phải tránh cả hai thái cực: thái cực thứ nhất là tái tạo lại nguyên xi một quá trình lập luận mà có thể độc giả bản dịch không hiểu được, và thái cực kia là biến đổi hoàn toàn quá trình lập luận đó thành một quá trình mà độc giả thấy quen thuộc nhưng lại đánh mất những đặc trưng của ngôn ngữ nguồn. Không có câu trả lời sẵn cho câu hỏi người dịch nên đứng ở đâu giữa 73KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v hai thái cực này, vì mỗi một văn bản là một tác phẩm với đặc thù riêng. Lý thuyết Chức năng cho rằng, chính người dịch phải quyết định vai trò của nguyên tác trong việc truyền đạt thông điệp, và chính mục đích hay chức năng của việc dịch sẽ quyết định người dịch sẽ theo phương pháp hay quan điểm nào khi chuyển ngữ. Văn bản gốc có chức năng là chuyển một thông điệp nào đó cho người đọc nguyên bản, khi chuyển ngữ, thông điệp đó phải nhắm vào độc giả của ngôn ngữ đích. Quan điểm nghiêng về ngôn ngữ nguồn (giữ các yếu tố lạ), hay chú trọng ngôn ngữ đích (sao cho phù hợp với người đọc bản dịch) không quan trọng, miễn sao bản dịch đạt được mục đích: mục đích hay ý định của người dịch, bản dịch dùng để làm gì. Như vậy người dịch sẽ tìm giải pháp chuyển ngữ nào thích hợp nhất đối với đối tượng người đọc bản dịch (Hồ Đắc Túc, 2012, tr.94). Lý thuyết này có thể giúp người dịch tìm được một mức độ trung hoà giữa sự trong sáng về ngôn ngữ và tính đặc trưng về hình thức trong văn bản của hai ngôn ngữ. Người dịch nên mở rộng những giới hạn về phong cách trong ngôn ngữ của bản dịch đến mức tối đa có thể để phản ánh được tính đặc thù trong ngôn ngữ của văn bản gốc, nhưng vẫn phải dễ hiểu, đạt được sự hợp lý và đáng tin cậy đến mức tối đa, dù không nhất thiết phải giống như được viết bởi tác giả thuộc ngôn ngữ đích. Để làm được điều đó, việc tiến hành gia công ngữ liệu liên quan ở ngôn ngữ đích trên khuôn khổ các yếu tố nội dung, hình thức của ngôn ngữ nguồn là phương án tối ưu. Internet chính là nơi cung cấp ngữ liệu cho sự sáng tạo đó của người dịch. 3. NỘI DUNG KHAI THÁC NGỮ LIỆU INTERNET TRONG DỊCH TÀI LIỆU VIỆT-TRUNG Ngữ liệu phục vụ cho quá trình dịch được tìm kiếm thông qua các công cụ tìm kiếm trực tuyến. Trong dịch Việt-Trung, các công cụ tìm kiếm được sử dụng nhiều nhất là baidu ( com), google ( sogou ( youdao ( youdao.com), yahoo ( Hiện nay, Google đang là công cụ tìm kiếm hàng đầu trên thế giới với tốc độ tìm kiếm cao, độ chính xác lớn, kết quả nhiều và đặc biệt với giao diện có tính năng dịch tự động, bản dịch có tính tham khảo cao, là một trong những công cụ tìm kiếm được nhiều người sử dụng nhất. Tuy nhiên, do Google bị hạn chế hoạt động tại Trung Quốc, trang tìm kiếm ngữ liệu tiếng Trung Quốc được ưu tiên dùng cho người dịch là trang baidu. Baidu hiện đang là trang web tìm kiếm hàng đầu tại Trung Quốc, hoàn toàn có thể khai thác, ứng dụng vào quá trình dịch tư liệu Việt-Trung. 3.1. Tìm kiếm cách dịch danh từ riêng, từ ngữ chuyên ngành Danh từ riêng thường gắn với một đối tượng nhất định, có thể là tên người, chức vụ, địa danh, tên cơ quan, tổ chức, tên sách, tên phim ảnh, tên thương hiệu Hệ thống các danh từ riêng này không chỉ số lượng lớn mà bao quát nhiều lĩnh vực, người dịch ở bất cứ lĩnh vực nào đều có thể gặp phải. Trong thực tế dịch, sẽ rất hạn chế để tra cứu cách dịch danh từ riêng này ở từ điển hoặc các tài liệu in, mạng Internet chính là một cứu cánh cho người dịch. Người dịch nên khai thác nguồn ngữ liệu Internet, không nên tùy ý sáng tạo, bởi những danh từ riêng này có thể đã được dịch và được sử dụng rộng rãi. Đặc biệt đối với chức vụ hoặc tên các cơ quan tổ chức, người dịch không nên đơn thuần dịch theo mặt chữ mà nên tra cứu trên nguồn ngữ liệu Internet, đây là phương pháp thông minh, tiết kiệm thời gian và có thể đưa lại kết quả chính xác nhất. Sử dụng công cụ tìm kiếm người dịch có thể tìm thấy nguồn ngữ liệu chứa cách biểu đạt tương đương trong ngôn ngữ đích của của các danh từ riêng, bao gồm cả những danh từ riêng mà người dịch chưa từng biết đến. Ví dụ, khi dịch cụm danh từ riêng “Đồng chí Trương Thị Mai, Ủy viên Bộ Chính trị, Bí thư Trung ương Đảng, Trưởng Ban Dân vận Trung ương”, nếu dịch theo mặt chữ người dịch có thể sẽ gặp khó khăn khi dịch cụm từ “Bí thư Trung ương Đảng”. Nếu dịch “Bí thư Trung ương Đảng” 74 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) v Dịch thuật thành “党中央书记”, thì khi tra cứu trong baidu không cho ra bất cứ kết quả nào. Phương án tối ưu là tra cứu bằng từ khóa “政治部委员张氏梅”, tức bằng những từ quen thuộc có thể dịch chính xác ngay, kết quả hiện ra sau khi tìm kiếm trong baidu là “越共中央政治部委员、中央书记处 书记、中央民运部部长张氏梅”, chính là cách dịch mà người dịch đang cần tìm. Rõ ràng “中央 书记处书记” tương ứng với “Bí thư Trung ương Đảng”, điều mà người dịch nếu chỉ loay hoay với mặt chữ văn bản nguồn không thể ngờ tới. Đối với những danh từ riêng như tên các nhà lãnh đạo các nước, tên các nhân vật, tên sách báo, phim ảnh nổi tiếng, việc tra cứu Internet sẽ nhanh chóng mang lại kết quả chính xác. Ví dụ, khi dịch tên tổng thống Indonesia Joko Widodo trong câu “Nhận lời mời của Tổng thống Indonesia Joko Widodo, Thủ tướng Chính phủ Nguyễn Xuân Phúc dẫn đầu Đoàn cấp cao Việt Nam tham dự cuộc gặp các nhà lãnh đạo ASEAN nhân dịp Hội nghị thường niên Quỹ Tiền tệ Quốc tế (IMF) – Ngân hàng Thế giới (WB) tại thành phố Bali, Indonesia và thăm làm việc Indonesia từ ngày 11 đến 12-10-2018” thì chỉ cần nhập vào ô tìm kiếm của baidu cụm từ “印度 尼西亚现任总统” sẽ tìm được tên của Tổng thống Indonesia bằng tiếng Trung là “佐科·维多多”. Đối với tên các tổ chức, các chương trình, việc tìm kiếm vẫn có thể theo cách dịch mặt chữ, tìm kiếm theo chủ đề, thậm chí tìm theo yếu tố liên quan, từ viết tắt... Ví dụ: “Chương trình đào tạo cán bộ thực thi pháp luật khu vực Châu Á (ARLEMP)” có thể chỉ cần tra cứu bằng từ viết tắt “ARLEMP” trong baidu sẽ cho ra cụm từ “亚洲地区执法管理培训 项目”. Khi tra cứu cho ra nhiều kết quả thì người dịch phải biết phân tích và lựa chọn, việc phân tích và lựa chọn luôn phải luôn quy chiếu với ý nghĩa và hình thức ngôn ngữ của ngôn ngữ nguồn. Ví dụ, khi dịch “Bộ Lao động, Thương binh và Xã hội” sang tiếng Trung, việc tra cứu trên baidu sẽ cho ra 4 kết quả dịch là: “越南劳动、残废军人和社 会部”, “越南劳动伤兵-社会部”, “越南劳动 荣军与社会部”, “越南劳动、荣军和社会部”. Căn cứ vào nguồn gốc ngữ liệu có thể thấy các trang tiếng Trung của Việt Nam hay dùng cách biểu đạt “越南劳动荣军与社会部”, các trang web trong đó có các cổng thông tin điện tử các cơ quan của Trung Quốc hay dùng “越南劳动、 荣军和社会部”. Căn cứ vào thời gian xuất hiện, các kết quả “越南劳动、残废军人和社会部”, “越南劳动伤兵-社会部” xuất hiện trong các ngữ liệu có từ khá sớm, còn các kết quả “越南劳动伤 兵-社会部”, “越南劳动荣军与社会部”, “越 南劳动、荣军和社会部” gần đây được sử dụng nhiều hơn. Trên hai cơ sở này, kết hợp với hình thức ngôn ngữ của cụm từ “Bộ Lao động, Thương binh và Xã hội”, sự lựa chọn nên là “越南劳动、 荣军和社会部”. Ngoài ra người dịch vẫn có thể kiểm tra lại khái niệm “荣军”, kết quả tra cứu trên baidu cho ra: “荣誉军人”简称“荣军”,根据新 华字典的名词释义解释为:荣誉军人是对残废 军人的尊称。根据现实生活中应用对象一般是 对伤病残军人的尊称, tức tương đương với nghĩa “thương binh” trong tiếng Việt. Đối với thuật ngữ, từ ngữ chuyên ngành, việc tra cứu ngữ liệu Internet cũng mang lại cho quá trình dịch ích lợi to lớn. Đặc biệt đối với từ ngữ chuyên ngành, các thuật ngữ khoa học, người dịch không nên tùy ý sáng tạo mà nên tra cứu xem chúng tương đương với thuật ngữ hay từ ngữ chuyên ngành nào trong ngôn ngữ đích. Quá trình tìm kiếm trên Internet có thể sử dụng các kỹ xảo tìm kiếm như với danh từ riêng, ví dụ thuật ngữ “ra-da khẩu độ tổng hợp”, tra cứu trên google ta được tên tiếng Anh là “synthetic aperture radar”, sử dụng tính năng dịch tự động của google ta được thuật ngữ “合成孔径雷达”, kiểm tra lại thuật ngữ này trên baidu và đối chiếu với phần giải thích bằng tiếng Việt trên google sẽ xác định được đây là tên chính xác của thuật ngữ cần dịch. Đối với từ ngữ văn hóa, từ ngữ mới, hoặc từ ngữ biểu thị sự vật, hiện tượng đặc trưng của Việt Nam, việc tra cứu có thể không cho ra kết quả trực tiếp nhưng cũng có thể đưa ra những cách dịch hợp lý hơn, bởi sáng tạo ra từ ngữ mới cũng luôn phải tôn trọng quy tắc ngôn ngữ của ngôn ngữ đích, góp ph ... 享” vừa thể hiện được ý trong nguyên văn tiếng Việt, vừa xúc tích, ngắn gọn hơn cách dịch “本报《读者桥梁》专栏谨 向读者简略介绍其中若干切实有效的意见”. Ngoài ra, người dịch cũng có thể học cách diễn đạt đơn giản, đễ hiểu trong ngôn ngữ báo chí tiếng Trung Quốc, những cách biểu đạt như “今天, 是”, “在这个值得纪念的日子里” Như vậy, thông qua quá trình tìm kiếm và khai thác ngữ liệu, bản dịch ban đầu có thể biểu đạt lại thành: “6月 21日是越南革命新闻诞生88周年的纪念日。在 这些日子里,全国各地的热心读者已给《人民 军队报》发来了许多热情洋溢的祝福,不少读 者还热情提出了许多好的建议和意见,本报《 读者桥梁》选择部分刊登,与读者共享”. Cách xử lý này góp phần đưa ra một bản dịch có ngôn ngữ biểu đạt súc tích hơn, sát hợp với thói quen ngôn ngữ của độc giả Trung Quốc, đồng thời cũng đảm bảo được tính trung thực, chính xác, hiệu quả và trong sáng của phong cách viết báo. Đây cũng là quy ước căn bản về ngôn ngữ mà dịch thuật báo chí phải tuân theo khi ứng dụng lý thuyết chức năng (Hồ Đắc Túc, 2012, tr.160). 3.5. Tra cứu kiến thức nền có liên quan Dịch là một quá trình lý giải và biểu đạt lại, trong đó nhấn mạnh tính chính xác, triệt để và toàn 78 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) v Dịch thuật diện. Để làm được điều này, người dịch không chỉ dừng lại ở việc lý giải câu, từ mà còn phải hiểu được các bối cảnh về văn hóa, lịch sử, xã hội có liên quan. Đây chính là kiến thức nền mà mọi người hay nhắc đến, nó liên quan đến các vấn đề ngoài ngôn ngữ như tình huống giao tiếp và các yếu tố có liên quan như chính trị, lịch sử, quân sự, kinh tế, văn hóa, giáo dục, khoa học, y tế, đạo đức, tôn giáo, phong tục tập quán Những kiến thức này người dịch rất khó có thể tìm thấy trong từ điển. Trong khi đó các nội dung dịch rất rộng lớn, liên quan đến hầu hết các vấn đề có trong xã hội, do kinh nghiệm, quốc tịch, bối cảnh văn hóa của tác giả và người dịch không giống nhau, có những nội dung trong văn bản gốc người dịch không thể dễ dàng lý giải, lúc đó kiến thức nền của người dịch sẽ phát huy tác dụng. Tuy nhiên, không phải lĩnh vực nào người dịch cũng có đầy đủ kiến thức liên quan, kho kiến thức tổng hợp này có trên Internet, chỉ cần người dịch biết cách khai thác là có thể giải quyết được vấn đề gặp phải khi dịch, đồng thời bổ sung thêm kiến thức vào kho kiến thức của riêng mình. Ngoài ra, trong quá trình dịch, người dịch thường hay gặp phải những nội dung mới, lĩnh vực mới, thậm chí khá xa lạ. Lúc đó, người dịch phải biết cách tìm kiếm tư liệu có liên quan, đọc và bổ sung những kiến thức về lĩnh vực đó, và mạng Internet là một kênh tra cứu tiện lợi và nhanh chóng. Sử dụng công cụ tìm kiếm trên google, baidu, nhập vào từ khóa tìm kiếm, trong khoảng thời gian rất ngắn người dịch đã có thể tiếp cận với nguồn tư liệu khổng lồ. Đương nhiên để đưa ra kết quả đúng với cái mà người dịch định tìm kiếm thì việc điều chỉnh từ khóa là việc nên làm. Nguồn tư liệu tìm được có thể là các bài viết chuyên ngành, giúp người dịch hiểu rõ được về nội dung đang cần dịch. Việc tra cứu kiến thức nền thường được tiến hành khi người dịch gặp phải các thuật ngữ hoặc các khái niệm chuyên ngành. Như để dịch chính xác thuật ngữ “vùng tiếp giáp lãnh hải” thì phải tra cứu các kiến thức có liên quan đến lãnh hải, thậm chí còn phải làm rõ trên cơ sở đối chiếu với các thuật ngữ như vùng chồng lấn, vùng giáp ranh, vùng đặc quyền kinh tế, thềm lục địa Hoặc như dịch cụm từ “Giấy xác nhận nhân sự” sang tiếng Trung Quốc, nếu dịch theo mặt chữ là “人事确 认书” thì đưa vào tìm kiếm trên baidu không cho ra kết quả nào, do đó, cần phải tra cứu khái niệm giấy xác nhận nhân sự là gì. Tra cứu trên google sẽ cho ra kết quả: “Giấy xác nhận nhân sự là một trong những nội dung cần thiết để xác nhận nhân sự tham gia vào các giao dịch dân sự, chứng minh một phần nhân thân về việc chấp hành pháp luật. Nói cách khác, loại giấy này giống như một bản cam kết nhằm chứng minh bản thân người làm thủ tục không vi phạm các quy định của pháp luật”. Trong các mẫu giấy xác nhận nhân sự tiếng Việt luôn có câu: “bản thân người làm đơn không vi phạm những quy định của pháp luật và địa phương đang sống, tức không có án tích (ghi chép trong hồ sơ về vi phạm pháp luật)”. Trên cơ sở này, người dịch mới biết được đây là giấy chứng nhận không vi phạm pháp luật và nếu tìm kiếm trên baidu với từ khóa “无犯法证明书”, sẽ được tên văn bản tương đương là “无犯罪记录证明书”. 4. KỸ NĂNG TÌM KIẾM VÀ KHAI THÁC NGỮ LIỆU INTERNET TRONG QUÁ TRÌNH DỊCH 4.1. Những điểm cần lưu ý trong tìm kiếm và khai thác ngữ liệu Internet vào quá trình dịch Khai thác ngữ liệu Internet có tác dụng vô cùng lớn trong quá trình dịch, không chỉ giúp người dịch tiết kiệm được thời gian và công sức mà còn có tác dụng nâng cao chất lượng bản dịch. Tuy nhiên, ngoài những ưu điểm trên, nguồn tài liệu Internet cũng có một số hạn chế mà người dịch phải luôn lưu ý. Đối với nguồn ngữ liệu phục vụ tra cứu thông tin, kiến thức nền hoặc kiến thức chuyên ngành, người dịch khi tra cứu trên Internet sẽ phải đối diện với những thông tin không chính thống, mang tính cá nhân, thiếu chọn lọc, dàn trải, vụn vặt, khó xác định nguồn tin, khó kiểm chứng; không ít những thông tin sai với các tính chất khác nhau, thậm chí có các thông tin xuyên tạc có tính chất chính trị...; có những bài viết, bài nghiên cứu nhưng lại lồng ghép ý đồ cá nhân, thậm chí trong việc giải thích một số khái niệm, đặc biệt là các khái niệm có liên 79KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v quan đến lĩnh vực có tranh chấp, cách giải thích đôi khi không khách quan mà hướng tới việc có lợi cho bên giải thích. Vì thế, khi tham khảo các kiến thức có liên quan, việc thu thập thông tin cần chú ý đến những đặc điểm này để loại bỏ những yếu tố cảm tính, tìm ra những yếu tố có ý nghĩa thông tin khách quan, bảo đảm tính chính xác và có độ tin cậy cao. Đối với nguồn ngữ liệu phục vụ đối chiếu và chuyển đổi ngôn ngữ, khi khai thác nguồn ngữ liệu này người dịch cũng phải đối diện với tình trang hỗn độn của ngôn ngữ mạng. Giống như nhiều quốc gia khác, hiện nay Trung Quốc cũng đang phải đối mặt với tình hình ngôn ngữ mạng không chuẩn xác đến từ những trang mạng dịch tự động, những cách biểu đạt không phù hợp với văn phạm tiếng Hán tại các diễn đàn, các trang blog cá nhân Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018, tr.43) khi bàn về mặt tiêu cực của ngôn ngữ mạng tiếng Trung cũng chỉ ra việc sử dụng cách biểu đạt lủng củng, biểu đạt thừa làm cho quy tắc, quy phạm ngữ pháp của tiếng Trung Quốc trở nên lộn xộn, sử dụng các từ ngữ vô nghĩa, thô thiển, ảnh hưởng đến tính thuần khiết của ngôn ngữ. Ngô Tiểu Long cũng nhận định, những hành vi ngôn ngữ này “không những không làm phong phú ngôn ngữ mà ngược lại còn làm ô nhiễm tiếng Trung Quốc”. Xuất phát từ tình trạng này, ở một số nơi của Trung Quốc đã phải ban bố các quy định nhằm quy phạm hành vi ngôn ngữ mạng (吴小龙, 2008, tr.58). Do đó, khi khai thác ngữ liệu Internet, người dịch cần phải xác định được tính chân thực, chuẩn xác của ngữ liệu như tính chính xác khoa học, tính quy phạm của ngôn ngữ, tốt nhất nên khai thác nguồn ngữ liệu đã được thẩm định. 4.2. Các kỹ năng cơ bản trong tra cứu và khai thác ngữ liệu Internet vào quá trình dịch 4.2.1. Kỹ năng tìm kiếm Đầu tiên, nên sử dụng các trang mạng tìm kiếm lớn như google, yahoo, baidu Tuy nhiên, người dịch cần xác định chính xác từ khóa để việc tìm kiếm có hiệu quả hơn. Từ khóa ở đây có thể là phương án dịch đầu tiên, có thể là dịch theo mặt chữ khi mà người dịch chưa có phương án khác. Sau khi đưa vào tìm kiếm, nếu từ khóa đó không đưa ra kết quả chính xác thì cũng có thể có các gợi ý khác thông qua việc đọc nhanh các kết quả liên quan đã hiện ra để tìm kiếm các từ khóa khác. Ngoài ra cũng có thể tìm kiếm theo chủ đề, thậm chí có thể tận dụng từ ngữ viết tắt, cách dịch ra tiếng Anh, tra cứu theo sự kiện, mở rộng hoặc thu hẹp phạm vi tìm kiếm của từ khóa, tra cứu các bài viết liên quan, đọc để tìm ra cái tương đương Tuy nhiên, đối với những từ ngữ mới, việc tra cứu chủ yếu để tìm hiểu nội hàm ý nghĩa của từ ngữ đó, để tìm được cái tương đương tuyệt đối đôi khi rất khó vì nó có thể có ở ngôn ngữ này mà không có ở ngôn ngữ kia. Việc tìm kiếm tài liệu còn để phục vụ cho việc kiểm tra tính chính xác của bản dịch. Kiểm tra tính chính xác của bản dịch được bắt đầu bằng từ khóa là những từ ngữ hoặc cách biểu đạt mà bản thân người dịch khi đọc lại vẫn cảm thấy chưa bằng lòng. Với các từ ngữ, khái niệm, đôi khi phải kiểm tra bằng công cụ tìm kiếm hình ảnh, hoặc tìm kiếm sự vật, hiện tượng đó trong thực tế, từ đó mới tìm ra được tên gọi, cách biểu đạt tương đương. 4.2.2. Kỹ năng đánh giá ngữ liệu Người dịch nên truy cập, xem các tài liệu tại các trang web uy tín, chất lượng, các trang web của các cơ quan nhà nước, Chính phủ, Quốc hội, các trang web có địa chỉ cụ thể, tránh sử dụng tài liệu của các trang web nhỏ, không uy tín, không có địa chỉ cụ thể, để thu thập thông tin và tìm hiểu kiến thức có liên quan. Nguồn ngữ liệu được đăng trên các trang thông tin chính thức, trang điện tử của các tờ báo lớn, các tạp chí nghiên cứu đa số đều được kiểm duyệt một cách chặt chẽ về mặt nội dung cũng như ngôn ngữ, cách biểu đạt cơ bản là chuẩn mực, phù hợp với quy phạm văn phong ngôn ngữ. 4.2.3. Kỹ năng lựa chọn và phân tích Với mỗi lần tìm kiếm, thông thường kết quả cho ra là khổng lồ, nếu không có phương pháp, người dịch rất dễ chìm vào một đống thông tin hỗn 80 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) v Dịch thuật độn. Việc đọc lướt phần chữ xuất hiện kèm từ khóa trong các kết quả, xem nhanh nguồn gốc trang web sẽ cho người dịch một ấn tượng nên đọc kết quả nào. Người dịch nên chọn đọc những trang chính thống hoặc của các cơ quan thông tấn, báo chí hạn chế đọc các kết quả trong các diễn đàn hay blog cá nhân Ngoài ra, với một từ hay một cụm từ có thể tìm được nhiều kết quả dịch khác nhau. Khi đó, tiêu chí để lựa chọn đó là tính phổ biến (kết quả hiện lên có nhiều không), tính chính thống (xuất hiện trên các trang web chính thống, có uy tín), tính bản địa (trang web đó là của nước nào) 4.2.4. Kỹ năng gia công ngữ liệu Dịch là một quá trình chuyển một hình thức biểu đạt trong ngôn ngữ nguồn sang một hình thức biểu đạt tương ứng trong ngôn ngữ đích trong sự đảm bảo về nội dung và chức năng. Trong dịch, cái mà người dịch hay mắc không phải là lỗi về ngữ pháp mà là sự tương thích về biểu đạt giữa hai ngôn ngữ. Để tạo được sự tương thích này, nguồn ngữ liệu Internet có thể giúp người dịch xây dựng được ngữ liệu khả sánh. Đọc ngữ liệu đã tìm được có liên quan về nội dung, về ý, về phong cách văn bản trong sự so sánh với văn bản gốc, người dịch có thể tìm ra được những cụm từ, những cách biểu đạt tương đương hoặc những câu, đoạn có thể cải biến lại cho phù hợp với ý nghĩa và mục đích của văn bản gốc. Đây cũng chính là quá trình tìm kiếm và gia công ngữ liệu. Việc gia công ngữ liệu có thể là mô phỏng cách biểu đạt gắn với ý nghĩa của văn bản nguồn để đưa ra được một văn bản dịch vừa đủ ý, vừa có cách biểu đạt lưu loát, lời dịch không bị lai căng hoặc biểu đạt theo hướng “tiếng Trung Quốc kiểu Việt Nam”. 4. KẾT LUẬN Đánh giá vai trò quan trọng của Internet với dịch thuật, Timothy R. Hunt nhấn mạnh: “Máy tính sẽ không bao giờ thay thế người dịch nhưng người dịch sử dụng Internet sẽ thay thế người dịch không dùng chúng”2. Phương pháp tra cứu ngữ liệu truyền thống trong quá trình dịch đã tỏ ra kém hiệu quả trong thời đại bùng nổ Internet, nguồn ngữ liệu Internet hiện nay có thể mang lại những lợi ích vô cùng to lớn cho người dịch. Xuất phát từ những yêu cầu cao của công việc dịch, người dịch càng phải biết tận dụng những lợi ích mà nguồn ngữ liệu Internet mang lại, biết khai thác ngữ liệu Internet, biết thông qua ngữ liệu Internet để sử dụng thành quả lao động của những người dịch trước. Việc khai thác nguồn ngữ liệu Internet vào quá trình dịch không chỉ giúp nâng cao hiệu quả công việc dịch cũng như chất lượng bản dịch mà còn mở ra những hướng nghiên cứu mới cả về lý luận và thực tiễn./. Chú thích: 1. Tham khảo định nghĩa “Tài liệu trực tuyến” của Nguyễn Lê Phương Hoài (2015) trong Nguồn tài liệu trực tuyến: quá trình và xu hướng phát triển trong các thư viện trên thế giới, Tạp chí Thư viện Việt Nam, số 2. 2. Dẫn theo Nguyễn Phước Vĩnh Cố (2017), Nguồn tư liệu Internet và người dịch chuyên ngành, truy cập ngày 06/10/2018, < https://nguyenphuocvinhco. com/2017 /05/09/the-internet-resources-and- specialised-translators-nguon-tu-lieu-tren-internet- va-nguoi-dich-chuyen-nganh/>. Tài liệu tham khảo: Nguyễn Hồng Cổn (2004), “Cơ sở ngôn ngữ học của nghiên cứu dịch thuật và bộ môn Dịch thuật học”, Tạp chí Ngôn ngữ, số 11, tr.32-38. Nguyễn Lê Phương Hoài (2015), “Nguồn tài liệu trực tuyến: quá trình và xu hướng phát triển trong các thư viện trên thế giới”, Tạp chí Thư viện Việt Nam, số 2, tr.11-15. Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018), “Bàn về một số đặc điểm của ngôn ngữ mạng trong tiếng Hán”, Tạp chí Khoa học Ngoại ngữ Quân sự, số 15, tr.39-46. Lê Hùng Tiến (2010), “Tương đương dịch thuật và tương đương trong dịch Anh-Việt”, Tạp chí khoa học ĐHQGHN, Ngoại ngữ 26, tr.64-71. Hồ Đắc Túc (2012), Dịch thuật và tự do, NXB Hồng Đức, Hà Nội. 陈李春(2012),浅析网络时代的翻译能力培养,海 外英语,第10期,175-176。 81KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v USING INTERNET AS A DATA SOURCE IN VIETNAMESE-CHINESE TRANSLATION TONG VAN TRUONG Asbtract: Parallel with the stormy development of science and technology, Internet is now applied in any aspect of our lives and translation is not an exception. If properly used, Internet can provide enormous linguistic data that not only help translators find equivalents but also make their translation smoother and more appropriate. Making use of Internet in translation mainly includes: finding equivalents between the source and the target languages; looking up structures and codes of the target language; checking the accuracy of translation products; comparing translation products with linguistic data to make sure that the translation is smooth and of better quality; looking up related specialist knowledge However, when using Internet as a source of linguistic data for translation, one has to mind the backwards in terms of cyber language and cyber information. Based on convincing arguments relating to the topic, the article suggests several ways of using Internet as a linguistic data source in Vietnamese-Chinese translation. This can be a new access to using Internet in translation that translators can use to better their translation products. Keywords: Internet linguistic data, linguistic equivalents, processing linguistic data, Vietnamese- Chinese translation. Received: 25/10/2018; Revised: 07/01/2019; Accepted for publication: 25/02/2019 杰里米·芒迪、李德风译 (2007), 翻译学导论, 商 务印书馆, 北京。 连淑能(2006),英译汉教程,北京高等教育出版社 北京。 万兆元(2008),因特网辅助翻译,上海翻译,第3 期,77-80。 吴小龙(2008),利用网络资源为翻译工作服务的 理论和实践探讨,文教资料,第12期, 57-59。
File đính kèm:
- khai_thac_nguon_ngu_lieu_internet_trong_dich_tai_lieu_viet_t.pdf