Our forum runs best with JavaScript enabled !

Google dịch và tương lai dịch thuật

View previous topic View next topic Go down

Google dịch và tương lai dịch thuật Empty Google dịch và tương lai dịch thuật

Post by LDN Mon Jun 13, 2022 11:39 pm

Vài nhận xét về Google Translate

Trần Ngọc Cư
12 tháng 6, 2022 - Sài Gòn nhỏ

Google Translate được định nghĩa “là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác” (Wikipedia).

“Dịch vụ dịch máy” này ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi vọc chơi với Google Translate vài giờ, chúng ta có thể dễ dàng có những nhận xét sau đây:

(1)Máy chỉ dịch “từ theo từ” (word for word translation), thông thường với độ chính xác khá cao, nhưng có một tần suất không thể bỏ qua là máy không dịch đúng với nghĩa trong văn cảnh (contextual meaning). Nó sẵn sàng dịch “cây gạo” là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton tree; silk-cotton”, chẳng hạn.

Hàng chục cụm từ chuyển mạch như that said, that being said (tuy vậy), after all (dẫu sao), to be sure (tuy vậy), cấu trúc “For all the…” (bất chấp/mặc dù), chẳng hạn, đều bị dịch “word for word”.

Đầu vào: “For all the efforts he made for re-election, Trump ended up as a political loser.”

Đầu ra: “Đối với tất cả những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành một kẻ thất bại chính trị.”

(Câu này đáng lẽ phải dịch: “Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối cuối cùng đã trở thành một kẻ thất bại chính trị.”)

Khi đi bác sĩ, bạn có thể được hỏi, “Are you allergic to anything?” (Anh có bị dị ứng gì không?” Nếu muốn trả lời “không” theo kinh nghiệm của mình, bạn sẽ nói, “Not that I know of.” Ta thử cho câu này vào máy nhé!

Đầu vào: “Not that I know of.”

Đầu ra: “Không phải là tôi biết.”

Đây là một câu rất thông thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of.” phải dịch: “Theo chỗ tôi biết thì không.”

Thử nghiệm ngày 10 Tháng Sáu 2022 (ảnh chụp màn hình)
(2)Tác động của Google Translate lên từ vựng tiếng Việt:

Qua thời gian, tuy nhiên, một số từ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một từ được dùng sai lâu ngày vẫn có thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của ngôn ngữ có tính võ đoán (the development of language is arbitrary.)

Chúng tôi ghi nhận một vài trường hợp trong đó có lẽ nhờ máy dịch mà một số từ đã trở nên thông dụng và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến từ elites và từ certain. Thứ nhất, hễ máy gặp từ “elites” thì nó sẽ tự động dịch ngay là “giới tinh hoa”. Hai chữ tinh hoa gợi lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, từ elites còn có nghĩa là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng hạn, thường dùng từ “elites” để chỉ giới lãnh đạo hay giai cấp thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn “giới chóp bu” để dịch từ elites. Nói cách khác, từ elites có thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu”, nhưng máy dịch luôn chọn “giới tinh hoa”.

Một ví dụ khác: Không biết do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào máy, hễ gặp từ certain thì máy liền dịch là “nhất định”(sure; having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với những câu như “Các nỗ lực cứu hộ gặp phải một số hạn chế nhất định.” Nhưng từ certain còn có nghĩa như “some” khi một điều gì đó không được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch ngay là “Một nụ cười nhất định”. Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới có ý nghĩa. Nói cách khác, certain có thể dịch hoặc là “nhất định” hoặc là “nào đó”, nhưng máy dịch luôn luôn chọn “nhất định”.

Một ví dụ khác nữa là từ “platform” thường được Google Translate dịch là “nền tảng” và được báo chí Việt Nam đưa vào từ vựng hiện hành để chỉ các “diễn đàn xã hội” như Facebook, Twitter, Truth Social, etc.

Có lẽ do người lập trình có lập trường chính trị, đôi khi Google Translate tỏ ra biết chọn từ ngữ một cách rất phải đạo chính trị (in a politically correct fashion). Người sử dụng không khỏi buồn cười khi thấy máy dịch đặt chữ “ông” trước một số tên và gọi trỏng đối với một số tên khác. Chẳng hạn, “Trump” không có chữ ông đứng trước, nhưng máy lại dịch “Xi” thành “ông Tập”. Ta thử so sánh cặp ví dụ sau đây:

Nếu đầu vào là: “Donald Trump has married three times. Trump now has five children.”

Đầu ra sẽ là: “Donald Trump đã kết hôn ba lần. Trump hiện có năm người con.”

Nhưng nếu đầu vào là: “Xi Jinping is the President of the People’s Republic of China. Xi is going to Hanoi next month.”

Đầu ra sẽ là: Tập Cận Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào tháng tới.


Thử nghiệm ngày 10 Tháng Sáu 2022 (ảnh chụp màn hình)
(3)Google Translate cực kỳ yếu kém khi đụng đến thành ngữ (idioms), tiếng lóng (slangs). Ta thử xem qua vài ví dụ về idioms:


Đầu vào: “He knocked her up and left her.”

Đầu ra: “Anh ấy hất cô ấy lên và bỏ mặc cô ấy”.

(Sai. Knock up = cho mang bầu. Câu này phải dịch: Anh ấy cho cô ấy mang bầu rồi bỏ quất ngựa truy phong.)

Đầu vào: “Donald Trump Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.”

Đầu ra: “Typo ‘Radicle’ của Donald Trump Jr. có người dùng Twitter trong các lần cắt.”

(Sai. In stitches = cười bể bụng. Câu này phải dịch: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr. đã làm người sử dụng Twitter cười bể bụng.”

(4)Về ngữ pháp, Google Translate xử lý tốt những mẫu câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ thuật. Nhưng khi gặp những cấu trúc cú pháp (syntactical structures) văn chương xưa, nó rất dễ dịch sai lạc, như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn, but = mà không. Ví dụ:

Đầu vào: “There is no mother but loves her children.”

Đầu ra của máy dịch: “Có mẹ nào mà thương con.”

(Máy đã dịch phản nghĩa. Câu trên tương đương với: There is no mother that doesn’t love her children = Có mẹ nào mà không thương con mình.)

Ở trên, tôi nói “Google Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến không ngừng. Có thể trong một, hai giờ nữa nó sẽ dịch đúng những câu tôi đem ra làm ví dụ ở trên. Đã qua rồi cái thời nó dịch “The Universe in a Nutshell” là “Vũ trụ trong một hạt dẻ.”

Cứ lẽ thường, trừ thơ văn xưa ra, Google Translate trong tình trạng hiện nay đã giúp ích chúng ta rất nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã nói ngược lại điều tác giả muốn nói.

Một điều không kém phần quan trọng là dùng Google Translate đỡ tốn công đánh máy và sửa lỗi của Google Translate là một thao tác thú vị.


Last edited by LDN on Mon Jan 30, 2023 10:41 pm; edited 1 time in total

_________________
~ bài viết về Sách:

https://www.nhomcho.com/t25736-sach
LDN

LDN


Back to top Go down

Google dịch và tương lai dịch thuật Empty Re: Google dịch và tương lai dịch thuật

Post by LDN Mon Jan 30, 2023 10:39 pm

Google dịch và tương lai dịch thuật (Hiền Trang)

Vanvn- “Ngày hôm nay, lần đầu tiên tiếng Nga được dịch sang tiếng Anh bởi một “bộ óc” điện tử”, phần dẫn nhập của một bài trên tờ New York Times ngày 7 tháng 1 năm 1954 viết. Chiếc máy tính mang tên 701 chỉ trong vài giây đã dịch 60 câu trong nhiều lĩnh vực, từ chính trị đến toán học, từ hóa học đến luật pháp, chẳng hạn như “Độ lớn của góc được xác định bởi mối quan hệ giữa độ dài của cung và bán kính”, hay “Sự hiểu biết quốc tế tạo thành một yếu tố quan trọng trong việc quyết định các vấn đề chính trị”.

Khi cỗ máy dịch 701 ra đời, các nhà khoa học đã dự đoán mặc dù vẫn chưa thể cho một cuốn sách tiếng Nga vào một đầu và lấy ra ở đầu bên kia một cuốn sách tiếng Anh, nhưng chỉ từ 3 đến 5 năm nữa, việc dịch thuật điện tử trong một số lĩnh vực của một vài ngôn ngữ có thể là thành tựu nhãn tiền. Dự đoán ấy hơi lạc quan. Bởi phải đến vài chục năm sau, dịch thuật máy mới trở nên phổ biến, với sự xuất hiện của Google Dịch.

Google Dịch – giả sử trên đời có danh sách những phát minh nào bị giễu cợt nhiều nhất khi mới ra đời, Google Dịch nếu không đứng đầu bảng thì cũng phải thuộc top 10. “Dịch gì như Google” – chỉ một lời ngắn gọn như vậy cũng đủ kết liễu sự nghiệp của một dịch giả hoặc chí ít là dập tắt hoàn toàn sự tự tin của dịch giả ấy. Không lời sỉ nhục nào đau đớn bằng. Một thời, nghĩ đến Google Dịch là nghĩ đến một trò cười ngô nghê, một nguồn giải trí bất tận, ai đang buồn có thể lên Google dịch thử vài câu và thế nào cũng được cười bể bụng.

Vậy mà hồi đầu năm nay, khi tôi thực hiện một dự án sách cá nhân, trong đó có một chương về Vladimir Nabokov, tôi – dù chữ tiếng Nga bẻ đôi không biết – đã thử làm một động tác không tưởng, cố gắng tìm những tác phẩm thời kỳ đầu khi văn hào còn viết bằng tiếng mẹ đẻ, rồi dịch sang tiếng Anh và đối chiếu với chính bản tiếng Anh của tác phẩm do đích thân Nabokov tham gia chuyển ngữ. Kết quả: Tôi hoàn toàn sửng sốt. Ngoài những chi tiết khác biệt mà Nabokov cố tình chỉnh sửa cho bản Anh ngữ, các phần còn lại tương đồng tới mức kinh ngạc và bản dịch của Google tuy vẫn còn nhiều lỗi nhưng đạt chất lượng văn chương khó tin so với một cỗ máy hài hước mà tôi từng biết, thậm chí một người bình thường thành thạo cả hai ngôn ngữ chưa chắc đã làm được. Đấy là chưa nói đến chuyện Nabokov là một kiến trúc sư ngôn ngữ kỳ tài. 

Kể từ ấy, tôi thay đổi cái nhìn với Google Dịch. Chỉ trong khoảng 15 năm (Google Dịch được giới thiệu lần đầu vào năm 2006), ứng dụng này đã tiến bộ chóng mặt. Điều làm nên sự khác biệt chỉ mới đến từ 7 năm trước, khi Google bắt đầu sử dụng hệ thống mạng thần kinh bên cạnh trí tuệ nhân tạo để nâng cấp Google Dịch. Mạng thần kinh này mô phỏng cách bộ óc của con người hoạt động và có thể học được từ những lỗi sai, cập nhật những góp ý từ hàng tỷ người dùng mỗi ngày trên thế giới và những bản dịch đã trở nên nhuần nhuyễn, chính xác hơn trước nhiều lần. Để so sánh mạng thần kinh này với phương pháp dịch cổ truyền dựa trên từng từ một, nhà nghiên cứu người Ý Marcello Federico đưa ra so sánh thế này: Nếu như phương pháp cũ sẽ mô tả một chai nước ngọt như hỗn hợp gồm đường và nước thì phương pháp mới mô tả chai nước ngọt từ các khía cạnh màu sắc, độ ngọt, độ sủi bọt, tức là sâu sắc hơn nhiều.

Nếu bỏ qua văn chương mà chỉ xét đến những tài liệu kỹ thuật đơn giản, bạn thậm chí có thể giao phó cho Google dịch thuật và chỉ việc biên tập lại một chút. Đó là lời thú nhận của bạn bè tôi, những người làm ở môi trường đa văn hóa và phải sử dụng song song tiếng Anh – tiếng Việt.

Người ta nói rằng một dịch giả không nên cho phép bản thân dùng Google Dịch, nhưng là một dịch giả, tôi đôi khi vẫn sử dụng nó. Không phải vì muốn sao chép lại công sức của Google Dịch cho nhanh hay vì lười mà đôi khi, với một số cụm từ chưa chắc chắn, tôi muốn xem thử phương án Google đề xuất là gì. Đôi khi, Google cũng không gợi ý được cho tôi phương án tốt hơn, nhưng lại có lúc, tôi ngạc nhiên trước gợi ý sắc sảo của Google.

Tôi dám chắc rằng ở mặt nào đó, Google Dịch đã giúp cuộc đời của các dịch giả trở nên dễ chịu hơn rất nhiều. Nhưng, mặt khác, Google Dịch dấy nên lo ngại rằng trong tương lai, nếu công cụ dịch tiếp tục phát triển vũ bão như hiện giờ, các dịch giả sách – những người vốn dĩ đã chịu cảnh làm người vô hình trong biết bao thời đại, hiếm khi được đối xử đúng mức và cày cuốc với mức thù lao gần như tượng trưng, những người mới chỉ gần đây thôi được nền công nghiệp xuất bản đánh giá lại vai trò – sẽ một lần nữa, lại rơi vào cảnh tàng hình.

Lo lắng ấy tưởng chừng khá vặt vãnh. Dù trình độ đã bứt phá hơn xưa, nhưng ai dịch bằng Google cũng cảm thấy công cụ này vẫn thiếu một điều gì đó, một điều mà người sử dụng ngôn ngữ không phải tiếng mẹ đẻ cũng thường mắc phải, một sự nhạy cảm và thân mật với ngôn ngữ đó để hiểu tất cả những ám chỉ, bóng gió, nước đôi, hàm ngôn thay vì chỉ chạm được vào ngôn ngữ qua một màng bọc nylon, không thể nào cảm được những gồ ghề lượn sóng nho nhỏ trên bề mặt, thứ đó, trong tiếng Anh, gọi là Sprachgefüh, một từ ghép bởi hai từ tiếng Đức: Sprach (ngôn ngữ) và gefühl (cảm xúc). Hay nói cách khác, bản dịch của Google thường thiếu đi tính cách và giọng điệu – điều phân biệt văn chương với văn kiện.

Google Dịch, tựa một dịch giả tồi, tuy biết rất rõ nghĩa của từ nhưng lại thiếu thốn kinh nghiệm sống trong xã hội để hiểu hết những trái khoáy một con người phải đối đầu hằng ngày. “Google Dịch chỉ quen thuộc với các chuỗi tạo thành từ các từ vốn được tạo thành từ các chữ cái. Nó hoàn toàn chỉ là quá trình xử lý cực nhanh các đoạn văn bản, không phải về sự suy nghĩ hay sự tưởng tượng hay sự ghi nhớ hay sự thấu hiểu. Nó thậm chí không biết rằng từ ngữ đại diện cho sự vật”, Douglas Hofstadter, một nhà nghiên cứu về khoa học nhận thức và văn học so sánh viết trong một bài báo mang tên “Sự nông cạn của Google Translate” đăng trên tờ The Atlantic hồi 4 năm trước, trong đó ông biện luận rằng vấn đề của Google Dịch là nó chẳng hiểu nó đang làm gì, trong khi bản chất của sự dịch không nằm ở chỗ chuyển những từ ngữ từ ngôn ngữ này qua ngôn ngữ khác, mà là chuyển những ý tưởng từ ngôn ngữ này qua ngôn ngữ khác và công việc này đòi hỏi sự thấu hiểu. Dịch không phải một công năng cơ giới, nó là một cuộc trao đổi về trí tuệ thầm kín giữa dịch giả và tác giả, văn bản dịch luôn nạo vét cả những trải nghiệm của dịch giả và hòa lẫn chúng với những ý tưởng của tác giả.

Tất cả những điều ấy đều đúng đắn. Google Dịch không phải một con người như chúng ta. Nó không quen thuộc với những tình huống đời sống, nó chưa từng sống và vì thế không đời nào có chuyện Google Dịch một ngày kia có thể ngang hàng các dịch giả tử tế, chưa nói tới những dịch giả vĩ đại.

Song, ta có dám chắc rằng Google Dịch không thể học được cách suy nghĩ hay không? Trong bài báo của Hofstadter, ông lấy một thí dụ thể hiện sự nông cạn của Google Dịch bằng cách dịch một câu tiếng Pháp có nghĩa là “Trong nhà họ, mọi thứ đều có hai chiếc. Có xe hơi của anh và xe hơi của cô, khăn tắm của anh và khăn tắm của cô, thư viện của anh và thư viện của cô” sang tiếng Anh. Cái khó của câu này nằm ở chỗ, trong tiếng Pháp, đại từ sở hữu “của cô ấy” và “của anh ấy” đều là “sa”. Vậy là Google Dịch, vốn mang đặc trưng nam trị, dịch tất cả thành của anh ấy. Ngay cả khi Hofstadter chuyển sang cách dùng từ khác để nêu rõ giới tính của họ, Google vẫn giữ nguyên cách dịch. Ông đi đến kết luận rằng Google chẳng hiểu gì về hôn nhân, về các mối quan hệ vợ chồng, đàn ông – đàn bà cả. Nó thiếu kinh nghiệm sống. 

Thế nhưng khi tôi thử dịch lại cùng câu ấy hôm nay, sau gần 5 năm, Google tuy vẫn nhầm lẫn nếu ta dùng đại từ sở hữu “sa”, song nó đã không còn nhầm lẫn khi giới tính được nêu rõ. Nói gì đi nữa, Google đã tiến triển. Có thể sự tiến bộ này chẳng nói lên Google đã bắt đầu hiểu chuyện hơn hay đã có chút kinh nghiệm tình ái mà chỉ đơn giản là nhầm lẫn của nó đã phần nào được chính người dùng khắc phục và sau rốt, nó vẫn chẳng hiểu mình đang dịch cái gì, sau rốt, chỉ đơn giản là thuật toán số đã chính xác hơn, đương nhiên, sau rốt, nó chẳng trăn trở chút nào về ý nghĩa của văn bản đó.

Có lẽ vấn đề không nên nằm ở chỗ liệu máy dịch có bao giờ sánh ngang với người dịch, liệu máy dịch có thừa hưởng những trải nghiệm và xúc cảm, những day dứt và ngổn ngang của một dịch giả, người hẳn phải yêu văn bản ấy đến mức sẵn sàng dịch nó ra với mức tiền công bèo bọt, người làm vì đam mê và đam mê tận cùng. Có lẽ ta nên nghĩ theo một chiều hướng khác. Sự phát triển của Google Dịch khiến một dịch giả trăn trở nhiều hơn về vai trò dịch giả, nó đốc thúc ta suy nghĩ về công việc khổ ải ta lựa chọn, mà chẳng phải suy nghĩ là đặc trưng của tính người? Google cũng cho ta thêm những lựa chọn về từ ngữ đôi khi ta không nghĩ đến, nó không khiến ta bớt trăn trở hơn mà chỉ khiến ta trăn trở thêm.

Và như vậy, Google Dịch không những không khiến bản sắc làm người trở nên nhòa nhạt, nó càng nhấn nhá cho bản sắc ấy cho rõ nét. Thay vì tằng tằng dịch chẳng lo có một cỗ máy nào tiếm ngôi, ta giờ đây phải tự hỏi ta có thể làm gì để bản dịch của ta đáng đọc hơn hơn bản dịch của máy. Vì thật ra, nỗi sợ lớn nhất không phải là máy biến thành người đâu, nỗi sợ lớn nhất là người biến thành máy!

Hiền Trang

Nguồn: https://vanvn.vn/google-dich-va-tuong-lai-dich-thuat/

_________________
~ bài viết về Sách:

https://www.nhomcho.com/t25736-sach
LDN

LDN


Back to top Go down

View previous topic View next topic Back to top

- Similar topics

Permissions in this forum:
You cannot reply to topics in this forum