人工智能翻譯曙光在前 小語種尤為任重道遠 轉自:BBC中文
手機翻譯軟件技術越來越強,但遠遠稱不上完美,人工智能和深度學習能解決翻譯誤區嗎?
今年夏天在俄羅斯舉辦的世界杯足球賽期間,谷歌翻譯使用流量爆出一波高峰,因為從世界各地而來的球迷和俄羅斯人彼此溝通需要用到這個翻譯軟件。 谷歌的數據顯示,世界杯期間所有的翻譯詞組當中,「體育場」和「啤酒」這兩個字的使用量特別高。 在幾乎人人手裏都有一支智能手機的時代,誰還需要查找字典或外語常用語手冊,有三分之二16至34歲的人出國旅遊的時候使用手機翻譯軟件解決語言問題。 但手機翻譯軟件絶非完美,有五分之一的人出國旅遊時因為手機翻譯錯誤而導致溝通障礙或彼此誤解,尤其是非主流語言的機器翻譯技術仍未完善。 除了翻譯問題之外,電腦程式還會出現技術錯誤,有網友就發現輸入「dog」一詞18次就會出現不知所云的英語翻譯。「低級錯誤」
那麼,為什麼在現在這個超級電腦和機器深度學習的時代,翻譯還會出現一些「低級錯誤」呢? 其中一個大問題就是,同一個單字通常會有超過一個意思,同形異義字不但造成旅遊者的困擾,有時候連政府公文都會出錯。 例如,今年7月英國政府的脫歐白皮書裏面提到了「democratic exercise」(民主制度的運用),翻譯成德文就成了「demokratische Übung」,德語「Übung」一詞指的是肢體鍛煉,而非權利的行使。人類水平
為了解決類似的問題,翻譯軟件持續優化機器學習的方法,軟件會使用一些已經翻譯好的文字,還會參考上下文來選擇一個字詞最適當的翻譯。 今年早些時候,微軟公司宣佈他們的人工智能翻譯質量已經到達人類水平,他們將一組中文新聞用機器翻譯成英文,一個獨立的專家小組評估後發現AI翻譯結果和兩名專業的人類翻譯者翻譯的結果不相上下。 微軟表示,他們能做到這個突破,最重要的是他們使用了人工智能深度神經網絡的幫助,以及參考大規模的機器翻譯數據。 簡單來說,人工智能翻譯先得出一個「草稿」,這個草稿再經過不斷的完善過程,進行文本對照、比較、學習,和人類翻譯的過程非常相似。 [caption id="attachment_20174" align="aligncenter" width="624"](Visited 116 times, 1 visits today)