當前位置:首頁 > 新聞中心 > 媒體掃描

媒體掃描

【中國科學報】機器能否扛起翻譯大旗

  • 發表日期:2021-03-26 【 【打印】【關閉】
  •   將英語逐出中學必修課的話題余音未了,谷歌翻譯就“翻車”了。

      近日,谷歌翻譯對一份英文藥物說明譯出:“您可以根據疼痛程度使用盡可能多的反坦克導彈”的句子。有研究者發布了谷歌翻譯在急診指導中應用效果的評估報告。結果顯示,對于不同語言,谷歌翻譯的準確率存在差距,最高可達到94%,而最低只有55%。

      機器,能否扛起翻譯的大旗?

      機器翻譯的本質 

      “對機器翻譯來說,即使不是醫藥等專業領域,也有可能出現類似的錯誤,這是機器翻譯的本質決定的。”中科院自動化所模式識別國家重點實驗室研究員張家俊對《中國科學報》說。

      時至今日,機器翻譯已走過基于手工書寫翻譯規則的翻譯技術(RBMT),通過統計機器翻譯技術(SMT),和基于神經網絡的機器翻譯技術(NMT)三代。不管谷歌還是微軟,目前提供在線翻譯的公司都利用深度學習模型,從數以億計的,人類翻譯過的數據中,學習一種語言到另一種語言句子的自動轉換。

      “這本質上是基于概率統計的映射,翻譯模型并沒有正真理解語言,無法感知生成譯文的質量,因此會產生一些對人類來說非常低級的錯誤而不自知。”張家俊說,“由于模型是數據驅動的,所以數據的規模、領域和質量直接決定了最終翻譯的效果。”

      科大訊飛研究院副院長劉俊華同樣認為,當前機器翻譯主要通過基于神經網絡的端到端序列建模和大規模雙語平行數據訓練,實現源語言到目標語言的轉換。因此,“訓練數據的覆蓋度和質量對機器翻譯系統性能有著決定性的影響”。

      “當機器翻譯模型在訓練過程中,沒有學習過相應的詞語或句子時,就很難保證翻譯準確,這可能是導致谷歌翻譯出現莫名其妙錯誤的主要原因。”劉俊華告訴《中國科學報》,“另一個原因是語言本身的豐富性和變化性所致。比如語言中的雙關、歧義等,也導致機器翻譯很難完全避免錯誤。”

      劉俊華認為,對這類問題,目前比較有效的方法是不斷地積累專業領域的訓練數據、提升機器翻譯算法的建模能力以及對專業術語次進行干預解決。

      差距為啥這么大 

      谷歌翻譯的模型基于新聞為主的全領域數據訓練而成,沒有針對醫藥領域進行專門處理,所以翻譯系統對新聞和日常用語等總體翻譯得比較好,而在一些專業領域表現就不夠理想。

      “相對于新聞等通用領域,醫藥、學術領域中人類翻譯的數據沒那么多。更重要的是,大部分人類翻譯的數據要么沒有電子版,要么沒有共享。”張家俊說,“數據量少導致機器無法很好地學習到兩種語言序列間的映射關系。另外一個難點在于專業領域里術語特別多,而術語通常采用約定俗成的固定翻譯,這對于目前基于概率統計的模型來說是個非常棘手的問題。目前學術界正關注這個問題,但有效的解決辦法不多。”

      “專業領域的翻譯要求更精準,而且有特定的術語或語言表達方式,機器翻譯很難遵從這樣的約定。”劉俊華補充說,“專業領域訓練數據稀缺,還會不斷出現新的詞語(如新型冠狀病毒肺炎)等。同時,術語往往存在一詞多義現象(如doctor在醫學領域翻譯成醫生的概率要大于博士),這導致機器翻譯難度加大。”

      機器翻譯準確率與用于模型訓練的數據量密切相關。由于不同語言之間,模型訓練的數據量存在很大的差距,如英語、西班牙語、漢語等聯合國官方語言,使用人口多,現有用于機器翻譯模型訓練的平行數據也非常多,機器翻譯準確率整體會更好一些。而對于亞美尼亞語、波斯語等“小語種”來說,可用于訓練的數據量較少,翻譯準確率自然會偏低一些。

      劉俊華說:“不同語言本身的特點和難度,不同語種間的關聯度也導致翻譯準確率出現較大差異。”

      劉俊華舉例說,如波斯語、阿拉伯語是從右往左書寫,阿拉伯語文本一般不書寫元音符號,俄語存在復雜的屬格變化等都是翻譯的難點,導致需要投入更大的精力來提升機器翻譯的準確性。

      在語種間關聯度方面,漢語與英語之間關聯度較低,翻譯難度比較大。而西班牙語吸收了大量的英語詞匯,兩者在語法上也存在較多相似點,翻譯難度相對低一些。

      “一般來說,同一語系或語族內的語言之間翻譯起來難度低一些,準確率也會更高。”劉俊華說。

      機器難以替代人類 

      在剛閉幕的兩會上,全國政協委員許進改革義務教育階段,英語必修課地位的提案曾引起熱議。其理由是英語占課時多,成果應用率低,在人工智能時代,機器翻譯能解決日常應用中的問題。

      在日常交流時,機器翻譯的表現的確可圈可點。

      記者用兩款常用軟件翻譯:“研表究明,漢字序順并不定一影閱響讀。”這樣故意顛倒語序的句子。翻譯軟件居然和人一樣避開了干擾,“聰明”地識別出句意并正確地翻譯出來。

      專家認為,由于訓練數據量越來越多、模型能力越來越強、算力越來越強,機器翻譯的效果確實越來越好,越來越流暢。

      “對于語序,人類在閱讀時是有預期的,如果看到的字符串與預期的很像可能就不會覺察到。如果翻譯模型在海量文本上學習過這樣的情況,就能避開干擾,識別詞語間的正確順序。”張家俊說。

      盡管如此,受訪專家也表示機器翻譯依然任重道遠。

      中科院自動化研究所研究員宗成慶認為,翻譯中口語、書面語和專業領域各有特點,口語有語氣、表情、重音、語速、口音(方言)、噪音等機器翻譯的難點;書面語有詞匯、成語、人名,句子結構復雜等不確定因素。因此進行專業領域的翻譯更要“有目標地,根據用戶需求個性化定制”。

      “機器翻譯不可能完全替代人,尤其在需要中高級翻譯的情況下。”宗成慶告訴《中國科學報》,“機器翻譯的工具屬性更強,人機應該是互助關系,在一些簡單場景,不太重要的場合,機器翻譯可以快速處理,幫助人們提高效率。但對翻譯質量要求高的地方,如文學作品,重要國際會議等場合,還需要人工翻譯。”

      宗成慶認為,中國在機器翻譯應用系統開發方面,能夠跟跑甚至在某些語言方面領跑國際,“但原創性的理論方法尚待提高”。這其中原因很多,比如數據收集規模小、公共基礎資源缺乏等。

      “目前有80多種語言與漢語之間的翻譯找不到對照資源。一些小語種(如達利語)語言學家太少,做翻譯系統時,能評價的人都沒有。”宗成慶說,“還有些小語種因為就業困難,面臨后繼無人了的窘境。呼吁國家作為儲備力量,加大這方面人才的培養力度。”

     

    原文鏈接:http://news.sciencenet.cn/htmlnews/2021/3/454879.shtm

    彩神-入口