摘要 9月28日,Google發布神經機器翻譯(GNMT:GoogleNeuralMachineTranslation)系統,該系統使用了當前最先進的訓練技術,大幅提升了機器翻譯水平,將...
9月28日,Google發布神經機器翻譯(GNMT:Google Neural Machine Translation)系統,該系統使用了當前最先進的訓練技術,大幅提升了機器翻譯水平,將翻譯誤差降低了55%-85%。十年前,Google發布了Google Translate,這項服務背后的核心算法是基于短語的機器翻譯,將輸入句子分解成詞和短語,然后對它們進行獨立翻譯,而神經機器翻譯則將輸入的句子作為一個整體翻譯,Google神經機器翻譯代表著一個重大的里程碑。
目前, Google神經機器翻譯系統已投入到了中文-英語的翻譯中。現在,移動版和網頁版的 Google Translate 的中英翻譯已完全使用神經機器翻譯(每天大約 1800 萬條翻譯)。中文到英語的翻譯是 Google Translate 所支持的超過 10000 種語言對中的一種,在未來幾個月,Google還將繼續把神經翻譯系統擴展到更多的語言上。
中國超硬材料網小編經過連夜測試,感想是:效果拔群。相比以前,錯誤率降低了一半以上,目前還有比較明顯的語法錯誤,少數專有名詞翻譯得不對。但總體看,Google已經接近解決了翻譯這個重大問題。下面為翻譯示例,可以看出除去結構問題,圖1的方言諧音失敗,圖2的諺語我覺得 Keep calm and get rich 比較好,圖3 口語化短句判斷有瑕疵,后3組的成語、詩詞和專有名詞翻譯錯誤。但整體來說進步還是十分巨大。





