機器翻譯(MT)到底有多好?按照微軟的說法,很好。
本月早些時候,這項技術公司宣布已經創(chuàng)建了一個機器翻譯系統(tǒng),該系統(tǒng)在將中文翻譯成英文時已經達到了“人類同等水平”。換句話說,就是說系統(tǒng)完成了翻譯,就像人類的語言學家一樣。
微軟表示,翻譯是使用newstest2017創(chuàng)建的一組新聞文章完成的。
微軟聘請翻譯人員分析結果,并將機器翻譯系統(tǒng)的輸出與人類語言學家的輸出進行比較。在他們的博客上,微軟工程師稱贊了這一成就,稱這是他們一段時間以來的“夢想”。
然而公司指出盡管該系統(tǒng)是成功的,但機器翻譯并不是一個“已解決的問題”。值得注意的是,中文和英文都有大量關于話語的數(shù)據(jù),微軟稱新聞報道為“普通”詞匯。"
神經MT系統(tǒng)訓練的數(shù)據(jù)越多,翻譯的就越好,因為這將有助于以更準確的方式調整神經網(wǎng)絡的權重。
一大步;復雜的問題。微軟團隊使用人工智能(AI)來幫助翻譯新聞片段,并使用雙重學習、復習網(wǎng)絡和聯(lián)合訓練的方法來完成實驗。
這一成果的消息在全球范圍內得到了反映,這表明了翻譯技術的又一步。近十年來圍繞MT的討論達到了頂峰,業(yè)內人士紛紛猜測這項技術的真正潛力。
當神經機器翻譯(NMT)達到人工翻譯的熟練程度時,最大的問題之一仍然存在。微軟指出,由于工作本身的復雜性,很難衡量MT的準確性。
“機器翻譯比純粹的模式識別復雜得多,”微軟研究員周明說。公司博客上說?!叭藗兛梢杂貌煌脑~來表達完全相同的事情,但你可能無法說出哪一個更好?!?/p>語境問題
我們之前討論過關于人類和機器的爭論。至此,人類語言學家具備了批判性思考和理解詞語細微差異的能力;人類語言學家也能夠更好地應對語言進化,并提供文化差異,以反映更有效的品牌或信息。
ULG新興語言技術總監(jiān)胡安·阿隆索對微軟的聲明表示懷疑,稱這一壯舉可能被夸大了。
“雖然微軟的成就確實令人印象深刻,但‘人類平等’的理念是顯而易見的。優(yōu)秀的人工翻譯不會逐句翻譯文本;”他們關注整個文本,并利用整個背景產生足夠的翻譯,”阿隆索說。
“這是微軟的MT系統(tǒng)和其他任何MT系統(tǒng)都做不到的?!?/p>
然而,正如我們過去所述,MT不完美并不意味著它對特定的內容類型無效。

阿隆索表示,雖然微軟提到的技術,如雙重訓練和審查網(wǎng)絡都是很好的技術,但它們并沒有為類似人類的準確性鋪平道路。
他說:“盡管它們有助于獲得非常好的翻譯結果,但‘人類平等’的目標并不是迫在眉睫的?!?/p>