機器翻譯(MT)不僅不是所有翻譯人員曾經(jīng)認(rèn)為的破壞行業(yè)的怪物,而是在翻譯領(lǐng)域被證明是一項令人難以置信的有益發(fā)展,它使我們的生活變得更加輕松,我們的工作也更加出色。
我無法想象,在他們的日常工作中,甚至還有一位翻譯仍然在使用任何類型的高級MT工具。和大多數(shù)翻譯事物一樣,我發(fā)現(xiàn)我的思維定期翻過機器翻譯的奧秘 - 我總是有一個以謎題為導(dǎo)向的大腦,弄清楚事情的運作方式是我的一點興趣。所以我最近對MT的工作方式進行了一些個人研究,這不僅有點引人入勝。

基于規(guī)則的翻譯
幾十年來,機器翻譯工具(當(dāng)然,我們幾乎完全用計算機工具來講)使用了所謂的“基于規(guī)則”的范例。這涉及創(chuàng)建極其復(fù)雜的規(guī)則集,試圖通過一系列語句來描述語言。翻譯記憶可能是基于規(guī)則的概念的最終表達:在源語言中使用短語,對其進行解析,然后將其與目標(biāo)語言中的短語集合進行匹配。如果比賽達到100%,請繼續(xù)并替換該短語。如果沒有,將它歸還給人類。
隨著計算機技術(shù)領(lǐng)域中速度和處理能力的驚人進步,這種基于規(guī)則的機器翻譯近年來變得非常有用,因為處理速度克服了范式的固有尷尬和低效率,這非常相似在一張紙上遞給我一個句子,然后把我放在一個圖書館并告訴我瀏覽每本書,直到找到匹配的句子,然后把那本書帶給你。是的,它有效,但它起作用的唯一原因是因為我是秘密的超人,可以在幾秒鐘而不是幾個世紀(jì)內(nèi)進行搜索。
統(tǒng)計翻譯工具
機器翻譯中的新思維是避開嚴(yán)格的規(guī)則,而是從統(tǒng)計上考慮語言。在利用翻譯記憶庫的同時,新方法在統(tǒng)計上權(quán)衡了所有可能的匹配,并選擇最可能正確的解決方案。這允許系統(tǒng)在新文檔上和現(xiàn)有文檔一樣工作,因為您不需要為每個新作業(yè)重新構(gòu)建翻譯記憶庫數(shù)據(jù)庫,但可以依靠統(tǒng)計模型在現(xiàn)有文檔中找到適當(dāng)?shù)钠ヅ漤棥?shù)據(jù)庫。該系統(tǒng)基本上生成幾個可能的匹配,統(tǒng)計地對它們進行加權(quán),然后向用戶呈現(xiàn)最可能的選擇。
這是一種全新的方法,它在節(jié)省時間和翻譯準(zhǔn)確性方面帶來了巨大的收益,但它并非萬無一失,因此許多翻譯專業(yè)人士都反對這種新思維。正如機器翻譯本身一樣,我希望在幾年內(nèi)我們都將使用基于統(tǒng)計的工具。