讓機(jī)器翻譯為我們工作 - 第3部分
2019-01-01 11:42:07
在我們采訪STP的機(jī)器翻譯大師Mattia Ruaro的前兩部分中,我們討論了不同類型的機(jī)器翻譯(MT),技術(shù)改變的方式,以及它如何在翻譯行業(yè)中應(yīng)用和應(yīng)該使用。
在最后一部分中,Mattia分享了他對(duì)翻譯人員如何使用MT作為工具的看法 - 以及STP如何實(shí)現(xiàn)它。
您提到編輯機(jī)器翻譯輸出是翻譯人員的一項(xiàng)技能。它與翻譯有何不同?
我說(shuō)機(jī)器翻譯后編輯與現(xiàn)在的翻譯并沒(méi)有什么不同。當(dāng)然,它與在文字處理器中從頭開(kāi)始翻譯文本完全不同,但我認(rèn)為有時(shí)人們會(huì)忘記翻譯人員經(jīng)常使用翻譯記憶庫(kù)(TM)。所以即使沒(méi)有MT,它們也不一定有空白。
與MT合作與翻譯記憶相比如何?
它有點(diǎn)相似; 實(shí)質(zhì)上,您在兩種情況下都在編輯匹配。在TM匹配的情況下,工具將建議在之前已翻譯并存儲(chǔ)在附加到項(xiàng)目的翻譯記憶文件中的類似句子的翻譯。
例如,譯者可能有95%的匹配,其中只有標(biāo)點(diǎn)符號(hào)與他們正在查看的句子的標(biāo)點(diǎn)符號(hào)不同 - 或者可能只有一個(gè)詞是不同的。翻譯已經(jīng)習(xí)慣于編輯TM比賽; MT匹配通常不太準(zhǔn)確,但它是一個(gè)起點(diǎn)。
后期編輯過(guò)程與翻譯過(guò)程有何不同?翻譯在開(kāi)始之前需要知道什么?
最大的問(wèn)題,特別是對(duì)于沒(méi)有經(jīng)驗(yàn)的編輯來(lái)說(shuō),要記住MT輸出是機(jī)器的工作,而不是人的工作。您無(wú)法信任機(jī)器,就像您可以信任來(lái)自前一個(gè)翻譯器的翻譯記憶庫(kù)匹配一樣。
這似乎是一個(gè)相當(dāng)直接的區(qū)別 - 線索在名稱中。但許多人努力做出這種區(qū)分。
另一件事是培訓(xùn)量,因?yàn)楹苌儆信嘤?xùn)和資源可用。這就是我們?yōu)樽杂陕殬I(yè)者錄制網(wǎng)絡(luò)研討會(huì)的原因,我們所有的內(nèi)部翻譯也都接受了培訓(xùn)。我們不能給人們MT輸出,并期望他們只是處理它。
機(jī)器翻譯后編輯(MTPE)并不像人們想象的那樣直觀:培訓(xùn),經(jīng)驗(yàn)和知識(shí)是必要的。嘗試?yán)斫鈾C(jī)器產(chǎn)生輸出的原因真的很有幫助 - 但這需要了解技術(shù)。
從我的角度來(lái)看,從翻譯人員獲得非常具體的反饋非常有幫助,因?yàn)榕嘤?xùn)引擎需要精確。
您可以而且應(yīng)該能夠影響發(fā)動(dòng)機(jī)質(zhì)量 - 您可以訓(xùn)練發(fā)動(dòng)機(jī)以及翻譯器。如果你“把自己放在機(jī)器的鞋子里”,事情就會(huì)開(kāi)始發(fā)生。
STP已通過(guò)MTPE的ISO 18587標(biāo)準(zhǔn)認(rèn)證。為什么是這樣?
它顯示了我們作為一家公司學(xué)習(xí),理解和使用這種技術(shù)所付出的努力。這不僅僅是技術(shù)團(tuán)隊(duì)的情況 - 我們的制作團(tuán)隊(duì)也投入了大量的工作。
堅(jiān)持這個(gè)標(biāo)準(zhǔn)是我們?cè)诳紤]每個(gè)人的最大利益時(shí)所做的事情; 我們正努力為這個(gè)行業(yè)做出積極的貢獻(xiàn)。
該標(biāo)準(zhǔn)基本上是一套指導(dǎo)原則 - 我將其描述為最佳實(shí)踐的集合?;旧希麄兲岣吡诵袠I(yè)中每個(gè)人的標(biāo)準(zhǔn)。關(guān)注這些標(biāo)準(zhǔn)的公司可以促進(jìn)這些標(biāo)準(zhǔn),并對(duì)抗MT技術(shù)的濫用。
你認(rèn)為行業(yè)中有很多故意濫用MT嗎?
當(dāng)然有些。例如,有些公司試圖將原始MT輸出作為翻譯傳遞出去,并將其作為常規(guī)修訂項(xiàng)目發(fā)送給供應(yīng)商。但這些機(jī)構(gòu)知道他們?cè)谧鍪裁?- 而且修改者可以在一英里外發(fā)現(xiàn)這種事情。
有些公司缺乏他們正在使用的MT信息 - 或者他們期望他們的供應(yīng)商使用。他們根本不知道MT輸出有多好,因?yàn)樗麄儧](méi)有內(nèi)部人員精通相關(guān)語(yǔ)言來(lái)檢查和提供反饋。STP只為我們可以在內(nèi)部檢查的語(yǔ)言生成輸出。這樣我們就知道它究竟是什么樣的質(zhì)量。
你會(huì)說(shuō)MTPE比沒(méi)有MT的翻譯快嗎?
有很多關(guān)于MT提高生產(chǎn)率的討論,但大多數(shù)關(guān)于這方面的研究都是在很少有人沒(méi)有嚴(yán)格的期限的情況下完成的。這些情況并沒(méi)有真正反映出翻譯在商業(yè)世界中的運(yùn)作方式。這些研究通常也會(huì)做出錯(cuò)誤的假設(shè)。
在STP,我們可以在內(nèi)部測(cè)試MT作為工具的有效性。我們有很多關(guān)于我們翻譯人員的信息,他們已經(jīng)在截止日期和壓力下工作,這使他們成為理想的考試科目。
你如何準(zhǔn)確地測(cè)量這樣的東西?
我們有基于編輯距離的數(shù)據(jù) - 最終編輯輸出與原始未編輯MT輸出的不同之處。一般來(lái)說(shuō),似乎人們使用MT比沒(méi)有人更有效率,盡管這并不一定意味著質(zhì)量很好。
STP如何衡量這一點(diǎn)?

基本上,我們正在努力追蹤生產(chǎn)力的提高。我們這樣做是通過(guò)記錄與MTPE任務(wù)相比沒(méi)有使用MT的項(xiàng)目的時(shí)間。這不是一個(gè)完美的指標(biāo),但我們需要MT上的一些硬數(shù)據(jù)以及它實(shí)際上有多大用處。
MT的差異是否反映在費(fèi)率上?
對(duì)我們來(lái)說(shuō),它真的不那么簡(jiǎn)單。在效率方面,我們希望確保我們知道我們實(shí)際獲得了什么。
我看到很多無(wú)意義的數(shù)字被拋出。例如,據(jù)稱MTPE比翻譯效率高50%。即使有節(jié)省時(shí)間的方面,用這些術(shù)語(yǔ)來(lái)說(shuō)也是不現(xiàn)實(shí)的。
生產(chǎn)力的提高也需要進(jìn)行背景化。通常還有其他方面可以減慢工作速度,例如需要閱讀和實(shí)施的特殊指令。
在STP,我們希望考慮到人們投入項(xiàng)目的總體努力。并且,在一天結(jié)束時(shí),您仍然需要完成工作 - 引擎只提供建議。
根據(jù)我們翻譯人員提供的反饋,即所謂的“高模糊”,意味著TM工具被CAT工具排名為75%或更高,幾乎總是比MT匹配更有幫助。因此,當(dāng)我們的翻譯人員使用MT時(shí),他們只會(huì)將其用于沒(méi)有“高模糊”的句子。到目前為止,這對(duì)我們來(lái)說(shuō)是一種有用的方法。
STP可能與眾不同的一點(diǎn)是,我們有超過(guò)70名內(nèi)部翻譯人員可以幫助我們開(kāi)發(fā)我們的方法。
擁有龐大的內(nèi)部翻譯團(tuán)隊(duì)如何提供幫助?
他們都是經(jīng)過(guò)培訓(xùn)后編輯MT輸出的專業(yè)人士,他們很樂(lè)意幫助我們進(jìn)一步開(kāi)發(fā)引擎。我可以理解一家規(guī)模較小的公司如何更難找到這一點(diǎn)。
在STP,我們每天都會(huì)使用少量語(yǔ)言,因此我們擔(dān)心的引擎比其他公司少。
如果人們對(duì)某些事情不滿意,我們可以嘗試改進(jìn)它 - 或者如果沒(méi)有幫助就放棄它。我們可以回到繪圖板。
您如何在實(shí)踐中與內(nèi)部團(tuán)隊(duì)合作?
我們每個(gè)目標(biāo)語(yǔ)言都有一個(gè)人,他們是我們MT開(kāi)發(fā)的首選人。到目前為止,我們已經(jīng)為所有斯堪的納維亞語(yǔ)言和英語(yǔ)提供了這個(gè)。當(dāng)我需要反饋時(shí),我與這些MT“超級(jí)用戶”或MT專家合作。
對(duì)于對(duì)流程和技術(shù)真正感興趣的翻譯人員來(lái)說(shuō),這很容易實(shí)現(xiàn)。沒(méi)有我們的翻譯團(tuán)隊(duì),這項(xiàng)技術(shù)對(duì)我們來(lái)說(shuō)真的不值得 - 他們的努力在這個(gè)過(guò)程的所有階段都至關(guān)重要。