我們已經(jīng)進(jìn)入了一個(gè)新時(shí)代,一項(xiàng)新技術(shù)開始發(fā)揮作用:機(jī)器翻譯(MT)。眾所周知,MT系統(tǒng)可以顯著提高生產(chǎn)率,但要將這項(xiàng)技術(shù)整合到您的生產(chǎn)流程中卻是一項(xiàng)艱巨的任務(wù)。除了處理引擎構(gòu)建和優(yōu)化流程,您還必須轉(zhuǎn)變傳統(tǒng)的工作流程:
不包括質(zhì)量管理問題。
語(yǔ)言學(xué)家(譯者、編輯、評(píng)論員等)的傳統(tǒng)角色。)進(jìn)行了重新構(gòu)建和整合,以便在這一全新的創(chuàng)新工作流程中找到合適的位置。新興的角色被稱為“后期編輯”,被分配到這個(gè)角色的語(yǔ)言學(xué)家被稱為“后期編輯”。你可能想招募一些志愿語(yǔ)言學(xué)家來?yè)?dān)任這個(gè)角色,或者說服你的員工采納不同的觀點(diǎn)。然而,一些培訓(xùn)課程是必要的。
培訓(xùn)課程包括哪些內(nèi)容?
編輯后應(yīng)該會(huì)有MT系統(tǒng)動(dòng)力學(xué)的概念。關(guān)注所使用的系統(tǒng)(RBMT/SMT/混合)。對(duì)于廣泛使用的SMT系統(tǒng),他們必須知道:
該系統(tǒng)如何運(yùn)行?
翻譯模型和語(yǔ)言模型的功能*
輸入(給定數(shù)據(jù)集)和輸出(原始MT輸出)之間的關(guān)系
不同領(lǐng)域的變化
*不需要提供這個(gè)話題的詳細(xì)信息,但是觸及這個(gè)問題會(huì)對(duì)確定應(yīng)聘者的技術(shù)背景水平產(chǎn)生影響。一些候選人可能會(huì)被納入測(cè)試團(tuán)隊(duì)。
編輯后,你應(yīng)該了解影響MT輸出的因素。另一方面,在適當(dāng)?shù)挠?xùn)練期間,必須提到模糊TM系統(tǒng)和SMT系統(tǒng)之間的差異。讓我們?cè)囍胂朐撍褪裁?
MT流程不是TEP工作流的“t”,原始MT輸出也不是預(yù)期輸出“t”流程的目標(biāo)文本。
SMT引擎前期,輸出質(zhì)量取決于項(xiàng)目的動(dòng)態(tài),誤差不一樣。隨著體系的完善,同一領(lǐng)域的質(zhì)量水平變得更加統(tǒng)一和一致。
系統(tǒng)的模式映射中可能會(huì)有一些空白單詞或短語(yǔ)。(檢測(cè)這些差距是測(cè)試團(tuán)隊(duì)的主要職責(zé)之一,但在成功編輯后,有必要告知可能存在的差距。)
本課題包括兩個(gè)方面:定義要求的目標(biāo)(最終產(chǎn)品)質(zhì)量,評(píng)價(jià)和評(píng)估輸出質(zhì)量。第一個(gè)給你最終的目的地,第二個(gè)讓你知道你在哪里。
所需的質(zhì)量水平是根據(jù)項(xiàng)目要求確定的,但它主要取決于目標(biāo)受眾和目標(biāo)文本的預(yù)期用途。這似乎類似于TEP工作流程中的流程。但是,略有不同;確定目標(biāo)質(zhì)量水平時(shí),還應(yīng)考慮發(fā)動(dòng)機(jī)改進(jìn)計(jì)劃?;旧希@個(gè)參數(shù)分為兩組:可發(fā)布的和可理解的質(zhì)量。
評(píng)估和估計(jì)有點(diǎn)復(fù)雜。最具挑戰(zhàn)性的因素是標(biāo)準(zhǔn)化的衡量指標(biāo)。此外,用于評(píng)估和估計(jì)質(zhì)量水平的工具和系統(tǒng)具有一些更復(fù)雜的特征。如果你成功地建立了質(zhì)量體系,逆境將變得更容易處理。后期編輯負(fù)責(zé)理解機(jī)器翻譯質(zhì)量評(píng)估的動(dòng)態(tài),以及機(jī)器翻譯和翻譯質(zhì)量評(píng)估程序之間的差異。因此,他們應(yīng)該意識(shí)到預(yù)期的錯(cuò)誤模式。訓(xùn)練有素的員工(QE員工和編輯)使用錯(cuò)誤分類更方便。
第四個(gè)也是最后一個(gè)話題是成功的關(guān)鍵。它涵蓋了適當(dāng)?shù)姆椒ê驮瓌t,以及通常在編輯后獲得的視圖。后期編輯技術(shù)是使用為以前的主題準(zhǔn)備的材料和從上述過程獲得的數(shù)據(jù)形成的,并且為幾乎每個(gè)單獨(dú)的定制引擎單獨(dú)定義。本主題的核心規(guī)則是,后期編輯技術(shù)作為一個(gè)概念,可以與傳統(tǒng)的編輯和/或?qū)忛喖夹g(shù)明確區(qū)分開來。編輯后,您可能具有以下能力:
整體閱讀和分析源文本、原始機(jī)器翻譯輸出以及分類和/或注釋錯(cuò)誤。
如有必要,進(jìn)行更改。
將編輯后的數(shù)據(jù)視為發(fā)動(dòng)機(jī)改進(jìn)數(shù)據(jù)集的一部分,并相應(yīng)地執(zhí)行他/她的工作。
應(yīng)用為預(yù)期質(zhì)量水平定義的規(guī)則。
如主題# 3中簡(jiǎn)要描述的,測(cè)量的輸出質(zhì)量和要求的目標(biāo)質(zhì)量之間的距離可以被認(rèn)為是編輯的距離。它大致定義了編輯后的容忍度和他/她執(zhí)行工作的程度。允許我們定義技術(shù)和性能的其他標(biāo)準(zhǔn)是目標(biāo)質(zhì)量組。如果預(yù)期目標(biāo)文本具有可出版的質(zhì)量,則稱為完全后期編輯,否則稱為后期編輯。輕量級(jí)和完整的后期編輯技術(shù)可以如上簡(jiǎn)單定義,但區(qū)別并不總是那么明顯。另外,以上問題中可能包含以下/以上編輯概念。您可能希望在后期編輯培訓(xùn)課程中包含有關(guān)這些概念的更詳細(xì)信息;通過一些例子來豐富培訓(xùn)材料將是一個(gè)好主意!