日逼无码,亚洲AⅤ无码一区二区三区蓝牛,欧美 第3页,大香蕉淫欲网

好育寶

好育寶

「行業(yè)趨勢(shì)」機(jī)器翻譯能為您提供多少幫助?

admin 184 34

云翻譯平臺(tái)的一個(gè)優(yōu)勢(shì)是數(shù)據(jù)集中。這意味著對(duì)一些語言行業(yè)趨勢(shì)的鳥瞰,例如機(jī)器翻譯(MT)的使用和有效性。目前翻譯工具中的“大數(shù)據(jù)”才剛剛開始出現(xiàn),開發(fā)者還在學(xué)習(xí)如何使用。我相信在未來,所有的云工具都會(huì)根據(jù)用戶統(tǒng)計(jì)數(shù)據(jù)來開發(fā)洞察和通知,類似于自由市場Upwork如何識(shí)別特定領(lǐng)域前10%的自由職業(yè)者。然而,我們已經(jīng)能做的是找到有用的趨勢(shì),證實(shí)假設(shè),摧毀神話。

作為一名研究人員,當(dāng)我們?cè)诮衲暝缧r(shí)候?qū)?shù)據(jù)工具引入Memsource時(shí),我非常高興。以下是我們從這一系列行業(yè)數(shù)據(jù)中收集到的一些驚人信息。

MT水平:只有5-20%的MT產(chǎn)量“可以使用”

對(duì)于第一項(xiàng)研究,我和我的同事們決定看看機(jī)器翻譯(MT)對(duì)專業(yè)翻譯有多大幫助。行業(yè)研究機(jī)構(gòu)一項(xiàng)調(diào)查顯示,高達(dá)30%的翻譯公司用MT這是可以理解的,因?yàn)橄⒍惽袄麧櫬视卸嗟停趺词∶恳环皱X。公司盈利能力的影響。同時(shí),在任何一個(gè)翻譯對(duì)話論壇上,機(jī)器的翻譯都是那么熱情,竟然把鍵盤都融化了。

我查看了收集的數(shù)據(jù),看是否能為任何一方的說法提供依據(jù)。

分析結(jié)果表明,一般MT引擎的建議中,只有5-20%的建議足夠好,可以不加任何改動(dòng)地使用。編輯后,高達(dá)40%的建議是可以的,對(duì)于80%的細(xì)分市場,MT可以提供自動(dòng)完成的數(shù)據(jù)。

上圖(點(diǎn)擊放大圖片)中,匹配號(hào)表示翻譯與MT引擎建議的相似度:

匹配100:與MT建議同款的專業(yè)人工翻譯。

比賽85-95: MT建議要足夠近才能剪輯。

匹配50-75: mt對(duì)于單個(gè)單詞的自動(dòng)完成非常有用,但是對(duì)于整段就不太有用了。

匹配為0表示片段與人類翻譯的相關(guān)性為0-49。

請(qǐng)注意:您只能跟蹤用戶首先啟用機(jī)器翻譯的項(xiàng)目,然后執(zhí)行后期編輯分析。這意味著這里的樣本量大約是3800萬字。

法語、英語、西班牙語和葡萄牙語的機(jī)器翻譯更好。

結(jié)果顯示,法國、葡萄牙、西班牙和英國的MT發(fā)動(dòng)機(jī)具有最高的潛在MT杠桿率。英轉(zhuǎn)法尤為突出,超過20%的譯文完全匹配MT的建議,其中近90%的譯文至少與MT有一定的連貫性。

相比之下,俄羅斯、波蘭、韓國的杠桿率要低得多,在40%以下,甚至20%,模糊匹配正好是5%。

這種差異可能是由于語言的形態(tài)類型。法語、葡萄牙語、西班牙語和英語是分析性語言,這意味著它們依靠詞序和助詞如“是”或“將”來傳達(dá)意思。另一方面,俄語、波蘭語和韓語是合成的,這意味著他們更多地使用變形。機(jī)器翻譯仍在努力處理這些細(xì)微差別。

對(duì)于32%的項(xiàng)目,機(jī)器翻譯處于“開啟”狀態(tài)

與其他CAT工具一樣,在Memsource中,用戶可以添加一個(gè)機(jī)器翻譯引擎,以便在逐段瀏覽文本時(shí)獲得快速建議。這個(gè)過程被稱為“交互式機(jī)器翻譯后期編輯”,它與“經(jīng)典”后期編輯的不同之處在于,譯者沒有義務(wù)為每一段使用機(jī)器翻譯建議。如果建議太遠(yuǎn),他們可以簡單地忽略它,從頭開始寫。

對(duì)于MT選項(xiàng),翻譯人員通常使用通用引擎,如Google Translate或Microsoft Tran Translator。公司。因此,這項(xiàng)研究首先顯示這些引擎的效果,并不代表針對(duì)特定術(shù)語和主題領(lǐng)域進(jìn)行微調(diào)的定制引擎。

「行業(yè)趨勢(shì)」機(jī)器翻譯能為您提供多少幫助?

如上所述,并不是所有人都是機(jī)器翻譯的粉絲。翻譯和語言服務(wù)公司人們認(rèn)為,它有時(shí)會(huì)影響質(zhì)量或干擾語言學(xué)家的專注和自律,而這是提供完美翻譯所必需的。Memsource中只有大約32%的項(xiàng)目啟用了MT支持。即使這個(gè)數(shù)字很高,因?yàn)椤皁n”選項(xiàng)被設(shè)置為默認(rèn)值。

大約兩年前,我們報(bào)告了48%的項(xiàng)目由MT支持。從那時(shí)起,我們系統(tǒng)的平均吞吐量從每月1億字增加到6億到8億字,而啟用MT的項(xiàng)目的份額有所下降。我預(yù)測(cè)這意味著我們的用戶群正在成為整個(gè)翻譯行業(yè)的代表。Memsource曾經(jīng)是懂技術(shù)的小眾。公司主導(dǎo)工具,今天我們的用戶來自翻譯行業(yè)的各個(gè)方面。這有助于解釋百分比的下降。

下一步是什么?

MT使用量會(huì)增加嗎?這是毫無疑問的。如今的網(wǎng)絡(luò)對(duì)話需要快節(jié)奏的翻譯??蛻粜枰斓闹苻D(zhuǎn)時(shí)間,而不是他們需要的高質(zhì)量。臉書的著名口號(hào)是“做得比完美更好”。

同時(shí),MT的精度也在不斷提高。還不是人類,但是已經(jīng)有了。所以關(guān)于啟用mt的爭論更多。