日逼无码,亚洲AⅤ无码一区二区三区蓝牛,欧美 第3页,大香蕉淫欲网

好育寶

好育寶

IBM,哈佛開(kāi)發(fā)工具來(lái)解決AI翻譯中的黑盒問(wèn)題

admin 191 132

近年來(lái),由于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的進(jìn)步,機(jī)器翻譯有了很大的提高。然而,神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于,它們不知道內(nèi)部正在發(fā)生什么,這意味著很難解決它們的錯(cuò)誤,例如,當(dāng)它們將阿拉伯語(yǔ)的“早安”翻譯為希伯來(lái)語(yǔ)的“攻擊它們”時(shí)。

來(lái)自IBM和哈佛大學(xué)的研究人員開(kāi)發(fā)了一種新的調(diào)試工具來(lái)解決這個(gè)問(wèn)題。該工具于上周在柏林舉行的IEEE視覺(jué)分析科技大會(huì)上亮相。它允許深度學(xué)習(xí)應(yīng)用程序的創(chuàng)建者可視化AI正在將一系列單詞從一種語(yǔ)言翻譯成另一種語(yǔ)言。

IBM,哈佛開(kāi)發(fā)工具來(lái)解決AI翻譯中的黑盒問(wèn)題

這個(gè)工具名為Seq2Seq-Vis,是解釋深度神經(jīng)網(wǎng)絡(luò)決策的幾個(gè)努力之一。被廣泛稱為“黑箱問(wèn)題”的神經(jīng)網(wǎng)絡(luò)的不透明性已經(jīng)成為人工智能行業(yè)面臨的嚴(yán)峻挑戰(zhàn)之一,尤其是當(dāng)深度學(xué)習(xí)進(jìn)入更關(guān)鍵的領(lǐng)域時(shí)。

Seq2Seq-Vis專注于“序列對(duì)序列”模型,這是大多數(shù)現(xiàn)代機(jī)器翻譯系統(tǒng)使用的AI架構(gòu)?!靶蛄袑?duì)序列模型可以學(xué)習(xí)將任意長(zhǎng)度的輸入序列轉(zhuǎn)換為任意長(zhǎng)度的輸出序列,”IBM研究所的科學(xué)家Hendrik Strobelt說(shuō),并補(bǔ)充說(shuō),除了語(yǔ)言翻譯,還使用了序列對(duì)序列。在其他領(lǐng)域,比如問(wèn)答,長(zhǎng)文摘要,圖片字幕?!斑@些模型在大多數(shù)任務(wù)中都非常強(qiáng)大和先進(jìn),”他說(shuō)。

簡(jiǎn)而言之,序列到序列轉(zhuǎn)換模型通過(guò)幾個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)行源字符串,將其映射到目標(biāo)語(yǔ)言并優(yōu)化輸出,以確保其語(yǔ)法和語(yǔ)義正確。神經(jīng)網(wǎng)絡(luò)的引入大大改善了結(jié)果,但也使得應(yīng)用更加復(fù)雜。

視覺(jué)機(jī)器翻譯

Stobelt將傳統(tǒng)語(yǔ)言翻譯軟件的調(diào)試與電話簿的使用進(jìn)行了比較?!盁o(wú)論何時(shí)出現(xiàn)問(wèn)題,你都可以查看這本書(shū),找出產(chǎn)生錯(cuò)誤信息的規(guī)則,并修復(fù)這些規(guī)則,”他說(shuō)?!皢?wèn)題是,你無(wú)法為這些高度復(fù)雜的端到端培訓(xùn)網(wǎng)絡(luò)輕松創(chuàng)建這樣一本書(shū)。所以我們?cè)谒伎加惺裁纯梢蕴娲@樣的東西。這基本上促進(jìn)了我們Seq2Seq-Vis的目標(biāo)?!?/p>

Stobelt向我們展示了該工具如何在其演示網(wǎng)站上工作,該網(wǎng)站有一個(gè)德語(yǔ)到英語(yǔ)翻譯錯(cuò)誤的例子。那句“diel?你說(shuō),這是什么意思?endunkelwird .當(dāng)街道變暗時(shí),最長(zhǎng)的旅程就開(kāi)始了?!钡斯ぶ悄苣P鸵呀?jīng)將其轉(zhuǎn)化為“當(dāng)它走到街上時(shí),最長(zhǎng)的旅程才開(kāi)始?!?/p>

Seq2Seq-vis創(chuàng)建了序列間翻譯不同階段的可視化表示。這使用戶能夠檢查模型的決策過(guò)程,并找出錯(cuò)誤發(fā)生在哪里。

Seq2Seq-Vis還展示了輸入和輸出句子中的每個(gè)單詞如何映射到AI模型的神經(jīng)網(wǎng)絡(luò)中的訓(xùn)練示例?!敖忉屩凶顝?fù)雜的部分是如何將決策與訓(xùn)練實(shí)例聯(lián)系起來(lái),”斯托貝爾特說(shuō)?!坝?xùn)練數(shù)據(jù)描述了模型的世界。與訓(xùn)練數(shù)據(jù)相比,這個(gè)模型更了解這個(gè)世界。因此,在調(diào)試模型時(shí)檢查訓(xùn)練數(shù)據(jù)是有意義的?!?/p>

例如,通過(guò)使用可視化工具,用戶可以確定錯(cuò)誤是否是由于給編碼器和解碼器(對(duì)源語(yǔ)言和目標(biāo)語(yǔ)言中的句子進(jìn)行分類的神經(jīng)網(wǎng)絡(luò))的錯(cuò)誤訓(xùn)練示例;注意模型中錯(cuò)誤的配置,即連接編碼器和解碼器網(wǎng)絡(luò)的元件;或者是“光束搜索”中的一個(gè)問(wèn)題,也就是提高翻譯模型輸出的AI模型。

將序列修正為序列模型

Seq2Seq-Vis并不是唯一一個(gè)試圖解釋人工智能決策的項(xiàng)目。解決黑盒問(wèn)題對(duì)人工智能行業(yè)越來(lái)越重要,并吸引了許多學(xué)者。機(jī)構(gòu),大型技術(shù)公司和國(guó)防部。機(jī)構(gòu) DARPA .IBM的研究人員最近也提出了一個(gè)單獨(dú)的計(jì)劃,使用事實(shí)表來(lái)提高人工智能的透明度。

Seq2Seq-Vis需要訪問(wèn)關(guān)于它正在調(diào)試的AI模型的訓(xùn)練數(shù)據(jù)和其他內(nèi)部細(xì)節(jié)。相比之下,其他一些可解釋的人工智能方法只需要訪問(wèn)神經(jīng)網(wǎng)絡(luò)的輸出來(lái)解釋它們的決定。

然而,盡管大多數(shù)其他方法只專注于解釋AI決策,但Seq2Seq-Vis允許用戶對(duì)他們的模型進(jìn)行修正?!拔覀兛梢噪p管齊下。我們可以可視化,但我們也可以改變底層后端,”斯托貝爾特說(shuō)。這就是Stobelt所說(shuō)的“假設(shè)檢驗(yàn)”。

例如,用戶可以選擇并糾正輸出序列中的單詞,或者他們可以重新配置注意力模型映射輸入和輸出位置的方式。

但是,使用Seq2Seq-Vis并不適合翻譯應(yīng)用程序的最終用戶。它需要關(guān)于序列到序列模型如何工作的一般知識(shí)。這當(dāng)然有意義,因?yàn)檎鏢tobelt解釋的那樣,該工具針對(duì)的是AI模型的架構(gòu)師和培訓(xùn)師。

那么誰(shuí)對(duì)Seq2Seq-Vis感興趣呢?“我們目前正在討論如何在IBM內(nèi)部使用它。但是源代碼是開(kāi)源的,所以可以想象很多。公司每個(gè)人都想加入,”斯托貝爾特說(shuō)。