德國(guó)人工智能研究中心(DFKI)正在為人類語(yǔ)言項(xiàng)目提供支持,該項(xiàng)目是一項(xiàng)長(zhǎng)期和大規(guī)模的歐洲研究,開發(fā)和創(chuàng)新計(jì)劃,其宏偉的科學(xué)目標(biāo)是到2030年實(shí)現(xiàn)深度理解。
預(yù)計(jì)自然語(yǔ)言處理(NLP)的進(jìn)步將能夠解決歐洲多語(yǔ)言設(shè)置的諸多挑戰(zhàn)。因此,該項(xiàng)目將成為歐盟旗艦項(xiàng)目的一項(xiàng)活動(dòng),該項(xiàng)目是一項(xiàng)運(yùn)行了10年的科學(xué)研究計(jì)劃,總預(yù)算約為10億歐元。
根據(jù)歐盟網(wǎng)站,未來(lái)和新興(FET)旗艦項(xiàng)目匯集了大量研究機(jī)構(gòu),不能由一個(gè)委員會(huì)或單一成員國(guó)承擔(dān)。
DFKI高級(jí)研究員Georg Rehm博士正在鼓勵(lì)整個(gè)歐盟的組織提供支持信函。
“開創(chuàng)人類語(yǔ)言項(xiàng)目的這種類型和范圍 - 大規(guī)模和長(zhǎng)期 - 的想法幾年前在歐洲議會(huì)多語(yǔ)種歐洲和語(yǔ)言平等研討會(huì)上誕生,”雷姆告訴Slator。
“那時(shí)候我們剛剛發(fā)布了我們的META-NET白皮書系列的主要發(fā)現(xiàn),即21種歐洲語(yǔ)言都有數(shù)字滅絕的危險(xiǎn)。這意味著超過(guò)20種歐洲語(yǔ)言,大部分語(yǔ)言數(shù)量較少的語(yǔ)言,都不能完全在線使用。并非所有服務(wù)都可以使用這些語(yǔ)言,并且并非所有服務(wù)都能夠在內(nèi)部用這些語(yǔ)言來(lái)處理內(nèi)容,“他解釋說(shuō)。
不幸的結(jié)局將是我們所說(shuō)的“數(shù)字語(yǔ)言滅絕”
這意味著支持的語(yǔ)言遠(yuǎn)遠(yuǎn)少于語(yǔ)言多的人,如馬耳他語(yǔ),立陶宛語(yǔ)或冰島語(yǔ),這些語(yǔ)言會(huì)恢復(fù)為在線使用更大的語(yǔ)言,英語(yǔ)就是最好的例子。
“不幸的結(jié)局將是我們所說(shuō)的'數(shù)字語(yǔ)言滅絕',”他進(jìn)一步解釋說(shuō)。
未來(lái)證明我們所有的語(yǔ)言
Rehm澄清說(shuō),DFKI不僅在推動(dòng)人類語(yǔ)言項(xiàng)目,而且還有許多不同的利益相關(guān)者 - 從研究中心到大學(xué),到受影響語(yǔ)言社區(qū)的成員,翻譯人員,語(yǔ)言服務(wù)提供者以及規(guī)模較小的大公司。
“所有這些利益相關(guān)者不僅有興趣實(shí)現(xiàn)我們的關(guān)鍵科學(xué)目標(biāo),即到2030年深度自然語(yǔ)言理解,尤其是提供一個(gè)平衡的技術(shù)基礎(chǔ),以便我們可以面向未來(lái)的所有語(yǔ)言,并確保我們可以在線使用它們很多年,“他說(shuō)。
迄今為止,他表示最近流傳的歐盟DFKI項(xiàng)目支持信件的呼吁受到了前所未有的熱情。
“這真的很棒。信件一直在涌入!“他說(shuō)。
一個(gè)項(xiàng)目成為EU FET旗艦項(xiàng)目需要做什么?雷姆說(shuō),它需要政治意愿來(lái)推動(dòng)這樣一個(gè)大型項(xiàng)目。布魯塞爾的政治家和管理者需要確信,這種規(guī)模的投資對(duì)歐洲社會(huì),歐洲工業(yè)和歐洲研究來(lái)說(shuō)都是有意義的。
“根據(jù)我們于2018年2月20日提交的提案,我們正在嘗試籌備一個(gè)項(xiàng)目。這個(gè)準(zhǔn)備項(xiàng)目的目標(biāo)是與整個(gè)社區(qū)一起發(fā)展歐盟旗艦項(xiàng)目的關(guān)鍵構(gòu)件:研究路線圖,治理結(jié)構(gòu),統(tǒng)一愿景和整體設(shè)置?!八f(shuō)。
這真的很棒。信件一直在涌入!
毫無(wú)疑問(wèn),這是一個(gè)長(zhǎng)期的過(guò)程。雷姆說(shuō)DFKI的作用是協(xié)調(diào)這個(gè)準(zhǔn)備項(xiàng)目,并確保該聯(lián)盟提供一個(gè)成熟的,經(jīng)過(guò)深思熟慮的,可持續(xù)的歐盟旗艦概念,整個(gè)社會(huì)認(rèn)可并支持這一概念。
雄心勃勃的科學(xué)目標(biāo)
Rehm解釋說(shuō),利用NLP,研究人員可以識(shí)別命名實(shí)體,匯總文檔,并將用一種語(yǔ)言編寫的文本翻譯成另一種語(yǔ)言。然而,在一天結(jié)束時(shí),它仍然只是簡(jiǎn)單的處理。
“典型的NLP管道或系統(tǒng)缺乏真正的,深刻的語(yǔ)言理解。這不是一個(gè)新概念,自然語(yǔ)言理解的概念已經(jīng)存在了數(shù)十年。我們相信,我們的領(lǐng)域現(xiàn)在處于能夠成功解決下一步的地位,從簡(jiǎn)單的處理到對(duì)人類語(yǔ)言的實(shí)際理解,“他說(shuō)。
“如果我們能夠?qū)崿F(xiàn)這一突破,由此產(chǎn)生的語(yǔ)言技術(shù)將大大提高準(zhǔn)確性,覆蓋范圍,穩(wěn)健性和質(zhì)量,從而改變游戲規(guī)則。這就是我們想要實(shí)現(xiàn)的,“他強(qiáng)調(diào)說(shuō)。
如果我們能夠創(chuàng)建一個(gè)真正多語(yǔ)言的大陸,并通過(guò)尖端的語(yǔ)言技術(shù)來(lái)支持,我們最終會(huì)克服語(yǔ)言和溝通障礙。
DFKI的高級(jí)研究人員補(bǔ)充說(shuō),所有的語(yǔ)言技術(shù)都將從人類語(yǔ)言項(xiàng)目(從語(yǔ)言文字翻譯到語(yǔ)音到語(yǔ)音翻譯),從各種文本分析過(guò)程(匯總,實(shí)體識(shí)別,關(guān)系提取)到更自然的積極主動(dòng)的會(huì)話界面。
“如果我們能夠創(chuàng)建一個(gè)真正多語(yǔ)種的大陸,并通過(guò)尖端的語(yǔ)言技術(shù)來(lái)支持,我們終將克服語(yǔ)言和溝通障礙。我們還可以通過(guò)在網(wǎng)上擺脫語(yǔ)言障礙的技術(shù)幫助數(shù)字單一市場(chǎng),使在線商店能夠以多種不同的市場(chǎng)和語(yǔ)言出售他們的服務(wù)或產(chǎn)品,“他說(shuō)。
混合型融資模式
瑞姆解釋說(shuō),歐盟旗艦項(xiàng)目通常以混合模式出資。對(duì)于人類語(yǔ)言項(xiàng)目,這些組合很可能涉及歐盟委員會(huì),成員國(guó)和歐洲工業(yè),包括國(guó)家資助計(jì)劃和資金來(lái)源。
迄今為止,他表示,一些國(guó)家已經(jīng)積極參與未來(lái)的語(yǔ)言發(fā)展和建立各自語(yǔ)言的基本或尖端技術(shù)。但是,這些活動(dòng)是以分散,孤立和不協(xié)調(diào)的方式進(jìn)行的。
他說(shuō):“我認(rèn)為人類語(yǔ)言項(xiàng)目也是一個(gè)保護(hù)傘,根據(jù)這個(gè)傘可以協(xié)調(diào)這些國(guó)家活動(dòng),以識(shí)別和利用協(xié)同作用。”
編譯:語(yǔ)家上海翻譯公司
