無(wú)聲的聲音——滅絕的語(yǔ)言消失在巴西博物館的大火中
九月的國(guó)家地獄博物館展示了物理遺跡很容易消失。這個(gè)著名博物館中的2000萬(wàn)件文物不僅包括昆蟲(chóng)和化石,還包括土著人數(shù)百年來(lái)收集的衣服、工具和文件。對(duì)于人類學(xué)家、語(yǔ)言學(xué)家和音樂(lè)家來(lái)說(shuō),它還包含對(duì)話、儀式和歌曲的錄音,這些在任何其他收藏中都不會(huì)重復(fù):描繪在百年蠟燭上的采訪;1912年在留聲機(jī)上拍攝的土著音樂(lè);20世紀(jì)60年代以來(lái)田野人類學(xué)家記錄的電影、卷軸、磁帶和錄音帶。雖然已經(jīng)做了一些努力,但大多數(shù)語(yǔ)言收藏還沒(méi)有數(shù)字化,現(xiàn)在已經(jīng)永遠(yuǎn)丟失了。
毫不奇怪,作為對(duì)火災(zāi)的回應(yīng),《連線》雜志呼吁將世界檔案數(shù)字化。但是數(shù)字檔案館的可持續(xù)性是什么?博物館通常沒(méi)有足夠的資金來(lái)做所有他們應(yīng)該或想做的事情,包括將所有藏品數(shù)字化。國(guó)家博物館每年的維護(hù)預(yù)算是12.8萬(wàn)美元——從2014年開(kāi)始,實(shí)際資金的收入甚至沒(méi)有那么多。截至今年9月,撥款只有13,000美元。在這種情況下,數(shù)字文件的安全性如何?
世界上一半的語(yǔ)言多樣性已經(jīng)消失,因?yàn)槲覀儸F(xiàn)在已經(jīng)從估計(jì)的峰值15-20,000種語(yǔ)言減少到大約7,000種語(yǔ)言,專家預(yù)測(cè),剩下的一半將在本世紀(jì)末消亡。因此,保存的問(wèn)題和我們一樣離我們很近。我們?nèi)绾尾蹲胶捅A粜畔r(shí)代的文化和語(yǔ)言記錄?
語(yǔ)言學(xué)家勞拉·麥克弗森(Laura McPherson)說(shuō):“盡管口頭多樣性肯定會(huì)繼續(xù)下降,但通過(guò)記錄和存檔,這種非物質(zhì)文化遺產(chǎn)的記錄將永遠(yuǎn)保留。文件越全面——越超出語(yǔ)言使用的范圍,包括文化活動(dòng)、民間傳說(shuō)、土著分類、音樂(lè)等等——我們就可以用更豐富的記錄和更好的畫(huà)面來(lái)描述這些珍貴的人類天賦?!?/p>
如今,數(shù)字記錄激增,尤其是智能手機(jī)上的錄像機(jī)和社交媒體上的視頻記錄。YouTube會(huì)成為未來(lái)人類學(xué)家、語(yǔ)言學(xué)家、音樂(lè)家的重要基礎(chǔ)嗎?YouTube是谷歌搜索中使用最廣泛的應(yīng)用,比Gmail更受歡迎。該網(wǎng)站擁有13億資產(chǎn),每秒上傳300小時(shí)的視頻,擁有15億活躍用戶。不幸的是,網(wǎng)站不能讓用戶基于結(jié)構(gòu)化內(nèi)容進(jìn)行過(guò)濾或搜索,而是依賴于主題標(biāo)簽。上傳內(nèi)容的用戶可以選擇識(shí)別視頻的語(yǔ)言,但前提是用戶需要時(shí)間,并且該語(yǔ)言恰好是列表中的190種語(yǔ)言之一。另外,語(yǔ)言元數(shù)據(jù)只適用于算法,不適用于研究人員。
目前,只有當(dāng)視頻的標(biāo)題或描述恰好包含該詞時(shí),我們才能搜索到晦澀語(yǔ)言的名稱。例如,對(duì)Nyanja的搜索顯示了幾個(gè)教程和一個(gè)口語(yǔ)用法的例子,語(yǔ)言學(xué)家或文化歷史學(xué)家在將來(lái)會(huì)非常欣賞。然而,搜索帶有主題標(biāo)簽的內(nèi)容的用戶可能找不到這個(gè)視頻,因?yàn)樗麄兛赡軙?huì)輸入Chewa、Chichewa、Chinyanja或Cinyanja或Chinyanja——其他同名的常見(jiàn)名稱。
允許用戶正確標(biāo)記內(nèi)容,作為上傳者或策展人,可以幫助識(shí)別語(yǔ)言學(xué)家、民族音樂(lè)學(xué)家和許多其他學(xué)科感興趣的內(nèi)容。然而,最終,像YouTube這樣的商業(yè)服務(wù)可能不適合永久存儲(chǔ)。谷歌和它的母親公司Alphabet不一定會(huì)永久存檔內(nèi)容,盡管他們目前的意圖是這樣。一旦上傳者的賬戶不再活躍,從長(zhǎng)遠(yuǎn)來(lái)看,很少有人(如果有的話)會(huì)說(shuō)語(yǔ)言的視頻可能會(huì)被送往數(shù)字碎紙機(jī)。雖然它也容易丟失,但為學(xué)術(shù)記錄保留的服務(wù)更安全。
瀕危語(yǔ)言檔案館(ELAR)和拉丁美洲土著語(yǔ)言檔案館(AILLA)是可以在線訪問(wèn)的數(shù)字收藏、音頻和視頻的例子。美國(guó)國(guó)家科學(xué)基金會(huì)和倫敦大學(xué)瀕危語(yǔ)言項(xiàng)目最近記錄消失語(yǔ)言的努力需要對(duì)數(shù)字資產(chǎn)進(jìn)行正式存檔,迄今為止已記錄了380種語(yǔ)言。但是即使是這些資金雄厚的機(jī)構(gòu)您可能沒(méi)有準(zhǔn)備好可用文件的大小和歸檔它們的需要。
回到巴西,亞馬遜有2000個(gè)部落。現(xiàn)在有500個(gè),講大約330種語(yǔ)言。隨著智能手機(jī)和其他設(shè)備滲透到世界上最大的森林和流域的巨大樹(shù)冠中,各種聲音、歌曲和生活實(shí)踐都會(huì)被捕捉并上傳到社交媒體。如果連一個(gè)大政府都負(fù)擔(dān)不起它的文化機(jī)構(gòu)維護(hù)費(fèi)用,那么科技行業(yè)本身能否發(fā)揮作用?我們每年都在失去我們的語(yǔ)言和文化,而且速度越來(lái)越快。當(dāng)人們通過(guò)社交媒體和旅游、YouTube、臉書(shū)、網(wǎng)飛等分享文化信息時(shí)。公司可以獲得收入。因此,在像Museu Nacional這樣的收藏中失去重要的文化藝術(shù)品,在某種意義上代表了永久的收入損失,因?yàn)檫@些文物的圖像、描述和討論永遠(yuǎn)不會(huì)發(fā)生。與慈善家合作最符合行業(yè)利益, 非政府組織和其他私人和公共倡議,以幫助組織資源,以保護(hù)和分享世界知識(shí)這樣一個(gè)著名的組織,如谷歌。
