0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“現(xiàn)代版羅塞塔石碑”,MIT&谷歌大腦用AI破解失傳的古代文字

jmiy_worldofai ? 來源:YXQ ? 2019-07-10 17:25 ? 次閱讀

漫漫塵埃下,掩藏了許多曾經(jīng)輝煌燦爛古代文明,但我們現(xiàn)在卻無法清晰地知道,這些地方究竟發(fā)生了什么。

搞懂這些歷史的最佳方式,就是找到他們的文字記載。However,記載文字的石碑可以被考古學(xué)家們挖出來,但這些古文字究竟啥意思,現(xiàn)代的人們看不懂,需要語言學(xué)家們耗盡青春來推測。

現(xiàn)在,MIT CSAIL和谷歌大腦的研究者出手了,他們用機器學(xué)習(xí)破譯了烏加里特文和線性文字B。

△ 烏加里特王宮

烏加里特文,Ugaritic,是一種楔形文字,屬于閃米特語族。從字面上來看,就知道它是一個叫做烏加里特(Ugarit)的文明使用的語言,這個文明位于當(dāng)今地中海沿岸的敘利亞,在公元前6000年前后就初現(xiàn)蹤跡,在公元前1190年前后滅亡。

△ 烏加里特文

線性文字B,Linear B,由一種人類還沒有破譯出來的線性文字A演化而來,主要存活于公元前1500年到公元前1200年的克里特島和希臘南部,是希臘語的一種古代書寫形式。

△ 線性文字B

研究者們利用同一語族內(nèi)不同語言之間的聯(lián)系,用機器學(xué)習(xí)的方法來破譯這兩種失傳的語言,這是破譯古代語言的新方法,也將對羅曼語族的語言學(xué)研究有巨大的影響和提升。

這個方法讓許多人驚嘆:

簡直是現(xiàn)代版的羅塞塔石碑!

PS,羅塞塔石碑是一塊用3種語言寫了同一個內(nèi)容的石碑,幫助語言學(xué)家們讀懂古文字。

希望能先把動物和植物的語言破譯了,可以發(fā)現(xiàn)打開新世界的大門。

人類語言總相通

這項研究的核心方法,是借助人類語言的相似性。

比如,知乎用戶@拉隊短 在介紹歐洲語言相似性的時候,舉了這么個栗子:

句子“那是六月末潮濕陰沉的一個夏日?!?/p>

英語:It was a humid, grey summer day at the end of June.

丹麥語:Det var en fugtig, gr? sommerdag i slutningen af juni.

瑞典語:Det var en fuktig, gr? sommardag i slutet av juni.

挪威語:Det var en fuktig, gr? sommerdag i slutten av juni.

冰島語:Tae var rakur, grár sumardagur í lok júní.

看,長得差不多嘛,畢竟同屬印歐語系日耳曼語族,單詞的分布位置、句子的結(jié)構(gòu)都很相似,如果你能看懂一種語言,就能大致猜測和它“血緣”關(guān)系近的另一種語言。

模型訓(xùn)練

為了破解這兩種文字,研究者們提出了一個基于字符的seq2seq模型。

模型主要包含通用字符嵌入、剩余連接、單調(diào)排列正則化幾個部分。

其中,線性文字B的字母和希臘文需要進(jìn)行對應(yīng)。

之后,借助神經(jīng)解密算法,在具有不同語言特征的多種語言中提供強大的性能。

你懂的語言,和你不懂的語言

在算法模型的基礎(chǔ)之下,需要的語料庫除了待破解的烏加里特文和線性文字B,還需要一些現(xiàn)在的人類能看懂的語言。

研究團(tuán)隊選擇了羅曼語族的數(shù)據(jù)庫,包含意大利語、西班牙語和葡萄牙語三種語言的同源語音轉(zhuǎn)錄,需要對它們進(jìn)行同源檢測。

因此,數(shù)據(jù)集就用到上面這些,Symbols指的是語言中的字符,Token則是語言學(xué)中類似于單詞的存在。

準(zhǔn)確率

運行成果還不錯,烏加里特文在無噪聲條件下優(yōu)于現(xiàn)有方法3.1%,在有噪聲條件下優(yōu)于現(xiàn)在的貝葉斯方法5.5%。

而線性文字B,在無噪聲條件下準(zhǔn)確率高達(dá)84.7%,在更具挑戰(zhàn)性的LinearB名稱數(shù)據(jù)集中達(dá)到67.3%的準(zhǔn)確度。

在羅曼語族同源識別任務(wù)中,西班牙語準(zhǔn)確度提升3.4%,葡萄牙語提升1.6%。

線性文字B的祖先,線性文字A還沒有被人類破譯,它被譽為考古界圣杯。

未來,在這項研究起作用的情況下,或許可以像借助羅曼語族三種語言的數(shù)據(jù)庫一樣,直接用機器借助其他已知的人類語言,實現(xiàn)暴力破解。

想破腦殼的語言學(xué)家們,可以把工作重心放到別的事情上了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104960
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23347

原文標(biāo)題:MIT&谷歌大腦用AI破解失傳的古代文字,被稱“現(xiàn)代版羅塞塔石碑”丨ACL 2019

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    科技先進(jìn)制程AI賦能中心&校企聯(lián)合實驗室落戶蘇州

    近年來,隨著全球半導(dǎo)體產(chǎn)業(yè)的高速發(fā)展和中國自主研發(fā)技術(shù)的不斷突破,國產(chǎn)先進(jìn)制程技術(shù)的自主化進(jìn)程成為了推動產(chǎn)業(yè)變革的重要課題。喆科技先進(jìn)制程AI賦能中心的啟動,以及與南京大學(xué)的深度合作,正是對這一
    的頭像 發(fā)表于 10-21 14:17 ?203次閱讀
    喆<b class='flag-5'>塔</b>科技先進(jìn)制程<b class='flag-5'>AI</b>賦能中心&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;校企聯(lián)合實驗室落戶蘇州

    智芯簽約儀式暨喆科技半導(dǎo)體AI創(chuàng)新總部啟動儀式圓滿舉辦

    科技將繼續(xù)秉持“學(xué)習(xí)、創(chuàng)新、當(dāng)責(zé)、共贏”的企業(yè)文化,加強人才培養(yǎng)與引進(jìn),建立一支專業(yè)高效的團(tuán)隊,為客戶提供最優(yōu)質(zhì)的服務(wù)和支持。同時,喆科技期待與更多合作伙伴攜手,共同探索半導(dǎo)體和工業(yè)AI領(lǐng)域的無限可能,為推動“世界光谷”半
    的頭像 發(fā)表于 09-02 11:04 ?206次閱讀
    喆<b class='flag-5'>塔</b>智芯簽約儀式暨喆<b class='flag-5'>塔</b>科技半導(dǎo)體<b class='flag-5'>AI</b>創(chuàng)新總部啟動儀式圓滿舉辦

    pcb板樹脂孔和油墨孔的區(qū)別?

    PCB板樹脂孔和油墨孔的區(qū)別主要體現(xiàn)在以下幾個方面: 1. 飽滿度與質(zhì)量 樹脂孔:樹脂孔工藝通過使用環(huán)氧樹脂填平過孔,并在表面進(jìn)行磨平和鍍銅處理,以確??變?nèi)填充飽滿。這種工藝解
    的頭像 發(fā)表于 08-30 17:13 ?883次閱讀

    Character.AI創(chuàng)始人加入谷歌,被買斷的股票估值25億美元

    根據(jù)彭博社于8月3日的最新報道顯示,Character.AI人工智能獨角獸公司的創(chuàng)始人和核心研發(fā)人員諾姆·沙澤爾先生(Noam Shazeer)、丹尼爾·德·弗雷斯先生(Daniel De Freitas)及所在科研團(tuán)隊的部分成員,已于近日正式加入
    的頭像 發(fā)表于 08-03 16:55 ?2352次閱讀

    德與施瓦茨加入AI-RAN聯(lián)盟,共同推進(jìn)無線通信創(chuàng)新發(fā)展

    在無線通信技術(shù)飛速發(fā)展的今天,德與施瓦茨(以下簡稱“R&amp;S”)再次憑借其卓越的技術(shù)實力,成為最新成立的AI-RAN聯(lián)盟的新成員。作為無線測試領(lǐng)域的全球領(lǐng)導(dǎo)者,R&amp;S以
    的頭像 發(fā)表于 06-27 17:22 ?449次閱讀

    智譜AI推出“AI”,全模型矩陣降價

    在智譜AI Open Day活動上,科技巨頭智譜AI宣布了重要進(jìn)展。備受矚目的羅永浩AI智能體——“AI”正式入駐智譜清言App智能體中
    的頭像 發(fā)表于 06-06 09:38 ?488次閱讀

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗

    榮耀于5月22日宣布,將在新款智能手機上集成谷歌AI功能,實現(xiàn)生成式AI體驗。此外,新機還將得到谷歌云服務(wù)的支持。
    的頭像 發(fā)表于 05-23 08:51 ?433次閱讀

    谷歌發(fā)布多模態(tài)AI新品,加劇AI巨頭競爭

    在全球AI競技場上,谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日,谷歌在I/O開發(fā)者大會上掀起了一股新的技術(shù)浪潮,發(fā)布了多款全新升級的多模態(tài)AI產(chǎn)品。
    的頭像 發(fā)表于 05-16 09:28 ?409次閱讀

    印度電子開始出口封裝芯片

    印度電子近日宣布,其已在班加爾試驗線上成功封裝芯片并開始出口,這一重要進(jìn)展標(biāo)志著在半導(dǎo)體行業(yè)的雄心壯志邁出了堅實步伐。公司計劃在未
    的頭像 發(fā)表于 05-13 10:31 ?582次閱讀

    德與施瓦茨推出新型R&amp;amp;S NPA系列緊湊型功率分析儀

    德與施瓦茨(以下簡稱“R&amp;S”)新推出的功率分析儀系列有三種型號,可滿足測量直流和交流源的電壓、電流、功率和總諧波失真的所有要求。
    的頭像 發(fā)表于 04-25 14:03 ?426次閱讀

    谷歌整合安卓系統(tǒng)與Pixel硬件團(tuán)隊,奧斯特引領(lǐng)新&amp;quot;Platfo&amp;quot;

    Osterloh曾主管谷歌硬件部門,涵蓋Pixel、Fitbit以及Nest等各種產(chǎn)品的研發(fā)和戰(zhàn)略規(guī)劃。他對The Verge表示:“唯有結(jié)合硬件、軟件和AI團(tuán)隊,方能為用戶提供突破性AI體驗。
    的頭像 發(fā)表于 04-19 10:16 ?455次閱讀

    谷歌模型合成工具怎么

    谷歌模型合成工具主要是指Dreamfusion,這是Google的大型AI圖像模型Imagen與NeRF的3D功能相結(jié)合的一種技術(shù)。Dreamfusion是Dream Fields的演變,Dream Fields是谷歌于2021
    的頭像 發(fā)表于 02-29 17:33 ?732次閱讀

    谷歌AI大模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌AI領(lǐng)域的領(lǐng)先地位,還為其在全球范圍內(nèi)的競爭力增添了新
    的頭像 發(fā)表于 02-28 18:12 ?1065次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))5.FPGA的AI加速源代碼

    信號,就像AI的心跳一樣 input wire clk, // 復(fù)位信號,就像AI的“重啟”按鈕 input wire reset, // 矩陣A,就像AI的“大腦”的一部分
    發(fā)表于 02-12 16:18

    集團(tuán)宣布在印度古吉拉特邦投資建設(shè)半導(dǎo)體晶圓廠

    集團(tuán)(Tata Group)主席納蘭詹·錢德拉卡蘭在周三的一個投資峰會上表示,針對Tata集團(tuán)在古吉拉特邦建立新的半導(dǎo)體晶圓制造廠的計劃即將對外公布。
    的頭像 發(fā)表于 01-13 11:30 ?467次閱讀
    <b class='flag-5'>塔</b><b class='flag-5'>塔</b>集團(tuán)宣布在印度古吉拉特邦投資建設(shè)半導(dǎo)體晶圓廠