7月5日消息,阿里達(dá)摩院宣布開源新一代人機(jī)對(duì)話模型ESIM。該算法模型提出兩年多,已被200多篇論文引用,更曾在國際頂級(jí)對(duì)話系統(tǒng)評(píng)測(cè)大賽(DSTC7)上獲得雙料冠軍,將人機(jī)對(duì)話準(zhǔn)確率的紀(jì)錄提升至94.1%。
ESIM模型還被用來評(píng)測(cè)一些新提出的數(shù)據(jù)集,比如來自紐約大學(xué)的MultiNLI數(shù)據(jù)集、最近大熱的來自華盛頓大學(xué)的SWAG數(shù)據(jù)集、NAACL19 Best Resource Paper常識(shí)知識(shí)QA數(shù)據(jù)集CommonsenseQA等等。
據(jù)介紹,比起業(yè)界使用最為廣泛的LSTM模型,ESIM人機(jī)對(duì)話回復(fù)模型回復(fù)準(zhǔn)確率更高。采用全新ESIM模型的人機(jī)對(duì)話回復(fù)模型,比LSTM模型回復(fù)準(zhǔn)確率提升25%(數(shù)據(jù)來自ICASSP2019論文中Ubuntu測(cè)試集的數(shù)據(jù))。
陳謙參加第七屆對(duì)話系統(tǒng)技術(shù)挑戰(zhàn)賽
ESIM模型最初由達(dá)摩院語音實(shí)驗(yàn)室內(nèi)的90后科學(xué)家陳謙(花名潭清)研發(fā),他博士畢業(yè)于中科大,是達(dá)摩院中最年輕的科學(xué)家之一,也是2018屆的阿里星(阿里星是專門針對(duì)高校頂尖人才的一個(gè)培養(yǎng)計(jì)劃,從應(yīng)屆畢業(yè)生中經(jīng)過層層篩選,由技術(shù)帶頭人擔(dān)任主管,進(jìn)行重點(diǎn)培養(yǎng),每年的阿里星平均只有20人不到)。
在去年DSTC 7對(duì)話系統(tǒng)評(píng)測(cè)大賽上,ESIM在NOESIS賽道中從麻省理工學(xué)院、約翰霍普金斯大學(xué)、IBM研究院等近20支參賽隊(duì)伍中拿下該賽道兩項(xiàng)比賽的冠軍。NOESIS賽道考察AI的人機(jī)對(duì)話能力,要求AI根據(jù)給定的多輪人機(jī)對(duì)話歷史,從成百到上萬個(gè)句子中選出正確的回復(fù)。
ESIM模型的原理論文已于2017年發(fā)表在國際頂級(jí)自然語言處理會(huì)議ACL 2017,阿里巴巴此次開源的模型原理論文發(fā)表在了今年國際頂級(jí)語音會(huì)議ICASSP 2019上,在公開的標(biāo)準(zhǔn)數(shù)據(jù)集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成績(jī)。
人機(jī)對(duì)話系統(tǒng)及其背后的認(rèn)知智能,為讓機(jī)器快速準(zhǔn)確理解人類的表達(dá),ESIM給AI裝上一套“雷達(dá)”系統(tǒng),賦予它實(shí)時(shí)檢索對(duì)話歷史、自動(dòng)去除干擾信息的能力,使它能夠給出人類期待的回復(fù)。
目前,這一模型已在基于ESIM模型研發(fā)的智能語音點(diǎn)餐機(jī)、地鐵語音售票機(jī)等應(yīng)用中落地,還可能將給智能客服、導(dǎo)航軟件、智能音箱等應(yīng)用場(chǎng)景帶去改變。
-
AI
+關(guān)注
關(guān)注
87文章
29858瀏覽量
268152 -
阿里
+關(guān)注
關(guān)注
6文章
433瀏覽量
32793
原文標(biāo)題:阿里90后科學(xué)家研發(fā),達(dá)摩院開源新一代AI算法模型
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論