多鄰國成立于2012年,是一個(gè)跨平臺(tái)的語言學(xué)習(xí)應(yīng)用程序,全球用戶高達(dá)3億。為了打造真實(shí)的人與人的學(xué)習(xí)場景,多鄰國一直在投資人工智能和機(jī)器學(xué)習(xí),以便通過自動(dòng)化使課程更具吸引力為每個(gè)人量身定制。
“我們?nèi)斯ぶ悄軕?zhàn)略的核心部分是盡可能地接近一種人與人之間的體驗(yàn)?!倍噜弴斯ぶ悄芎脱芯恐鞴蹷urr Settles在上月倫敦AI峰會(huì)的一次采訪中說。
多鄰國是一個(gè)跨平臺(tái)的應(yīng)用程序,用戶可以免費(fèi)學(xué)習(xí)語言,也可以每月支付7美元購買一項(xiàng)高級(jí)服務(wù),可以刪除廣告、提供離線訪問等。通過游戲化的模式和時(shí)間較短的課程,任何人都可以學(xué)習(xí)閱讀、聆聽和說幾十種語言。
人們學(xué)習(xí)一門新語言的理由各不相同,但無論動(dòng)機(jī)是什么,學(xué)習(xí)一門語言都需要花費(fèi)很多的時(shí)間和精力,如果學(xué)習(xí)者不全天候地沉浸在語言中,那就更是如此。人們不會(huì)為了學(xué)習(xí)一門語言換一個(gè)國家居住,而多鄰國這樣的公司,正是利用智能手機(jī)的興起和無處不在的網(wǎng)絡(luò)為用戶帶來學(xué)習(xí)經(jīng)驗(yàn),無論他們身在何處。
多鄰國已經(jīng)支持世界上許多最常見的語言,包括漢語和印地語等。本周早些時(shí)候,它還推出了推出了對(duì)阿拉伯語的支持。多鄰國目前在全球擁有約3億用戶,已籌集到1億美元的資金,估值約為7億美元,其中包括Alphabet的Capitalg和Kleiner Perkins等知名贊助商。
據(jù)市場研究公司稱,2018年全球在線語言學(xué)習(xí)市場的規(guī)模定為90億美元,到2026年可能達(dá)到200億美元以上。在此背景下,多鄰國一直在投資人工智能和機(jī)器學(xué)習(xí),以便通過自動(dòng)化使課程更具吸引力為每個(gè)人量身定制,就像是人類老師教學(xué)的方式。
數(shù)據(jù)
在卡內(nèi)基梅隆大學(xué)擔(dān)任博士后研究科學(xué)家后,Settles于2013年加入多鄰國,擔(dān)任軟件工程師,負(fù)責(zé)從前端到后端的所有事務(wù)。他說,他之所以選擇多鄰國而不是大公司,是因?yàn)樗吹搅诉@個(gè)公司的潛力。
“我的興趣集中在語言、人工智能技術(shù)和認(rèn)知科學(xué)的交叉點(diǎn)上,”Settles指出,在這三者的交叉點(diǎn)上,并沒有多少工作可以做。
Settles加入多鄰國不久之后,他和團(tuán)隊(duì)開始研究如何轉(zhuǎn)換多鄰國學(xué)習(xí)模型的構(gòu)建模塊,這些模型基于70年代的閃存卡調(diào)度算法。根據(jù)Settles的說法,利用人工智能進(jìn)行任何實(shí)際教育的研究目前相關(guān)研究很少。
多鄰國所擁有的是豐富的學(xué)習(xí)數(shù)據(jù),可用于從頭開發(fā)新的模型和算法。
“我接受這份工作的部分原因是數(shù)據(jù)量、數(shù)據(jù)類型和數(shù)據(jù)的唯一性,”Settles說。“我們一直在使用啟發(fā)式方法,我們收集有關(guān)學(xué)生正確的練習(xí)、錯(cuò)誤的地方以及他們上次在應(yīng)用程序中看到這些練習(xí)的時(shí)間的數(shù)據(jù)。既然我們?cè)诟欉@些統(tǒng)計(jì)數(shù)據(jù),我們就想‘為什么不創(chuàng)建預(yù)測(cè)模型來代替呢?”
半衰期
多鄰國一直在開發(fā)自己的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)模型,同時(shí)還結(jié)合了一些久經(jīng)考驗(yàn)的學(xué)習(xí)技術(shù),如間隔重復(fù),以優(yōu)化和個(gè)性化課程。間隔重復(fù)的理論是,間隔地重復(fù)簡短的課程比在短時(shí)間內(nèi)死記硬背相同的信息要好。還有所謂的“滯后效應(yīng)”,如果逐漸增加練習(xí)課程之間的差距,則用戶可以進(jìn)一步提高。
但是,人類個(gè)體的差異性很大,機(jī)器學(xué)習(xí)模型往往是二元的,而不是考慮到個(gè)體的細(xì)微差別。這就是多鄰國的統(tǒng)計(jì)模型——“半衰期回歸” ,它分析了數(shù)百萬語言學(xué)習(xí)者的錯(cuò)誤模式,以預(yù)測(cè)個(gè)體長期記憶中每個(gè)單詞的“半衰期”。
“當(dāng)我們投入生產(chǎn)時(shí),我們看到用戶參與率提高了12%,”Settles說。
在物理學(xué)中,半衰期概念經(jīng)常被用來描述一個(gè)量下降到初始值一半所需的時(shí)間。在語言學(xué)習(xí)中,可以用它來描述大腦中的詞匯或語法知識(shí)。例如,如果半衰期是一天,而一天都沒有練習(xí)一門新語言,將會(huì)有50%的機(jī)會(huì)忘記這堂課。
但這并不是一個(gè)精確的科學(xué),半衰期回歸就是進(jìn)入一個(gè)人的大腦,弄清楚他們知道或不知道什么,然后相應(yīng)地針對(duì)課程材料。
對(duì)于不同學(xué)習(xí)背景的人,“衰退”模式截然不同。已經(jīng)有背景的人會(huì)犯更少的錯(cuò)誤,他們犯的錯(cuò)誤類型可能會(huì)有所不同,這意味著他們不必經(jīng)常練習(xí)這些知識(shí)。
用來定位內(nèi)容的方法是很重要,但內(nèi)容本身也同樣重要。在內(nèi)容方面多鄰國也在轉(zhuǎn)向人工智能,以幫助其團(tuán)隊(duì)建立正確的課程。
“英語中有數(shù)百萬個(gè)單詞,也許有1萬個(gè)高頻詞,用什么順序教?怎么把它們串在一起?”Settles 說,“因此,我們建立了系統(tǒng),來幫助內(nèi)容創(chuàng)作者定制初級(jí)、中級(jí)和高級(jí)材料?!?/p>
另一個(gè)挑戰(zhàn)是,盡管多鄰國的用戶中只有40%的人正在學(xué)習(xí)英語,但該公司用于培訓(xùn)其AI系統(tǒng)的大部分教學(xué)數(shù)據(jù)都是針對(duì)英語開發(fā)的。因此,多鄰國不得不采用其系統(tǒng)并將其投射到其他語言上,在AI世界中稱為轉(zhuǎn)移學(xué)習(xí)。
盡管人才庫正在緩慢增長,但有充分的證據(jù)表明人AI技能短缺,許多大型科技公司一直在努力收購有前途的人工智能初創(chuàng)公司。人才緊缺是多鄰國在過去幾年中遇到的挑戰(zhàn),特別是考慮到它專注于特定的技能組合。除語言和語言學(xué)外,它正在進(jìn)行的人工智能研究跨越了一系列學(xué)科,并與心理學(xué)和學(xué)習(xí)科學(xué)交叉。
“我們希望在語言、人工智能和認(rèn)知科學(xué)的交叉點(diǎn)上有更多的人?!盨ettles說?!拔覀兊臉?biāo)準(zhǔn)也很高。在申請(qǐng)我們AI工作的人中,只有不到0.5%能夠完成這項(xiàng)任務(wù)?!?/p>
Settle補(bǔ)充說,該公司在過去18個(gè)月左右的時(shí)間里,發(fā)現(xiàn)合格人員的興趣小幅增長,其中包括來自其他科技公司和學(xué)術(shù)界的申請(qǐng)人。
人對(duì)人
遠(yuǎn)程教授語言面臨的最大挑戰(zhàn)之一是,很難創(chuàng)建一種吸引人且充滿沉浸感的體驗(yàn),以保持學(xué)習(xí)者的回歸。為了提高參與度,多鄰國在2016年推出了機(jī)器人程序,通過其應(yīng)用程序內(nèi)的自動(dòng)文本對(duì)話來幫助教授語言。
各種機(jī)器人角色被設(shè)計(jì)為對(duì)一系列可能的答案做出不同的反應(yīng),如果用戶卡住,用戶可以點(diǎn)擊“幫我回復(fù)”按鈕。理論上,機(jī)器人程序應(yīng)該越用越聰明。
但現(xiàn)在,多鄰國的機(jī)器人似乎服務(wù)似乎暫停了,但是自動(dòng)化代理取代了人類導(dǎo)師的這種學(xué)習(xí),可以將虛擬教學(xué)提升到下一個(gè)層次。會(huì)話AI助手的最新發(fā)展,如亞馬遜的Alexa和谷歌智能助手,可能為語言學(xué)習(xí)者打開一個(gè)全新的機(jī)會(huì)世界。
將虛擬現(xiàn)實(shí)(VR)的可能性投入到混合中,用戶可以通過耳機(jī)進(jìn)入虛擬教室環(huán)境,很容易想象學(xué)習(xí)新語言會(huì)變得多么有吸引力。
當(dāng)被問及多鄰國是否有可能擴(kuò)展到如此沉浸式的領(lǐng)域時(shí),除了承認(rèn)“這是可能的”。多鄰國似乎很清楚這些新興技術(shù)帶來的固有好處,并且更大沉浸的潛力可能是巨大的。
雖然多鄰國沒有透露有關(guān)智能語音助手集成或沉浸式視覺世界的任何計(jì)劃,但它已承諾在將人的元素放入自動(dòng)化學(xué)習(xí)的過程中,進(jìn)一步個(gè)性化其內(nèi)容和交付。
“如果你思考一個(gè)好老師的教學(xué)方式,他們有三種屬性,”Settles說?!耙皇撬麄兎浅A私鈨?nèi)容,二是他們有辦法進(jìn)入你的腦海,弄清楚你知道什么不知道什么。三是他們非常有吸引力,能夠找到在你所處的水平上讓你學(xué)習(xí)的方法?!?/p>
他說: “半衰期回歸是進(jìn)入用戶腦海中的一個(gè)例子,找出用戶的心理模型,并將這些材料定位到用戶?!?/p>
“那里有很多未知領(lǐng)域,”Settles補(bǔ)充道。“我認(rèn)為,我認(rèn)為,人工智能有很多機(jī)會(huì)創(chuàng)造新的、吸引人的學(xué)習(xí)體驗(yàn)。”
-
AI
+關(guān)注
關(guān)注
87文章
29882瀏覽量
268171 -
智能教育
+關(guān)注
關(guān)注
0文章
197瀏覽量
15875
原文標(biāo)題:背了單詞再也不怕忘,多鄰國的AI要逆天!
文章出處:【微信號(hào):Aiobservation,微信公眾號(hào):人工智能觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論