數(shù)據(jù)的作用在人工智能發(fā)展道路上愈發(fā)被重視。7月27日,在廣州舉行的GMIC大會上,網(wǎng)易有道技術(shù)總監(jiān)林會杰表示目前AI+教育還在初級階段,對于這一行業(yè)而言,得數(shù)據(jù)者得先機。這家擁有國內(nèi)最大用戶量(全平臺8億用戶)的互聯(lián)網(wǎng)教育公司也首次對外集體亮相AI能力,神經(jīng)網(wǎng)絡(luò)翻譯、圖像識別、語音交互技術(shù)和自適應(yīng)學(xué)習(xí)四項AI能力聯(lián)合為教育加碼。
幾乎所有企業(yè)都想搭上AI這趟車。
這的確是大勢所趨,但比起匆忙加入浪潮,先看看手里有著怎樣的牌,才能在這戰(zhàn)場上打得更漂亮。
傳統(tǒng)企業(yè)轉(zhuǎn)型AI,占據(jù)垂直化場景優(yōu)勢;有數(shù)據(jù)的公司拿起AI武器,“殺傷力”驚人;擁有大量用戶基礎(chǔ)、以用戶為導(dǎo)向的企業(yè),更易開發(fā)出To C端產(chǎn)品。
最重要的是有技術(shù)加持,這就是時候向AI發(fā)力了。
7月27日,在廣州GMIC(全球移動互聯(lián)網(wǎng)大會)上,網(wǎng)易有道技術(shù)總監(jiān)林會杰在題為《AI+教育的進化之路》演講中表示:
目前AI+教育還在非常初級的階段,得數(shù)據(jù)者得先機,如何更好地采集數(shù)據(jù)、處理數(shù)據(jù)、從數(shù)據(jù)中學(xué)習(xí)更好地規(guī)律,是當前整個AI+教育行業(yè)的重點。
網(wǎng)易有道技術(shù)總監(jiān)林會杰
這也是網(wǎng)易有道首次對外集體亮相AI能力,翻譯、圖像識別、語音和自適應(yīng)教育四項AI能力聯(lián)合為教育加碼:
神經(jīng)網(wǎng)絡(luò)翻譯(NMT):在學(xué)習(xí)和新聞測試集中,有道NMT的中英互譯準確度均優(yōu)于同行,最好成績領(lǐng)先7個百分點。
圖像識別(OCR):擁有國內(nèi)可識別語言最多的OCR識別引擎,且能應(yīng)對多種高難度場景,平均準確率可達95%;
語音識別與合成:有道語音識別技術(shù)在一些場景上識別準確率超過98%,支持中、英、日、韓多個語言;有道語音合成引擎音色逼近真人,支持中、英、日、韓、葡等多個語言;
自適應(yīng)學(xué)習(xí):配合自研的智能學(xué)習(xí)硬件,實現(xiàn)實時采集書寫數(shù)據(jù),并且提供如學(xué)情分析、知識圖譜評估、智能推題等一系列自適應(yīng)學(xué)習(xí)輔助。
一直深耕技術(shù)的網(wǎng)易有道在AI方面的成績單逐漸浮出水面,數(shù)據(jù)和技術(shù)加速轉(zhuǎn)換成勢能。
積累全平臺8億用戶發(fā)力“AI+教育”,得數(shù)據(jù)者得先機
在人工智能產(chǎn)業(yè)落地的浪潮中,“AI+教育”更是處于風口。中國K12教育市場規(guī)模前景明朗,市場空間大。
成熟的AI+教育產(chǎn)品難以落地,根本原因是缺乏足量學(xué)習(xí)場景下的一手真實數(shù)據(jù)。
處處都是機遇,也處處都是挑戰(zhàn)。如同艾瑞咨詢在報告中指出,“AI+教育”領(lǐng)域邊際明顯,初期投入巨大,但越往后數(shù)據(jù)的反哺能力越強。
例如,在AI自適應(yīng)學(xué)習(xí)產(chǎn)品中,由數(shù)據(jù)來訓(xùn)練算法,輸出更接近真實情況的學(xué)習(xí)模型,學(xué)習(xí)系統(tǒng)進而得到增強,從而吸引更多學(xué)生使用,更多數(shù)據(jù)也會隨之產(chǎn)生,形成良性循環(huán)。
來源:艾瑞咨詢研究院
數(shù)據(jù)對于AI的作用早已不容小覷。
此前,對于深度學(xué)習(xí)發(fā)展已到瓶頸的問題,業(yè)內(nèi)也有人提出數(shù)據(jù)處理是一劑良藥。
在深度學(xué)習(xí)上,投入算法不一定能見到成效,但投入數(shù)據(jù)一定能見效,數(shù)據(jù)會推動人工智能的發(fā)展,會將人工智能帶入一個新臺階。
發(fā)展AI技術(shù)前就已積累大量數(shù)據(jù),這對一個企業(yè)來講無疑是一大優(yōu)勢。網(wǎng)易有道技術(shù)總監(jiān)林會杰在GMIC大會上表示,對于AI+教育行業(yè)而言,得數(shù)據(jù)者得先機。
AI模型的進化需要大量數(shù)據(jù)進行算法訓(xùn)練,然而線下傳統(tǒng)教育仍是現(xiàn)在的主流,用戶尚未習(xí)慣純線上交互,大量學(xué)習(xí)數(shù)據(jù)都留存在線下難以采集。
以產(chǎn)品作為數(shù)據(jù)接口,是企業(yè)做AI的先天優(yōu)勢。網(wǎng)易有道本身的背景是一家100%用戶導(dǎo)向的教育科技公司,全平臺用戶量8億+,能夠獲取更多樣化的第一手數(shù)據(jù)。
同時,針對AI+教育的進程是否太慢這一問題,林會杰提出一個比喻,AI滲透教育行業(yè)的過程好比“為行駛中車輛換輪胎”,存在數(shù)年的教育行業(yè)有一套成熟的運行邏輯,如同一輛行駛中的車輛,現(xiàn)在行業(yè)想要換上AI這一新輪胎“提速”,需要在不影響現(xiàn)有運行情況下,讓技術(shù)逐漸滲透,最終完成AI+教育的迭代。
先機已得,技術(shù)自然要跟上步伐。
NMT準確度可信賴:中英互譯BLEU值盲測中,最好成績領(lǐng)先7個百分點
先來看看有道“起家”的翻譯技術(shù)。
移動互聯(lián)網(wǎng)熱潮來襲,有道團隊“切掉”了連接計算機的那條線,上線有道詞典移動版,迎來了巨大的用戶紅利,如今在全平臺擁有8億用戶。
人工智能熱潮又一次來襲,翻譯這一王牌領(lǐng)域成為有道要絕對堅守的陣地。早在2016年,網(wǎng)易有道首席科學(xué)家段亦濤就已經(jīng)帶領(lǐng)團隊攻堅神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)(NMT)。
如今,有道神經(jīng)網(wǎng)絡(luò)翻譯已經(jīng)支持12種語言的中文互譯,10種語言的英文互譯。
在準確度方面,神經(jīng)網(wǎng)絡(luò)的翻譯水平已經(jīng)達到國際領(lǐng)先水平。在2017年周楓接受新智元采訪時,在國際通用的BLEU評測中,網(wǎng)易有道針對翻譯引擎不同的使用場景(學(xué)習(xí)、新聞、口語、用戶日志)采集不同的評測數(shù)據(jù),分別作出評測。
當時的有道翻譯準確度在學(xué)習(xí)、新聞、口語和用戶日志中就已高于其他國家引擎。
BLEU(雙語評估研究-Bilingual Evaluation Understudy)是一種用于評估自然語言之間機器翻譯的文本質(zhì)量的算法,它是與人類質(zhì)量判斷高度相關(guān)的指標之一,也是最普遍使用的自動指標。
BLEU值越高,代表翻譯準確度越高。
到2019年,在學(xué)習(xí)與新聞領(lǐng)域,無論是英譯中還是中譯英,有道的盲測集BLEU值也有了較大提升。據(jù)有道最新盲測數(shù)據(jù)顯示,在學(xué)習(xí)和新聞測試集中,有道NMT的中英互譯準確度均優(yōu)于同行,最好成績領(lǐng)先7個百分點。
2019年3月29日評測結(jié)果
之所以能有這樣的技術(shù)優(yōu)勢,領(lǐng)域自適應(yīng)模型是網(wǎng)易有道的法寶之一。
用戶的需求是是多元的,有些用戶對金融信息有需求,有些要查計算機術(shù)語,若想要用一個模型來覆蓋所有用戶需求,必然會影響翻譯的準確度。
機器翻譯中的領(lǐng)域自適應(yīng)模型是指,若想要讓翻譯質(zhì)量更好,需要給它更多垂直領(lǐng)域的數(shù)據(jù),更多的平行語料。有道對于一些特定領(lǐng)域有單獨的模型,系統(tǒng)會判定語料適應(yīng)的領(lǐng)域,分配不同的模型進行翻譯。
除基礎(chǔ)翻譯技術(shù)過硬外,有道翻譯用戶不斷增長的另一因素是注重產(chǎn)品交互的創(chuàng)新與改變,例如在2018年和2019年增添AR實景翻譯、語音同傳、文檔翻譯和網(wǎng)頁翻譯等多個場景化很強的功能。
擁有國內(nèi)可識別語言最多的OCR識別引擎,賦能AIoT學(xué)習(xí)硬件
如今,這些新功能背后的技術(shù)已經(jīng)成為幫助有道拓展AI業(yè)務(wù)邊界的兩把利刃。
OCR是網(wǎng)易有道王牌技術(shù)之一,盡管2014年就已上線基于傳統(tǒng)規(guī)則方法的OCR技術(shù),但2017年,有了基于神經(jīng)網(wǎng)絡(luò)技術(shù)的加持,OCR引擎的質(zhì)量明顯邁向了新臺階。
OCR技術(shù)最直觀的功能表現(xiàn)就是拍照翻譯。截止2019年5月15日,有道OCR識別技術(shù)已經(jīng)支持26種主流語言文字的支持,是目前國內(nèi)識別語言最多的OCR識別引擎。
同時,網(wǎng)易有道的OCR技術(shù)是國際市場首家支持以下功能:
多語種全自動判別與混合識別
支持360度任意角度圖像的文字識別
支持文字語義方向為橫排、豎排或者混合排列的文字識別
同時,針對“AI+教育”這一場景,有道OCR團隊進行了專項優(yōu)化,研發(fā)出了一系列在國內(nèi)市場上處于壟斷性的優(yōu)勢技術(shù),例如:
實現(xiàn)了公式識別,支持公式轉(zhuǎn)為LaTeX功能,準確率達到93%。輸入圖示例:
除此之外,有道的OCR技術(shù)也能應(yīng)對拼音識別、超模糊手寫體識別、多角度多語種混合排版識別等高難度場景,平均準確率可達95%。
超模糊手寫體識別案例
同時,針對K12用戶(尤其是少兒用戶)高難度手寫場景進行優(yōu)化,識別準確率高達85%以上,是業(yè)內(nèi)唯一支持高難度教育場景的手寫OCR服務(wù)。
K12手寫體識別案例
這些均可離線的AI技術(shù)將這些能力部署在多種移動端上,滿足各種AIoT硬件的需求。目前有道的各個AI技術(shù)均支持離線,OCR識別的模型離線后加起來只要50M。
有道OCR以主流智能教育硬件為基礎(chǔ),構(gòu)建了完整的教育場景OCR技術(shù)鏈路。
同樣還能實現(xiàn)離線的另一王牌AI技術(shù)還有智能語音。
2017年,智能語音技術(shù)被有道正式提上日程,投入研發(fā),在語音識別(ASR)、語音合成(TTS)、語音評測、語種識別、聲學(xué)前端增強等五大方面均有涉及:
2017年6月份啟動ASR技術(shù)相關(guān)的研發(fā),目前,支持中、英、日、韓、俄、西班牙等語言的識別,在一些場景上識別準確率超過98%。
于2017年開始語音評測技術(shù)的研發(fā),目前在評分準確度方面和專家人工打分的相關(guān)性達到0.8。
從2017年開始自主研發(fā)語音合成系統(tǒng),采用端到端的技術(shù)框架構(gòu)建,達到和真人相當?shù)恼Z音自然度、高并發(fā)、低延時,目前已經(jīng)支持中、英、日、韓、葡等多個語種。
擴展其它相關(guān)語音技術(shù)的研發(fā),例如聲紋識別、說話人日志、語音前端增強等。
在國際競賽方面,有道語音團隊參加了DIHARD Challenge2019競賽,取得兩階段均第三名的成績。
依托TEACH產(chǎn)品矩陣和業(yè)務(wù)場景的海量資源優(yōu)勢,有道語音技術(shù)團隊在場景化聲學(xué)建模、分領(lǐng)域語言建模、數(shù)據(jù)輔助標注等專項技術(shù)方面形成了和語音應(yīng)用系統(tǒng)相互配合、密不可分的技術(shù)矩陣,達到較好的協(xié)同效應(yīng)。
相關(guān)核心技術(shù)的整體框架結(jié)構(gòu)如下圖所示:
值得一提的是,有道的語音技術(shù)不僅提供云端高精度的解決方案,還提供完善的離線部署和低資源嵌入式集成方案,可以在保證精度的同時減少對網(wǎng)絡(luò)的依賴,極大擴展了應(yīng)用場景。
紙筆交互:熟悉的自適應(yīng)學(xué)習(xí),新鮮的硬件加持
除此之外,網(wǎng)易有道為旗下產(chǎn)品“有道精品課”自研了一款有道智能筆。
簡單來講,這支筆除了正常書寫功能外,內(nèi)置了一個攝像頭和一顆處理芯片,你在進行習(xí)題練習(xí)時,內(nèi)置的攝像頭會自動記錄書寫內(nèi)容并同步上傳到精品課APP中。
這其中OCR識別引擎就發(fā)揮了重要作用,同時運用點陣碼追蹤技術(shù),完整地還原了線下作業(yè)體驗并實現(xiàn)了實時上傳。
完成記錄并上傳只是完成了一部分任務(wù),有道還開發(fā)了一套AI智能學(xué)習(xí)系統(tǒng):通過分析智能筆上傳的做題數(shù)據(jù),進而提供如學(xué)情分析、知識圖譜評估、智能推題等一系列自適應(yīng)學(xué)習(xí)輔助。
這套系統(tǒng)由有道自主開發(fā)的題庫和大數(shù)據(jù)推薦算法組成,目前有道自有題庫容量已有5000萬。
以初中數(shù)學(xué)為例,題庫共收錄了教學(xué)大綱中的數(shù)百個知識點、每個知識點對應(yīng)上百道習(xí)題。題目和知識點均由老師人工標注難度及重要程度,為算法推薦提供依據(jù)。
事實上,有為K12用戶專門打造的、有硬件加持的自適應(yīng)學(xué)習(xí)系統(tǒng)在業(yè)內(nèi)非常罕見,并且這還原了學(xué)生熟悉的紙筆交互系統(tǒng),這也是網(wǎng)易有道“AI+教育”業(yè)務(wù)的重要技術(shù)壁壘。
發(fā)力AI的基因與籌碼兼?zhèn)?,網(wǎng)易有道商業(yè)化道路將迎質(zhì)變
有道智能筆這類獨特硬件的出現(xiàn)也能看出有道對在線教育資源掌控的決心與判斷。
根據(jù)有道在AI技術(shù)上的布局,可以看出2017年是這家公司全力擁抱AI的一年。
同時,穩(wěn)握8億用戶、100%用戶導(dǎo)向的原則,網(wǎng)易有道發(fā)力AI的基因與籌碼都已具備。
單拿“AI+教育”領(lǐng)域來說,網(wǎng)易有道所走得路線也相對“穩(wěn)妥”,屬于均衡發(fā)展的選手,注重實用性與應(yīng)用落地。
與轉(zhuǎn)型擁抱AI的新東方、好未來等傳統(tǒng)教育企業(yè)相比,它沒有擁有絕對場景優(yōu)勢,但積累的用戶基礎(chǔ)極大,進而擁有數(shù)據(jù)優(yōu)勢,并且有多年的自研技術(shù)積累。
但與AI企業(yè)相比,網(wǎng)易有道沒有經(jīng)歷通過純靠技術(shù)“廝殺”的階段。
作為網(wǎng)易旗下第三個獨立融資的事業(yè)部門,AI浪潮興起的時候,網(wǎng)易有道早已不是初創(chuàng)企業(yè),它對于如何將新技術(shù)落地商業(yè)化更有經(jīng)驗。
“AI+教育”行業(yè)尚處于發(fā)展早期的升溫階段,概念模糊,泡沫難免。保持清醒,注重實用性的確能保護企業(yè)避免觸礁。
發(fā)力AI基因與籌碼已兼?zhèn)?,至于何時走向資本市場、商業(yè)化道路迎來質(zhì)變也是可遇見的未來。
-
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268106 -
網(wǎng)易
+關(guān)注
關(guān)注
0文章
124瀏覽量
14374
原文標題:8億用戶AI有道,超強神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)大解密!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論