劍橋2019年度《AI全景報(bào)告》出爐,全方位總結(jié)過(guò)去一年來(lái)AI領(lǐng)域的研究成果與突破、人才形勢(shì)、產(chǎn)業(yè)動(dòng)態(tài)、政府政策,并作出未來(lái)預(yù)測(cè)。今年的報(bào)告額外關(guān)注中國(guó),專門新設(shè)一章,介紹中國(guó)的AI技術(shù)、企業(yè)和應(yīng)用的迅猛發(fā)展。
2019年即將過(guò)去一半,劍橋大學(xué)的兩位研究人員近日推出了本年度的State AI 2019全景報(bào)告。
本報(bào)告基本沿襲去年的大體框架,從產(chǎn)業(yè)、人才、政策、預(yù)測(cè)等方面對(duì)過(guò)去一年來(lái)AI領(lǐng)域的技術(shù)的新進(jìn)步、產(chǎn)業(yè)格局的新變化、政府政策的新特點(diǎn)等方面進(jìn)行了總結(jié),并作出關(guān)于未來(lái)的預(yù)測(cè)。
報(bào)告地址:
https://www.slideshare.net/StateofAIReport/state-of-ai-report-2019-151804430
值得一提的是,與去年不同的是,2019年的報(bào)告為中國(guó)單列一章,介紹中國(guó)AI技術(shù)在日常消費(fèi)、機(jī)器人、半導(dǎo)體等領(lǐng)域的進(jìn)步。
本文重點(diǎn)對(duì)報(bào)告中的AI研究、AI人才以及中國(guó)三部分內(nèi)容作出介紹。
AI研究與技術(shù)突破:游戲、NLP、醫(yī)療全面開(kāi)花
強(qiáng)化學(xué)習(xí)開(kāi)疆?dāng)U土:在多項(xiàng)競(jìng)技性游戲中擊敗人類
目前已經(jīng)被AI統(tǒng)治的游戲包括《蒙特祖瑪?shù)膹?fù)仇》、《星際爭(zhēng)霸2》、《雷神之錘3》,在DOTA2上游戲水平實(shí)現(xiàn)大幅進(jìn)步。未來(lái)的游戲AI可能讓人類更加遙不可及了。
未來(lái),研究人員有望利用強(qiáng)化學(xué)習(xí)訓(xùn)練單個(gè)機(jī)器人來(lái)完成多個(gè)復(fù)雜任務(wù),無(wú)需針對(duì)每個(gè)任務(wù)進(jìn)行專門的再學(xué)習(xí)。
基于好奇心機(jī)制的探索:在獎(jiǎng)勵(lì)稀疏或無(wú)獎(jiǎng)勵(lì)機(jī)制的條件下,智能體可以依賴“好奇心”解決問(wèn)題。
面向在線計(jì)劃學(xué)習(xí)動(dòng)態(tài)模型:模型可從圖像中快速學(xué)習(xí)環(huán)境動(dòng)態(tài)信息,準(zhǔn)確預(yù)測(cè)數(shù)個(gè)時(shí)間段后的獎(jiǎng)勵(lì)。
研究成果逐步進(jìn)入實(shí)際生產(chǎn)環(huán)境:在眾多機(jī)器學(xué)習(xí)框架和工具的支持下,F(xiàn)acebook發(fā)布的開(kāi)源端對(duì)端平臺(tái)Horizon,推進(jìn)大規(guī)模生產(chǎn)環(huán)境下的系統(tǒng)優(yōu)化,如信息聯(lián)想、視頻流質(zhì)量、通知服務(wù)優(yōu)化等。
生命科學(xué)中的新突破:AlphaFold精準(zhǔn)預(yù)測(cè)蛋白質(zhì)的折疊結(jié)構(gòu)
NLP大豐收:預(yù)訓(xùn)練語(yǔ)言模型大展身手
新的預(yù)訓(xùn)練模型不斷涌現(xiàn),各大數(shù)據(jù)集新紀(jì)錄??闯P?。Google AI的BERT, 、Transformer,艾倫研究所的ELMo、OpenAI的Transformer、 Ruder和Howard的 ULMFiT、微軟的MT-DNN等爭(zhēng)奇斗艷。
神經(jīng)機(jī)器翻譯:無(wú)需雙向文本
自然語(yǔ)言模型學(xué)會(huì)常識(shí)推理
對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的數(shù)據(jù)隱私和保護(hù)越來(lái)越重視
醫(yī)學(xué)領(lǐng)域大展身手,診斷堪比人類專家
診斷眼疾
使用兩個(gè)階段機(jī)器學(xué)習(xí)方法,AI模型給出了專家級(jí)的眼疾診斷和治療參考建議
利用心電圖檢測(cè)心律不齊,達(dá)到人類醫(yī)生水平
超過(guò)60萬(wàn)的X光片數(shù)據(jù)集已經(jīng)被分享出來(lái),但遠(yuǎn)遠(yuǎn)不夠
用于成像診斷的深度學(xué)習(xí)模型可以很好地?cái)M合數(shù)據(jù)集,但是它們難以推廣到新的數(shù)據(jù)分布。盡管改進(jìn)了這個(gè)新數(shù)據(jù)集的文檔,但標(biāo)簽定義很淺
使用醫(yī)生筆記中的NLP提取標(biāo)簽存在挑戰(zhàn):容易出錯(cuò)且容易受到影響。放射學(xué)報(bào)告中包含的信息不足,大多數(shù)標(biāo)簽類別的錯(cuò)誤率為5-15%
大量重復(fù)掃描,其中70%的掃描來(lái)自30%的患者。這減少了數(shù)據(jù)集的有效大小及其多樣性,影響訓(xùn)練模型的普適性
研究人員從聽(tīng)覺(jué)皮層的神經(jīng)活動(dòng)中重建語(yǔ)音
哥倫比亞大學(xué)的研究人員使用侵入性腦電圖來(lái)測(cè)量5名接受癲癇治療的患者在連續(xù)收聽(tīng)語(yǔ)音時(shí)的神經(jīng)活動(dòng)
反過(guò)來(lái)使研究人員能夠通過(guò)大腦活動(dòng)的聲碼器合成語(yǔ)音。通過(guò)聲碼器測(cè)試單個(gè)數(shù)字“口語(yǔ)”時(shí),系統(tǒng)的準(zhǔn)確度達(dá)到75%。與基線線性回歸方法相比,深度方法將語(yǔ)音的可懂度提高了65%
該研究表明,大腦計(jì)算機(jī)界面有可能恢復(fù)癱瘓患者的溝通
使用蒙特卡羅樹(shù)搜索神經(jīng)網(wǎng)絡(luò)通過(guò)訓(xùn)練1240萬(wàn)個(gè)反應(yīng)來(lái)解決逆向合成
一個(gè)由三個(gè)NN(3N-MCTS)構(gòu)建的系統(tǒng):
通過(guò)提出有限數(shù)量的自動(dòng)提取轉(zhuǎn)換來(lái)指導(dǎo)向有希望的方向搜索
預(yù)測(cè)擬議的反應(yīng)是否實(shí)際可行
估計(jì)位置值并迭代
這種方法比最先進(jìn)的計(jì)算機(jī)輔助綜合計(jì)劃快得多。實(shí)際上,3N-MCTS解決了超過(guò)80%的分子測(cè)試集,每個(gè)目標(biāo)分子的時(shí)間限制為5秒。
相比之下,一種稱為最佳第一搜索的方法,其中通過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)函數(shù)可以解決40%的測(cè)試集。使用手動(dòng)編碼啟發(fā)式功能設(shè)計(jì)的最佳首次搜索執(zhí)行最差:它在5秒內(nèi)解決了0%。
AutoML:神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù)的進(jìn)化算法
共同優(yōu)化超參數(shù),最大化網(wǎng)絡(luò)性能,同時(shí)最小化復(fù)雜性和大小
之前的AutoML工作使用RL單獨(dú)優(yōu)化超參數(shù)或網(wǎng)絡(luò)架構(gòu)。遺憾的是,RL系統(tǒng)要求用戶事先為算法定義適當(dāng)?shù)乃阉骺臻g以用作起點(diǎn),可以針對(duì)每個(gè)層優(yōu)化的超參數(shù)的數(shù)量也是有限的
此外,計(jì)算非常繁重。為了生成最終的最佳網(wǎng)絡(luò),必須對(duì)數(shù)千個(gè)候選架構(gòu)進(jìn)行評(píng)估和訓(xùn)練,這需要大約100k GPU小時(shí)
另一種選擇(Learning Evolutionary AI Framework:LEAF)是使用進(jìn)化算法進(jìn)行超參數(shù)和網(wǎng)絡(luò)架構(gòu)優(yōu)化,最終產(chǎn)生更小,更有效的網(wǎng)絡(luò)
例如,LEAF與手工制作的數(shù)據(jù)集特定網(wǎng)絡(luò)(CheXNet)的性能相匹配,用于胸部X射線診斷分類,并且優(yōu)于Google的AutoML
AutoML:使用真實(shí)的設(shè)備性能反饋設(shè)計(jì)資源受限的網(wǎng)絡(luò)
基于CNN的自動(dòng)化架構(gòu)搜索的步伐正在加快:Facebook與谷歌的競(jìng)爭(zhēng)加劇
谷歌展示了一種基于RL的多目標(biāo)方法(MnasNet),可以在Google Pixel平臺(tái)上測(cè)量具有低實(shí)際推理延遲的高精度CNN模型。該系統(tǒng)在Pixel手機(jī)上達(dá)到74.0%的Top-1精度,延遲為76ms,比MobileNetV2快1.5倍
Facebook提出了一種可區(qū)分的神經(jīng)架構(gòu)搜索(DNAS)框架,該框架使用基于梯度的方法在分層搜索空間上優(yōu)化CNN架構(gòu)。FBNet-B實(shí)現(xiàn)了與MnasNet相同的Top-1精度,但延遲僅為23.1ms,搜索成本降低了420倍
GAN的最新技術(shù)水平在不斷發(fā)展:從顆粒到GANgsta
較大的模型和大批量訓(xùn)練進(jìn)一步提高了使用GAN生成的圖像的質(zhì)量
GAN中的最新技術(shù)水平在不斷發(fā)展:從面部到全身
通過(guò)將面部與口語(yǔ)相匹配(左),電影只需設(shè)置一次,即可以不同語(yǔ)言生成相同的視頻。下一步是從頭到腳生成整個(gè)身體,目前用于零售目的(右)
在圖像和視頻操作之后出現(xiàn)逼真的語(yǔ)音合成
從單個(gè)圖像中學(xué)習(xí)對(duì)象的3D形狀
模型輸出10個(gè)不同類別(如汽車、摩托車、行人、交通錐等)的3D邊界框,類特定屬性(如汽車是否正在行駛或停車)并提供當(dāng)前速度矢量。
AI人才:五大國(guó)雇傭了72% 專家,論文引用率只有中國(guó)增長(zhǎng)
人才方面,以研究論文的產(chǎn)出衡量,谷歌是最具生產(chǎn)力的一個(gè)組織。上圖為在人工智能頂會(huì)NeurIPS 2018上,谷歌發(fā)表的論文最多,其次是MIT、斯坦福、CMU和加州大學(xué)伯克利分校。
在NeurIPS、ICML或ICLR上發(fā)表論文的4000名研究人員中,88%是男性。
大型科技公司高級(jí)工程師的年薪接近100萬(wàn)美元。
另一方面,數(shù)據(jù)標(biāo)簽工作也有了巨大的增長(zhǎng),尤其是在中國(guó)。這類工作的最低工資可低至每小時(shí)10元人民幣。
神經(jīng)網(wǎng)絡(luò)的先驅(qū)、Yann LeCun、Geoffrey Hinton和YoshuaBengio獲得了圖靈獎(jiǎng),這是計(jì)算機(jī)科學(xué)的最高獎(jiǎng)項(xiàng)。
歐洲發(fā)表的AI論文最多,但在平均引文率這個(gè)指標(biāo)上,只有中國(guó)是增長(zhǎng)的。
該領(lǐng)域論文的數(shù)量整體是增長(zhǎng)的,不同地區(qū)論文的平均被引量表明,只有來(lái)自中國(guó)的論文變得更有影響力了。美國(guó)作者發(fā)表的論文被引用的次數(shù)比全球平均水平高出83%。
MIT在計(jì)算與人工智能領(lǐng)域新增10億美元投資。在3.5億美元捐贈(zèng)的支持下,MIT新的計(jì)算學(xué)院將把MIT重新定位為向所有研究領(lǐng)域注入AI教育,提供了50個(gè)新的教職,使MIT在該領(lǐng)域的學(xué)術(shù)能力翻了一番。
大學(xué)里人工智能相關(guān)課程的注冊(cè)人數(shù)也在增長(zhǎng),中國(guó)的增長(zhǎng)尤其快。
與2012年相比,清華大學(xué)和斯坦福大學(xué)的人工智能課程注冊(cè)人數(shù)分別增加了近16倍和5倍。
但人工智能課程中教授和學(xué)生的性別多樣性仍遠(yuǎn)未達(dá)到平等。平均而言,80%教AI的教授是男性,75%的學(xué)AI的本科生是男生。
這造成的一個(gè)結(jié)果是,在美國(guó),申請(qǐng)AI方面職位的人中71%是男性。
Element.AI 2019年進(jìn)行的一項(xiàng)AI人才調(diào)查顯示:
對(duì)22400名個(gè)人作者在21個(gè)機(jī)器學(xué)習(xí)會(huì)議上發(fā)表的論文進(jìn)行調(diào)查:只有19%的學(xué)術(shù)作者和16%的行業(yè)作者是女性。
44%的作者在美國(guó)獲得博士學(xué)位,11%來(lái)自中國(guó),6%來(lái)自英國(guó)。
五大國(guó)家——美國(guó)、中國(guó)、英國(guó)、德國(guó)和加拿大——雇傭了72%的作者。圖上的圓圈表示每個(gè)國(guó)家在會(huì)議上發(fā)表論文的研究人員數(shù)量。
同樣是Element.AI,從AI人才流入和流出來(lái)看,加拿大、英國(guó)和瑞士都是“平臺(tái)國(guó)家”,既吸引外國(guó)人才,又輸出本土培養(yǎng)的人才。美國(guó)和中國(guó)的生態(tài)系統(tǒng)更為成熟——流入和流出都較低。
但雇傭AI研究人員進(jìn)入公司的趨勢(shì)似乎正在放緩。據(jù)稱,科技巨頭凍結(jié)或減少了對(duì)AI研究人才的招聘。這可能是一個(gè)跡象,表明企業(yè)現(xiàn)在需要人才來(lái)將應(yīng)用研究投入生產(chǎn)。
人工智能技術(shù)已經(jīng)滲入中國(guó)企業(yè)
人臉識(shí)別已經(jīng)成為日常消費(fèi)付款方式。
養(yǎng)雞業(yè):2016年,京東推出了一項(xiàng)“小雞快跑(running chicken)”計(jì)劃,幫助中國(guó)農(nóng)業(yè)地區(qū)減少貧困。根據(jù)該計(jì)劃,該公司將購(gòu)買任何自由放養(yǎng)的雞肉,只要其步數(shù)超過(guò)100萬(wàn)步,且價(jià)格是當(dāng)前市場(chǎng)價(jià)格的三倍?,F(xiàn)在,京東已經(jīng)擴(kuò)展了該項(xiàng)目,將人工智能工具整合到畜牧工作流程中。這包括自動(dòng)喂食、澆水和清除廢物。人工智能系統(tǒng)還將監(jiān)測(cè)和識(shí)別雞的食物攝入量、排便情況和其他生理狀況,如發(fā)病情況。如果一只雞生病了,專家會(huì)在網(wǎng)上提供醫(yī)療服務(wù)和處方藥物。
養(yǎng)豬業(yè):在Dekon集團(tuán)、特區(qū)集團(tuán)和阿里巴巴云的合作中,計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別系統(tǒng)被用來(lái)通過(guò)紋在豬腹部的數(shù)字來(lái)識(shí)別個(gè)體豬,還可以監(jiān)測(cè)小豬發(fā)出的痛苦叫聲。到2020年,Dekon計(jì)劃每年飼養(yǎng)1000萬(wàn)頭豬。
蟑螂養(yǎng)殖:好醫(yī)生集團(tuán)在四川省每年生產(chǎn)60萬(wàn)只蟑螂。他們利用人工智能系統(tǒng)收集和分析多達(dá)80種蟑螂的特征,如濕度、溫度和食物需求,這些特征可以刺激蟑螂的生長(zhǎng)和繁殖速度。
中國(guó)企業(yè)的研發(fā)支出增長(zhǎng)迅速但顯著落后于市場(chǎng)份額。美國(guó)企業(yè)仍占全球科技支出的61%。
中國(guó)半導(dǎo)體貿(mào)易逆差正(緩慢)上升。下圖反映了中國(guó)半導(dǎo)體銷售和采購(gòu)的趨勢(shì)。
在過(guò)去的三年里,一些中國(guó)的工業(yè)企業(yè)已經(jīng)自動(dòng)化了40%的勞動(dòng)力。這可能部分歸因于自2012年以來(lái),中國(guó)每年的機(jī)器人安裝數(shù)量增長(zhǎng)了500%(歐洲為112%)。然而,目前尚不清楚AI軟件在多大程度上在運(yùn)行這些已安裝的機(jī)器人或者是否有助于它們的發(fā)展。中國(guó)工業(yè)自動(dòng)化水平不斷提高,就業(yè)崗位不斷流失。
京東上海配送中心每天使用自動(dòng)化倉(cāng)庫(kù)機(jī)器人組織、挑選和運(yùn)送20萬(wàn)份訂單。這個(gè)設(shè)施由四名工人照管。京東的倉(cāng)庫(kù)數(shù)量和表面積同比增長(zhǎng)45%。
2018年,有33家中國(guó)企業(yè)在美國(guó)上市,同比增長(zhǎng)2倍,接近2010年的歷史最高水平。
發(fā)明專利的審批過(guò)程充滿挑戰(zhàn),一旦獲得批準(zhǔn),將獲得20年的保護(hù)。實(shí)用新型和外觀設(shè)計(jì)專利都有10年的使用壽命,不需要經(jīng)過(guò)嚴(yán)格的審查,可以在不到1年內(nèi)授予。這種雙重專利制度使中國(guó)在專利方面領(lǐng)先于其他國(guó)家。中國(guó)企業(yè)擁有的專利最多,但2017年“發(fā)明專利”僅占23%。
91%的5年設(shè)計(jì)專利(左)和61%的5年實(shí)用新型專利(右)被放棄。相比之下,美國(guó)5年歷史專利的維護(hù)費(fèi)占85.6%。
中國(guó)目前出版的機(jī)器學(xué)習(xí)影響較大的學(xué)術(shù)研究現(xiàn)狀。
中國(guó)發(fā)表的ML研究已經(jīng)超過(guò)美國(guó)。艾倫研究所(Allen Institute)最近的一項(xiàng)分析顯示,中國(guó)在質(zhì)量方面的差距也在迅速縮小。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
27839瀏覽量
204614 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1243瀏覽量
24004 -
nlp
+關(guān)注
關(guān)注
1文章
481瀏覽量
21935
原文標(biāo)題:劍橋2019年度《AI全景報(bào)告》聚焦中國(guó),盤點(diǎn)全球AI大勢(shì)
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論