問
“ChatGPT,人工智能會(huì)如何發(fā)展?”
答
“人工智能的行業(yè)落地將繼續(xù)加速,今后會(huì)更加廣泛應(yīng)用于工業(yè)、消費(fèi)、金融、醫(yī)療、交通、教育、政府等多個(gè)領(lǐng)域?!?/p>
今天,你和ChatGPT聊天了嗎?它僅僅開發(fā)13天就匆匆上線,卻在兩個(gè)月就獲得過億用戶。這一基于AI的產(chǎn)品持續(xù)火熱出圈,在社會(huì)各界引發(fā)越來越多的熱情。以此為契機(jī),業(yè)界對(duì)于人工智能技術(shù)也展開新討論,特別是大模型的創(chuàng)建和學(xué)習(xí)能力成為關(guān)注的焦點(diǎn)。
一
目前,預(yù)訓(xùn)練技術(shù)(Pre-Trained Model)是人工智能研究的重要突破口。傳統(tǒng)的研究方法中,標(biāo)注成本一直是阻礙AI算法推向更大數(shù)據(jù)集合的障礙;預(yù)訓(xùn)練技術(shù)不依賴數(shù)據(jù)標(biāo)注,就可以訓(xùn)練出一個(gè)大規(guī)模深度學(xué)習(xí)模型。全球AI團(tuán)隊(duì)選擇兒童電視節(jié)目《芝麻街》中的木偶人物來命名各種新預(yù)訓(xùn)練算法,比如Elmo、Bert、Ernie等。
在對(duì)預(yù)訓(xùn)練模型的各種不同的技術(shù)評(píng)測(cè)中,算法性能展示了一個(gè)規(guī)律:數(shù)據(jù)規(guī)模越大、預(yù)訓(xùn)練模型參數(shù)越多,算法輸出精度往往也越高。隨著技術(shù)的突破,模型規(guī)模的不斷增長(zhǎng),其展現(xiàn)出的能力潛力和豐富的應(yīng)用場(chǎng)景激發(fā)了更多的企業(yè)和研究機(jī)構(gòu)投身其中。超級(jí)模型除了可以消化更大規(guī)模的數(shù)據(jù),也需要消耗更高的算力。
OpenAI公司對(duì)人工智能算法訓(xùn)練所消耗的算力做了一個(gè)統(tǒng)計(jì),結(jié)果發(fā)現(xiàn),從2012年到2020年,人工智能模型訓(xùn)練消耗的算力增長(zhǎng)了三十萬倍,平均每3.4個(gè)月翻一番,這超過了摩爾定律的每18個(gè)月翻番的增長(zhǎng)速率,人工智能技術(shù)成為推動(dòng)IT技術(shù)發(fā)展的新的動(dòng)力引擎。
二
全球AI技術(shù)發(fā)展格局:中美領(lǐng)跑
從2019年開始,AI大模型突然爆發(fā),參數(shù)規(guī)模以指數(shù)級(jí)的快速增長(zhǎng)。從2014年到2018年,AI模型參數(shù)規(guī)模還在一億的數(shù)量級(jí)上下浮動(dòng)。
2019年2月,OpenAI的GPT-2達(dá)到了15億參數(shù)規(guī)模
2020年6月,GPT-3達(dá)到了1750億參數(shù)的規(guī)模
2021年1月,谷歌大腦推出了1.6萬億參數(shù)規(guī)模超級(jí)模型,再次刷新規(guī)模記錄
中國(guó)本土技術(shù)團(tuán)隊(duì)也加入到這一場(chǎng)人工智能技術(shù)競(jìng)賽中。阿里巴巴達(dá)摩院在2020年初啟動(dòng)中文多模態(tài)預(yù)訓(xùn)練模型M6項(xiàng)目,同年6月推出3億參數(shù)的基礎(chǔ)模型。2021年1月,模型參數(shù)規(guī)模到達(dá)百億,已經(jīng)成為世界上最大的中文多模態(tài)模型;2021年5月,具有萬億參數(shù)規(guī)模的模型正式投入使用,追上了谷歌的發(fā)展腳步;2020年10月,M6的參數(shù)規(guī)模擴(kuò)展到10萬億,成為當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型[1]。
不少中國(guó)企業(yè)和研究機(jī)構(gòu)也積極研發(fā)投入中文預(yù)訓(xùn)練大模型項(xiàng)目。在人工智能超級(jí)大模型的這條數(shù)據(jù)、算法和算力三輪同時(shí)驅(qū)動(dòng)的技術(shù)賽道上,中美兩國(guó)技術(shù)團(tuán)隊(duì)已經(jīng)形成了“兩架馬車”的發(fā)展模式,不斷刷新人工智能能力規(guī)模上的邊界線。
基于AMiner科技情報(bào)系統(tǒng)的數(shù)據(jù)[2],根據(jù)AIGC領(lǐng)域知識(shí)圖譜(AIGC領(lǐng)域知識(shí)圖譜及關(guān)鍵詞參見附件1)進(jìn)行檢索,利用文獻(xiàn)計(jì)量方法,我們對(duì)2012年到2021年期間全球發(fā)表的AIGC高質(zhì)量論文(論文引用量排名前1%)做比較,共計(jì)1,646篇論文入選。在AIGC高質(zhì)量論文領(lǐng)域,中國(guó)和美國(guó)數(shù)量幾乎持平,并大幅度領(lǐng)先其他國(guó)家。
數(shù)據(jù)來源:AMiner科技情報(bào)平臺(tái)
從發(fā)展趨勢(shì)上看,在AIGC領(lǐng)域,中國(guó)有后來者居上、超越美國(guó)的趨勢(shì)。
數(shù)據(jù)來源:AMiner科技情報(bào)平臺(tái)
在更大的數(shù)字技術(shù)領(lǐng)域,中國(guó)在高價(jià)值論文部分,同發(fā)達(dá)國(guó)家仍有不小差距[3],未來需要產(chǎn)、學(xué)、研一起努力,共同推動(dòng)中國(guó)數(shù)字技術(shù)向價(jià)值鏈高端躍升。
說明:論文檢索時(shí)間范圍為2012年1月至2021年12月
數(shù)據(jù)來源:AMiner科技情報(bào)平臺(tái)
三
AI產(chǎn)業(yè)發(fā)展:資本與人才
深藍(lán)打敗了卡什帕羅夫、AlphaGo戰(zhàn)勝了李世石……對(duì)于業(yè)內(nèi)人士來說,這些曾經(jīng)轟動(dòng)一時(shí)的現(xiàn)象級(jí)技術(shù)進(jìn)步,僅僅是完成固定任務(wù)的弱人工智能。開發(fā)具有跨領(lǐng)域?qū)W習(xí)能力的強(qiáng)人工智能技術(shù)才是人類努力的終極目標(biāo)。常識(shí)學(xué)習(xí)、跨領(lǐng)域模型遷移、小樣本和零樣本學(xué)習(xí)……一個(gè)個(gè)技術(shù)的攔路虎擋在通往強(qiáng)人工智能的技術(shù)道路上,而人工智能超級(jí)模型給這條道路照亮了前方。
OpenAI為訓(xùn)練GPT-3超級(jí)模型投入了1200萬美元的成本。在人工智能超級(jí)模型的賽道上,賽手需要掌握海量的數(shù)據(jù)、超大規(guī)模的人工智能計(jì)算平臺(tái)以及掌握核心技術(shù)能力的算法團(tuán)隊(duì),三者缺一不可。這也許側(cè)面解釋了在追求人工智能技術(shù)最前沿的賽道上,目前只出現(xiàn)了美國(guó)和中國(guó)技術(shù)團(tuán)隊(duì)的身影。中美兩國(guó)在人工智能技術(shù)領(lǐng)域形成了激烈的競(jìng)爭(zhēng)格局。數(shù)據(jù)、算法和算力是這一輪人工智能技術(shù)浪潮的三輪驅(qū)動(dòng)引擎。中國(guó)擁有全世界最大的互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模,在數(shù)據(jù)領(lǐng)域讓我國(guó)具有毋庸置疑的領(lǐng)先地位,互聯(lián)網(wǎng)平臺(tái)企業(yè)也構(gòu)建出極具競(jìng)爭(zhēng)力的算力平臺(tái)和算法團(tuán)隊(duì)。
在斯坦福大學(xué)HAI研究所發(fā)布的2021 全球AI指數(shù)報(bào)告中[4],2020年全球盡管受新冠疫情拖累,在各方面的經(jīng)濟(jì)發(fā)展都受到極其負(fù)面的影響。人工智能領(lǐng)域的發(fā)展卻一枝獨(dú)秀,相關(guān)投資仍然在大幅增加,2020年私人資本在人工智能領(lǐng)域的投資比前一年增加了9.3%,遠(yuǎn)高于疫情前2019年5.7%的增長(zhǎng)率。在資金方面,美國(guó)仍然是人工智能私人資本的最大目的地,2020年總投資超過230億美元,是中國(guó)相關(guān)資金99億美元的兩倍多。
圖表5 全球數(shù)字科技人才數(shù)量前 10 強(qiáng)機(jī)構(gòu)
數(shù)據(jù)來源:AMiner科技情報(bào)平臺(tái)。
近日發(fā)布的《2023全球數(shù)字科技發(fā)展研究——科技人才儲(chǔ)備實(shí)力研究報(bào)告》[5],對(duì)包括AI在內(nèi)的各國(guó)數(shù)字科技人才儲(chǔ)備情況做了全面比較。結(jié)果顯示,與美國(guó)相比,中國(guó)數(shù)字科技人才基數(shù)大,但存在高層次人才少、凈流出數(shù)量多以及人才集中在高校而不是企業(yè)等問題,中國(guó)在鞏固數(shù)字科技人才方面的工作任重道遠(yuǎn)。
四
ChatGPT的未來:腦力的解放
OpenAI公司應(yīng)該也沒有想到ChatGPT會(huì)一夜爆紅,這款對(duì)話機(jī)器人(chatbot)產(chǎn)品不僅開發(fā)時(shí)間短,模型也沒有構(gòu)建在OpenAI即將發(fā)布的最新一代GPT4模型之上,而是采用了上一代的GPT3的增強(qiáng)模型[6]。
不過,從生成式AI技術(shù)(Generative AI或AIGC)的發(fā)展趨勢(shì)來看,ChatGPT這一類現(xiàn)象級(jí)應(yīng)用的橫空出世與迅速爆紅卻并不意外。隨著AI大模型技術(shù)的不斷成熟,AIGC技術(shù)已經(jīng)走出實(shí)驗(yàn)室,應(yīng)用場(chǎng)景也已經(jīng)從初始的文本生成發(fā)展到多模態(tài)領(lǐng)域:
谷歌旗下的Deepmind公司推出了自主編程應(yīng)用AlphaCode,在 Codeforces 舉辦的編程比賽中,超過了 45.7% 的人類參賽者[7]
OpenAI開發(fā)的另一款圖片生成應(yīng)用DALL·E-2,入選了時(shí)代雜志評(píng)選的2022年度最佳發(fā)明[8]
英偉達(dá)開發(fā)了一款3D模型生成工具M(jìn)agic3D,用戶輸入文本描述就可以自動(dòng)生成結(jié)構(gòu)極其復(fù)雜的3D模型[9]
阿里巴巴達(dá)摩院多模態(tài)大模型M6,利用文本輸入可以自動(dòng)驅(qū)動(dòng)人體3D模型的動(dòng)作合成[10]
在圖文創(chuàng)作、代碼生成、3D模型設(shè)計(jì)、3D動(dòng)畫制作等領(lǐng)域,生成式AI技術(shù)展示著深厚的潛力,其應(yīng)用邊界也將隨著技術(shù)的進(jìn)步與成本的降低擴(kuò)展到更多領(lǐng)域。
高科技投機(jī)機(jī)構(gòu)方舟投資(ARK Invest)發(fā)布的報(bào)告[11]預(yù)測(cè),以AIGC為代表的新一代人工智能技術(shù)將輔助知識(shí)工作者(包括教師、律師、醫(yī)生、財(cái)務(wù)、程序員等白領(lǐng)職業(yè))提高工作效率。報(bào)告預(yù)測(cè),到 2030 年,AI 將大幅提高知識(shí)工作者的工作效率,平均工作效率增加140%,新一代人工智能技術(shù)將有可能大幅度降低腦力勞動(dòng)者的工作強(qiáng)度。如果這一切成為現(xiàn)實(shí),或?qū)⑹抢^人類歷史上由于動(dòng)力革命而擺脫繁重的體力勞動(dòng)之后,人類社會(huì)發(fā)生的又一次偉大的技術(shù)革命。
附件1. AIGC領(lǐng)域知識(shí)圖譜及關(guān)鍵詞
審核編輯 :李倩
-
人工智能
+關(guān)注
關(guān)注
1791文章
46702瀏覽量
237219 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1252瀏覽量
24211 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1547瀏覽量
7398
原文標(biāo)題:?中國(guó)何時(shí)能有ChatGPT?“現(xiàn)象級(jí)”產(chǎn)品背后的AI技術(shù)發(fā)展與展望
文章出處:【微信號(hào):IndustryIOT,微信公眾號(hào):工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論