最近,隨著人工智能(AI)2.0大模型的啟動(dòng),我不僅跟同事熱火朝天地研讀相關(guān)論文,還去美國一線了解AI2.0的新趨勢,探索這一領(lǐng)域產(chǎn)學(xué)研的深度融合。在人工智能大模型發(fā)展論壇上,我將近來關(guān)于AI2.0大模型方面的機(jī)遇與挑戰(zhàn)及部分爭議做一個(gè)比較通俗的分享和剖析。
大模型也會(huì)“胡說八道”
業(yè)內(nèi)人士熟悉的AI1.0是以AlphaGo為代表的深度學(xué)習(xí),隨后AI1.0開始在計(jì)算機(jī)視覺等領(lǐng)域趕超人類,并且穿透實(shí)體行業(yè)創(chuàng)造了價(jià)值。但AI1.0也遇到了明顯的瓶頸,這些瓶頸正好是AI2.0時(shí)代的大模型能夠解決的。
AI1.0遇到的瓶頸是什么?在AI1.0時(shí)代,單領(lǐng)域數(shù)據(jù)集之間、數(shù)據(jù)集與模型之間各成孤島。當(dāng)時(shí)還沒有大模型的時(shí)候,我們要做一個(gè)領(lǐng)域的AI應(yīng)用,要深入該領(lǐng)域收集數(shù)據(jù)、清洗數(shù)據(jù)、標(biāo)注數(shù)據(jù),然后再去調(diào)整模型,整個(gè)過程的工作量和成本都非??捎^。
AI2.0的大模型有一個(gè)很大的特點(diǎn),就是可以用海量數(shù)據(jù)訓(xùn)練一個(gè)大模型,只需要微調(diào)就可以執(zhí)行五花八門的任務(wù)?,F(xiàn)在用來訓(xùn)練大模型的主要是文字?jǐn)?shù)據(jù)內(nèi)容,未來還會(huì)增加多模態(tài)數(shù)據(jù),隨著數(shù)據(jù)的豐富化,再以這個(gè)模型去做微調(diào)。可以預(yù)想,AI2.0的未來將具備非常大的威力。
一個(gè)聰明的AI引擎有望帶來應(yīng)用的爆發(fā),那么這樣的應(yīng)用到底多快才能爆發(fā)?
前提還需要弄清楚一個(gè)重要問題,就是今天的大模型有時(shí)候會(huì)一本正經(jīng)地“胡說八道”,但大模型的能力也來自這個(gè)所謂的“胡說八道”。如果將其“胡說八道”的能力降為零,那么其推理能力也幾乎沒有了。
因此,我認(rèn)為內(nèi)容生產(chǎn)、娛樂等是AI2.0最快也最易于落地應(yīng)用的領(lǐng)域,這些領(lǐng)域有一定的容錯(cuò)空間,也能通過人工干預(yù)校準(zhǔn)錯(cuò)誤。未來,隨著AI2.0的不斷迭代發(fā)展,“胡說八道”的問題也有望解決。
不只是一個(gè)問答引擎
在此,我將AI2.0的大模型生態(tài)劃分為基礎(chǔ)模型層、中間層、應(yīng)用層3個(gè)層次。
基礎(chǔ)模型層主流的說法是模型即服務(wù);應(yīng)用層包括AI各種垂類應(yīng)用,如輔助寫稿、畫圖、摳圖等;中間層則是提供模型微調(diào)、推理遷移學(xué)習(xí)的各種工具,幫助大模型更高效實(shí)踐,讓應(yīng)用開發(fā)的成本降到最低,助推AI2.0應(yīng)用進(jìn)入百花齊放的態(tài)勢,形成強(qiáng)大且有黏性的平臺(tái)生態(tài)。
由此可見,AI2.0將是一個(gè)巨大的平臺(tái)機(jī)遇,其規(guī)模將是移動(dòng)互聯(lián)網(wǎng)的10倍,所有的應(yīng)用和界面都會(huì)被重寫一遍,將顛覆很多行業(yè)。
未來,我們可以想象這樣一個(gè)場景:一個(gè)很厲害的編輯可以通過AI寫出一篇深度報(bào)道;創(chuàng)作游戲時(shí),角色、背景、道具、衣服、故事的產(chǎn)生,甚至所有的代碼最終都會(huì)用AI來寫。一些小朋友甚至?xí)炎约合胪娴挠螒蛲ㄟ^AI寫出來,再用文字做一個(gè)游戲介紹,幾秒鐘后就可以玩了,這跟今天的游戲制作有很大差別。
因此,大模型不只是一個(gè)問答引擎,它還將深刻改變未來應(yīng)用的生態(tài),可以成為人們的垂類智能助理,但也隨之帶來一些問題和挑戰(zhàn)。因此,開發(fā)AI2.0時(shí),需要同時(shí)研究如何善用AI2.0技術(shù),以及制定管理AI2.0的法律、法規(guī)。
優(yōu)秀的技術(shù)產(chǎn)品是“賽馬”賽出來的
不難發(fā)現(xiàn),除了AI領(lǐng)域外,大模型的改革還會(huì)帶來一些平臺(tái)式的巨大差距。
另外,在所有的應(yīng)用里,AI-First(人工智能優(yōu)先)將是最重要的應(yīng)用。AI-First指這個(gè)應(yīng)用沒有AI就不能成立。簡單地說,當(dāng)我們把大模型從應(yīng)用中抽掉,這個(gè)應(yīng)用將會(huì)完全癱瘓。
要在AI領(lǐng)域做應(yīng)用或創(chuàng)業(yè),就一定要做必須有AI參與的App應(yīng)用,因?yàn)樗鼘⑹茿I2.0時(shí)代的寵兒,它的整個(gè)用戶體驗(yàn)將令人耳目一新。
近期,關(guān)于大模型有幾種質(zhì)疑的聲音:“使用海外的開源大模型就可以做出中國版OpenAI”“大模型耗錢且耗人,只有巨頭才有入場券”“開發(fā)小模型就夠用了”……
這些說法正確嗎?
首先,開源是非常重要的,中國技術(shù)未來的發(fā)展肯定需要開源,因?yàn)楦咝:蛣?chuàng)業(yè)者沒有開源就很難得到啟動(dòng)的力量。但是,“使用海外的開源大模型就可以做出中國版的OpenAI”的說法是絕對錯(cuò)誤的。雖然開源模型本身有一定局限性,但如果直接使用海外的開源大模型,技術(shù)的天花板將決定你永遠(yuǎn)做不出達(dá)到或超越GPT-4.0技術(shù)水平的大模型。
第二,很多人做開源大模型訓(xùn)練時(shí)用GPT-4.0來訓(xùn)練,但誰也不敢保證GPT-4.0未來仍會(huì)讓每個(gè)人都能使用,從商業(yè)的角度也沒有理由讓你占這個(gè)便宜。
第三,拿海外訓(xùn)練出來的大模型,在國內(nèi)做微調(diào)是值得商榷的。因?yàn)閲鴥?nèi)外的文化習(xí)慣、法律法規(guī)不同,所以自主創(chuàng)新做大模型是中國企業(yè)的必經(jīng)之路。
當(dāng)然,未來不可能有50家大模型公司存在,會(huì)收斂到一個(gè)很小的數(shù)字上。不過,在當(dāng)前大模型這個(gè)領(lǐng)域,我們都在追趕,可以鼓勵(lì)以各種不同的模式去先行先試,優(yōu)秀的技術(shù)產(chǎn)品是“賽馬”賽出來的。
AI2.0市場規(guī)模巨大,足以容納巨頭、中小企業(yè)和初創(chuàng)公司在里面“賽馬”。創(chuàng)業(yè)公司與巨頭各擅勝場,正如ChatGPT背后的OpenAI公司一樣,創(chuàng)業(yè)公司更靈活、更專業(yè)。從硅谷經(jīng)驗(yàn)來看,很多技術(shù)創(chuàng)新的發(fā)起者,都技術(shù)領(lǐng)先、策略靈活、市場反應(yīng)快。落地執(zhí)行力強(qiáng)的團(tuán)隊(duì)將是中國大模型公司成功的關(guān)鍵。
創(chuàng)新需要合作,開放共創(chuàng)未來。我們期待中國大模型賽道能形成巨頭、中小微創(chuàng)新企業(yè)一起發(fā)展的“創(chuàng)新綜合體”,一起把AI2.0做大做強(qiáng)。
-
人工智能
+關(guān)注
關(guān)注
1787文章
46124瀏覽量
235413 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1197瀏覽量
24552 -
大模型
+關(guān)注
關(guān)注
2文章
2157瀏覽量
2022
原文標(biāo)題:自主創(chuàng)新是中國人工智能大模型必經(jīng)之路
文章出處:【微信號(hào):AI智勝未來,微信公眾號(hào):AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論