作者:劉鋒
2022年11月份以來,以ChatGPT為代表的大模型成為世界數(shù)字科技領(lǐng)域的新熱點(diǎn)。在ChatGPT上線的2個月內(nèi),其月活用戶已經(jīng)突破1億,在不到一年時(shí)間里全球的大模型數(shù)量已經(jīng)超過百個,從全球已經(jīng)發(fā)布的大模型分布來看,中美兩國數(shù)量合計(jì)占全球總數(shù)的超 80%,據(jù)不完全統(tǒng)計(jì),到2023年7月中國 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個。
8月31日,國內(nèi)首批八家大模型通過《生成式人工智能服務(wù)管理暫行辦法》備案,包括百度、智譜、百川、字節(jié)、商湯、中科院(紫東太初)、MiniMax、上海人工智能實(shí)驗(yàn)室等8個企業(yè)/機(jī)構(gòu)的大模型可正式上線面向公眾提供服務(wù)。其中當(dāng)天開放的文心一言等大模型。據(jù)百度官方平臺數(shù)據(jù)顯示,24小時(shí)內(nèi)文心一言回答網(wǎng)友超3342萬個問題。
一般而言,大模型(Large Language Models)指的是包含超大規(guī)模參數(shù)的神經(jīng)網(wǎng)絡(luò)模型。大模型通常能夠?qū)W習(xí)到更細(xì)微的模式和規(guī)律,具有更強(qiáng)的泛化能力和表達(dá)能力。大模型代表了AI和深度學(xué)習(xí)在自然語言處理領(lǐng)域的最新進(jìn)展。目前在機(jī)器翻譯、語言理解、聊天機(jī)器人、圖像識別,圖像視頻生成、語音識別、語音合成,推薦系統(tǒng)等等領(lǐng)域都獲得了革命性的進(jìn)步。
微軟公司創(chuàng)始人比爾·蓋茨公開表示,自1980年首次看到圖形用戶界面以來,以GPT為代表的大模型模型是他所見過的最具革命性的技術(shù)進(jìn)步。對于大模型未來的產(chǎn)業(yè)發(fā)展趨勢和面臨的挑戰(zhàn)究竟如何,我們將從三個方面進(jìn)行探討。
我們在《崛起的超級智能:互聯(lián)網(wǎng)大腦如何影響科技未來》一書中提出,生物的競爭本質(zhì)上是種群知識庫的的競爭。在過去的幾億年里,恐龍因?yàn)闇缃^導(dǎo)致種群知識庫消失為0,鯊魚一直保持在海洋中游蕩,種群知識庫沒有發(fā)生大的變化,熊貓因?yàn)橼呌跍缃^從而種群知識庫不斷萎縮。
只有人類在近200萬年里,在知識和智慧上不斷擴(kuò)展和加速,在最近數(shù)百年里隨著蒸汽機(jī)、工業(yè)革命、核能的出現(xiàn)。人類種群知識庫出現(xiàn)了巨大的增長。特別是互聯(lián)網(wǎng)的誕生后,第一次將人類的種群知識庫外化成一個基于網(wǎng)絡(luò)的龐大知識庫,通過萬維網(wǎng)的發(fā)明進(jìn)一步促使人類種群知識庫急劇擴(kuò)容。表現(xiàn)在科技領(lǐng)域就是21世紀(jì)大量新科技新概念不斷涌現(xiàn)。
面對海量的互聯(lián)網(wǎng)公共知識,如何索引就成了人類必須解決的重要課題,因此到20世紀(jì)90年代,搜索引擎出現(xiàn)了蓬勃發(fā)展,其中優(yōu)秀和典型的代表分別是谷歌和百度。它們成長背后的推動力也是人類種群知識庫發(fā)展的必然要求。
在互聯(lián)網(wǎng)知識庫被索引之后,如何智能化也就成為了一個重要議題。在過去的近30年里,以谷歌、百度為代表的搜索引擎公司加大了將互聯(lián)網(wǎng)知識庫進(jìn)行智能化的步伐,人工智能的興起也于此有密切的關(guān)系。在國內(nèi)過去的近10年時(shí)間里,百度通過百度大腦、小度、自動駕駛等產(chǎn)品不斷推動人工智能的產(chǎn)業(yè)化應(yīng)用。
2022年OpenAI的Chatgpt成功引發(fā)了大模型的興起,標(biāo)志著互聯(lián)網(wǎng)這個外化的人類種群知識庫完成了從索引化到智能化的轉(zhuǎn)變。但不能忘記的是,OpenAI Chatgpt的成功離不開谷歌提出的Transformer注意力機(jī)制模型,也離不開微軟通過Bing搜索引擎提供的海量數(shù)據(jù)和巨大資金支持。在中國,2019年百度推出了文心大模型,并在2023年在國內(nèi)率先推出了大模型消費(fèi)級產(chǎn)品-文心一言,并與其搜索引擎做了深度結(jié)合,另一家中國搜索引擎公司奇虎360也在2023年推出了大模型產(chǎn)品360智腦,搜狗創(chuàng)始人王小川建立的百川智能成為中國首批通過審核的大模型之一,它們在各項(xiàng)評測中都取得了不俗的成果。
從搜索引擎的發(fā)展看,通過激烈的競爭,搜索引擎最終形成了若干個巨頭公司為人類提供互聯(lián)網(wǎng)海量數(shù)據(jù)的索引服務(wù),同樣我們認(rèn)為作為搜索引擎的升級版,人類社會也不需要很多大模型提供同質(zhì)的服務(wù)。包括搜索引擎、大數(shù)據(jù)、社交網(wǎng)絡(luò)等領(lǐng)域擁有優(yōu)質(zhì)大數(shù)據(jù)、人工智能技術(shù)積累和廣泛應(yīng)用場景的巨頭或創(chuàng)業(yè)公司,在大模型的產(chǎn)業(yè)競爭中將具有更強(qiáng)的競爭力,并在未來的競爭中脫穎而出一家或若干家為人類提供集中統(tǒng)一的智能服務(wù)。
二.行業(yè)垂直大模型建設(shè)思路:繼續(xù)提升通用大模型智能水平
應(yīng)該指出,當(dāng)前,人類社會對大模型充滿了熱情,特別在中國,很多人希望大模型能夠與金融、法律、工業(yè)、農(nóng)業(yè)、電力、建筑等等行業(yè)領(lǐng)域結(jié)合,從而實(shí)現(xiàn)彎道超車,但我們必須考慮大模型的特點(diǎn),需要在大模型的垂直化和行業(yè)化過程中保持謹(jǐn)慎。
大模型的成功并不僅僅是參數(shù)量大,而是用大規(guī)模預(yù)訓(xùn)練+微調(diào)的方式,對海量的跨領(lǐng)域知識進(jìn)行學(xué)習(xí)時(shí)涌現(xiàn)出來新的能力,而且這些新的能力往往與創(chuàng)新有關(guān),如翻譯,創(chuàng)作文章,創(chuàng)作圖像、編寫詩歌,編寫程序等,然而這種創(chuàng)新能力在工作時(shí)產(chǎn)生的結(jié)果并不穩(wěn)定,會出現(xiàn)“幻覺”和胡編亂造的情況。同時(shí)由于神經(jīng)網(wǎng)絡(luò)本身的特點(diǎn),其內(nèi)部運(yùn)行機(jī)制的可解釋性問題也一直沒有解決,因此對于需要精密控制或精確結(jié)果的產(chǎn)業(yè)領(lǐng)域,大模型并不是可靠的工具和技術(shù)。
另外一個誤區(qū),認(rèn)為用大模型的訓(xùn)練方法加上行業(yè)產(chǎn)業(yè)的大數(shù)據(jù)就可以形成高質(zhì)量的行業(yè)大模型。這個觀點(diǎn)并不符合大模型涌現(xiàn)出創(chuàng)新能力的規(guī)律,過于單一領(lǐng)域的知識反而會降低大模型的涌現(xiàn)出新能力的水平,導(dǎo)致無法有效應(yīng)用到行業(yè)產(chǎn)業(yè)中。因此應(yīng)繼續(xù)提高Chatgpt,文心一言、Llama、智譜、百川等等通用大模型的智能水平,通過這些通用大模型平臺與其他可靠性高的人工智能技術(shù)協(xié)同工作,并與各個行業(yè)結(jié)合,這種路徑要比建設(shè)專門的行業(yè)大模型更為穩(wěn)健和有效。
三.值得期待的大模型未來
當(dāng)然,大模型并不是人工智能的全部,也不是數(shù)字科技的全部,它只是其中一個當(dāng)前活躍的重要技術(shù)和產(chǎn)品。應(yīng)避免大數(shù)據(jù)熱時(shí),一切皆大數(shù)據(jù);元宇宙熱時(shí),一切皆元宇宙;大模型熱時(shí),一切皆大模型,大模型需要與其他技術(shù)和產(chǎn)品結(jié)合才能發(fā)揮更大的作用。
大模型的不斷發(fā)展和與其他技術(shù)產(chǎn)品結(jié)合的過程將是持續(xù)探索和嘗試的過程。無論如何,大模型的出現(xiàn)的確是一個革命性的突破,有很多科學(xué)家認(rèn)同Chatgpt等大模型已經(jīng)可以突破圖靈測試,未來在智能和意識的基礎(chǔ)原理上也將帶來更多突破性的啟發(fā)。
在產(chǎn)業(yè)應(yīng)用上,大模型與其他不同類型的人工智能技術(shù)、網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)結(jié)合,與不同的辦公、學(xué)習(xí)、生產(chǎn)、生活結(jié)合會持續(xù)產(chǎn)生出具有非凡想象力的應(yīng)用。例如微軟辦公Office 接入GPT-4,百度利用文心一言重構(gòu)包括搜索、文庫、如流、智能云等業(yè)務(wù)產(chǎn)品。未來還會發(fā)生怎樣的革命性變化,我們還需要耐心等待大模型的持續(xù)發(fā)育和成長,畢竟它還是一個出生來到全人類面前還不到1年的嬰兒,(從以ChatGPT3.5為代表的大模型大規(guī)模向人類提供服務(wù)算起)。
編輯:黃飛
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4733瀏覽量
100420 -
語音識別
+關(guān)注
關(guān)注
38文章
1710瀏覽量
112493 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237090 -
GPT
+關(guān)注
關(guān)注
0文章
351瀏覽量
15281 -
大模型
+關(guān)注
關(guān)注
2文章
2274瀏覽量
2358
原文標(biāo)題:大模型的產(chǎn)業(yè)未來發(fā)展趨勢與挑戰(zhàn)
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論