自2022年11月起,以ChatGPT為典型代表的大模型在全球數(shù)字科技界引起了極大關(guān)注。全球范圍內(nèi)的大模型數(shù)量受其影響在不到一年的時間內(nèi)就已超過一百種。 截至2023年10月,大模型技術(shù)已經(jīng)步入了快速發(fā)展的階段。在中國,超過10種大模型已完成備案。其中,百度的文心大模型升級至4.0版本后,在理解、生成、邏輯和記憶等四項核心能力上均實現(xiàn)了顯著的提升。與此同時,OpenAI的ChatGPT也經(jīng)歷了一次重大升級,除了多模態(tài)視覺能力、DALL·E 3以及語音合成API的開放。最引人注目的升級是,為每個用戶提供了一種名為GPTS的工具,使用戶能夠構(gòu)建專屬的GPT模型。
微軟公司創(chuàng)始人比爾·蓋茨公開表示,自1980年首次看到圖形用戶界面以來,以GPT為代表的大模型是他所見過的最具革命性的技術(shù)進(jìn)步。對于大模型未來的產(chǎn)業(yè)發(fā)展趨勢和面臨的挑戰(zhàn)究竟如何,我們可以從三個方面進(jìn)行探討。
我們在《崛起的超級智能》一書中提出,生物的競爭本質(zhì)上是種群知識庫的競爭。在過去的幾億年里,恐龍因為滅絕導(dǎo)致種群知識庫消失為0,鯊魚一直保持在海洋中游蕩,種群知識庫沒有發(fā)生大的變化,熊貓因為趨于滅絕從而種群知識庫不斷萎縮。
只有人類在近200萬年里,在知識和智慧上不斷擴(kuò)展和加速,在最近數(shù)百年里隨著蒸汽機(jī)、工業(yè)革命、核能的出現(xiàn),人類種群知識庫出現(xiàn)了巨大的增長。特別是互聯(lián)網(wǎng)誕生后,第一次將人類的種群知識庫外化成一個龐大的網(wǎng)絡(luò)知識庫,通過萬維網(wǎng)的發(fā)明進(jìn)一步促使人類種群知識庫急劇擴(kuò)容。表現(xiàn)在科技領(lǐng)域就是21世紀(jì)大量新科技新概念不斷涌現(xiàn)。
面對海量的互聯(lián)網(wǎng)公共知識,如何索引就成了人類必須解決的重要課題。20世紀(jì)90年代,搜索引擎出現(xiàn)了蓬勃發(fā)展,其中優(yōu)秀和典型的代表分別是谷歌和百度,它們成長背后的推動力也是人類種群知識庫發(fā)展的必然要求。
互聯(lián)網(wǎng)知識庫被索引之后,如何智能化也就成為了一個重要議題。在過去的近30年里,以谷歌、百度為代表的搜索引擎公司加大了智能化的步伐,人工智能的興起也與此有密切的關(guān)系。
2022年OpenAI的ChatGPT成功引發(fā)了大模型的興起,標(biāo)志著互聯(lián)網(wǎng)這個外化的人類種群知識庫完成了從索引化到智能化的轉(zhuǎn)變。但不能忘記的是,OpenAI ChatGPT的成功離不開谷歌提出的Transformer注意力機(jī)制模型,也離不開微軟通過Bing搜索引擎提供的海量數(shù)據(jù)和巨大資金支持。 從搜索引擎的發(fā)展看,通過激烈的競爭,搜索引擎最終形成了若干個巨頭公司為人類提供互聯(lián)網(wǎng)海量數(shù)據(jù)的索引服務(wù),同樣我們認(rèn)為作為搜索引擎的升級版,人類社會也不需要很多大模型提供同質(zhì)的服務(wù)。我們判斷包括搜索引擎、大數(shù)據(jù)、社交網(wǎng)絡(luò)等領(lǐng)域擁有優(yōu)質(zhì)大數(shù)據(jù)、人工智能技術(shù)積累和廣泛應(yīng)用場景的公司中,在未來的競爭中會脫穎而出一家或若干家為人類提供集中統(tǒng)一的智能服務(wù)。
其二,行業(yè)垂直大模型建設(shè)思路:繼續(xù)提升通用大模型智能水平。
應(yīng)該指出,當(dāng)前人類社會對大模型充滿了熱情,特別在中國,很多人希望大模型能夠與金融、法律、工業(yè)、農(nóng)業(yè)、電力、建筑等等行業(yè)領(lǐng)域結(jié)合,從而實現(xiàn)快速發(fā)展。
其實大模型的成功并不僅僅是參數(shù)量大,而是用大規(guī)模預(yù)訓(xùn)練+微調(diào)的方式,對海量的跨領(lǐng)域知識進(jìn)行學(xué)習(xí)時涌現(xiàn)出來新的能力,而且這些新的能力往往與創(chuàng)新有關(guān),如翻譯、創(chuàng)作文章、創(chuàng)作圖像等,然而這種創(chuàng)新能力并不穩(wěn)定,會出現(xiàn)“幻覺”和胡編亂造的情況。同時由于神經(jīng)網(wǎng)絡(luò)本身的特點,其可解釋性問題也一直沒有解決,因此對于需要精密控制或精確結(jié)果的產(chǎn)業(yè)領(lǐng)域,大模型并不是可靠的工具和技術(shù)。
還有一個誤區(qū)是,認(rèn)為用大模型的訓(xùn)練方法加上行業(yè)產(chǎn)業(yè)的大數(shù)據(jù)就可以形成高質(zhì)量的行業(yè)大模型。這個觀點并不符合大模型涌現(xiàn)出創(chuàng)新能力的規(guī)律,過于單一領(lǐng)域的知識反而會降低大模型涌現(xiàn)出新能力的水平。因此應(yīng)繼續(xù)提高ChatGPT、文心一言、LLama等等通用大模型的智能水平,通過通用大模型平臺與其他可靠性高的人工智能技術(shù)協(xié)同工作,并與各個行業(yè)結(jié)合,這種路徑要比建設(shè)專門的行業(yè)大模型更為穩(wěn)健和有效。
其三,值得期待的大模型未來。
大模型的不斷發(fā)展和與其他技術(shù)產(chǎn)品結(jié)合的過程將是持續(xù)探索和嘗試的過程。無論如何,大模型的出現(xiàn)的確是一個革命性的突破,有很多科學(xué)家認(rèn)同ChatGPT等大模型已經(jīng)可以突破圖靈測試,未來在智能和意識的基礎(chǔ)原理上也將帶來更多突破性的啟發(fā)。
在產(chǎn)業(yè)應(yīng)用上,大模型與其他不同類型的人工智能技術(shù)、網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)結(jié)合,與不同的辦公、學(xué)習(xí)、生產(chǎn)、生活結(jié)合會持續(xù)產(chǎn)生出具有非凡想象力的應(yīng)用。例如微軟辦公Office接入GPT-4,由AI驅(qū)動的 Microsoft 365 Copilot ,打破了傳統(tǒng)辦公軟件辦公的方式,能自動生成文檔、電子郵件、PPT。百度的文心行業(yè)大模型的數(shù)量已經(jīng)達(dá)到了 11 個,覆蓋能源電力、金融、航天、傳媒、影視、汽車、城市管理等多個領(lǐng)域,OpenAI計劃再推出GPT商店。這將類似于蘋果的App Store,讓開發(fā)者可以在商店中上架他們的自定義GPT,供其他用戶購買和使用。
雖然大模型有著令人驚嘆的智能表現(xiàn),但我們還需要耐心等待大模型的持續(xù)發(fā)育和成長,如果從以ChatGPT3.5為代表的大模型大規(guī)模向人類提供服務(wù)算起,畢竟它還是一個從出生來到全人類面前還不到1年的嬰兒。
-
OpenAI
+關(guān)注
關(guān)注
9文章
1033瀏覽量
6378 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1546瀏覽量
7360 -
大模型
+關(guān)注
關(guān)注
2文章
2274瀏覽量
2358
原文標(biāo)題:大模型的未來趨勢與挑戰(zhàn)
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論