年初以來,由ChatGPT掀起的人工智能浪潮,再一次催發(fā)了中國科技企業(yè)擁抱新興技術的熱情。不到半年時間里,百度“文心一言”、阿里“通義千問”、華為云“盤古”等國產(chǎn)自研AI大模型悉數(shù)登場。當科技巨頭們不約而同地踏上人工智能的新賽道,一場圍繞大模型的“軍備競賽”就在頃刻間拉開了序幕。
「通用」向左,「垂直」向右
過去幾個月,伴隨著ChatGPT的一路狂飆,AI大模型在中國的進化也來到了新的分野。一邊是通用大模型,因其經(jīng)過了海量數(shù)據(jù)參數(shù)和龐大語料的預訓練,在處理各種復雜任務時能夠表現(xiàn)出更好的泛化能力和更高的通用性,可以說是“書讀百遍其義自見”在人工智能時代的最好詮釋。 這其中,OpenAI十年磨一劍的GPT系列大模型堪稱珠玉在前。以ChatGPT為代表的大模型在邏輯推理、文本生成、自動編寫等方面展現(xiàn)出來的智慧與能力,一時間掀起了AI大模型的研發(fā)熱潮。從“通義千問”“知海圖”“百川智能”等一系列大模型產(chǎn)品的命名深意中,我們也不難發(fā)現(xiàn),重兵押注“通用大模型”已經(jīng)率先成為了國內(nèi)頭部廠商的共識。 而另一邊,以垂直行業(yè)廠商為代表的入局者們,則將目光放在了更大的產(chǎn)業(yè)領域中,力圖在角逐正酣的“百模大戰(zhàn)”中找到AI商業(yè)化落地的機會。這便是國產(chǎn)大模型的另一個重要方向——從行業(yè)應用的路徑切入,解決特定場景的業(yè)務需求。 不同于科技大廠們對基礎大模型技術和底層通用能力的狂熱追逐,這些行業(yè)廠商經(jīng)年累月地扎根產(chǎn)業(yè)的“神經(jīng)末梢”處,在特定行業(yè)沉淀了大量垂直領域數(shù)據(jù)和具體業(yè)務場景,可以更精準地錘煉出大模型的“專家”能力,有望加速推動“大模型”在千行百業(yè)場景中的廣泛應用。 據(jù)科技部新一代人工智能發(fā)展研究中心的《中國人工智能大模型地圖研究報告》顯示,截至上半年,中國已至少發(fā)布79個規(guī)模在10億級參數(shù)以上的基礎大模型,研發(fā)數(shù)量排名全球第二。但歷史的經(jīng)驗告訴我們,一項技術能否最終普及,關鍵是找到合適的應用場景,AI概莫能外。也因此,無論是在AI大模型賽道上已經(jīng)占得先機的頭部大廠,還是在垂直領域握有海量數(shù)據(jù)集和豐富場景理解的行業(yè)廠商,都不約而同地選擇了下探至產(chǎn)業(yè)更深處。場景化應用,大模型的「長坡厚雪」
毋庸諱言的是,盡管當前各方玩家對大模型的產(chǎn)業(yè)化都已展露出鮮明的共識,但在大模型落地應用的這最后一公里路程中,以科技大廠為代表的“通用派”和以行業(yè)廠商為代表的“垂直派”還是衍生出了兩條截然不同的分支。 以華為、百度、騰訊等為代表的頭部大廠,憑借在算法技術、行業(yè)數(shù)據(jù)、生態(tài)開放等方面的絕對領先優(yōu)勢,可以更快地搭建起大模型的產(chǎn)品應用及服務生態(tài),從而為大模型落地應用提供“底座”支撐和“引擎”之力。 從早前百度宣布打造全球首個一站式企業(yè)級大模型生產(chǎn)平臺;到阿里決定將旗下所有產(chǎn)品接入其自研的大語言模型“通義千問”、騰訊推出MaaS一站式行業(yè)大模型精選商店;再到“源于產(chǎn)業(yè)、服務產(chǎn)業(yè)”的京東言犀大模型、“不作詩,只做事”的華為云盤古大模型3.0等面向產(chǎn)業(yè)和行業(yè)場景的大模型相繼問世……無不預示著通用大模型開發(fā)的激流已經(jīng)遠去,一個“AI For Industries”的時代正在到來。 圖/拓維信息簽約成為華為云盤古大模型合作伙伴 大模型的產(chǎn)業(yè)化之路,起于大廠們“深入產(chǎn)業(yè)”的共識,興于行業(yè)廠商們“扎根場景”的躬耕。與頭部科技大廠的路徑不同,拓維信息等垂直行業(yè)廠商們則是因為有了更多“Know-how”能力的加持,可以基于通用大模型的底座適配行業(yè)數(shù)據(jù)和知識庫,打造出更有針對性、專業(yè)性、精準度的垂直大模型產(chǎn)品或解決方案,也得以在這條龐大產(chǎn)業(yè)鏈上找到安身之地。 例如,拓維信息交通CV大模型就是在華為云盤古大模型的基礎之上,結合自身在交通領域沉淀的訓練數(shù)據(jù)和行業(yè)知識庫,進行再訓練和精調打造出的交通行業(yè)垂直大模型。相比于傳統(tǒng)小模型開發(fā)往往要面臨模式耗時長、專業(yè)度要求高、訓練/調優(yōu)需要大量人工參與等限制,拓維信息交通CV大模型依托于“基礎模型預訓練+行業(yè)化調優(yōu)造”的新范式,使得模型精度提升了 6.21%,開發(fā)時間節(jié)約了24倍左右,大大降低了開發(fā)成本和難度。 圖/華為云盤古大模型生態(tài) 目前拓維信息交通CV大模型已在高速公路稽核等前端業(yè)務場景得到了正式應用。在“大模型能力”的加成下,稽核場景可以實現(xiàn)高速公路圖片的實時上傳和服務,通過智能壓縮,大幅提升圖片服務能力,助推稽核工作提質增效。 除此之外,在教育、醫(yī)療、氣象、采礦等眾多行業(yè)應用場景中,大模型賦能產(chǎn)業(yè)的相關能力也已開始實踐。也正是技術與場景的一次次交融,讓中國大模型產(chǎn)業(yè)迎來了具有變革意義的躍遷拐點,真正進化為“長坡厚雪”的理想賽道。Know-how,大模型落地最優(yōu)解
如果說大模型的上半場是“詩和遠方”。那么,在經(jīng)歷了AIGC熱潮一浪接一浪的卷積之后,國產(chǎn)大模型已經(jīng)走過了最初的技術狂熱期,在商業(yè)化落地的冷思考中開啟了“煙火日?!钡南掳雸?。誰能率先將大模型技術與產(chǎn)業(yè)具體場景結合,訓練出大模型的垂直化、行業(yè)化能力,帶來切實可落地的數(shù)字化轉型成效,誰就能爭取到AI 2.0時代更多的話語權和主動權。 隨著大模型作為新生產(chǎn)力的引擎形態(tài)越來越為人所熟知,源于產(chǎn)業(yè)側的“Know-how”能力,也逐漸成為各路參與方在這場大模型落地考中新的角力點。然而,“Know-how”能力的構建絕非一日之功。眾所周知,不同行業(yè)的數(shù)字化需求是模糊而龐雜的,這就對服務廠商的行業(yè)Know-how能力提出了更高要求。比起主打普惠適用的“全面型”能力,大模型要在千行百業(yè)應用場景中跑起來,更需要“Know-how”的深厚積累。 以拓維信息交通CV大模型為例。拓維信息從2019年開始深入交通行業(yè)數(shù)字化改造,持續(xù)探索AI技術在高速收費、稽核、隧道等具體業(yè)務場景中的應用及建設,針對特定場景需求先后推出AI稽核、數(shù)字視網(wǎng)膜解決方案、RPA工單機器人等多款基于AI的創(chuàng)新成果,在不斷的技術打磨和實踐迭代中累積起優(yōu)質的交通垂直場景數(shù)據(jù)集,最終以此為“養(yǎng)料”,訓練出交通CV大模型。在“模型+場景”的飛輪帶動下,拓維信息交通CV大模型在感光成像、特征提取、態(tài)勢感知、事件識別等方面的能力已得到較大提升,在交通行業(yè)場景展現(xiàn)出了巨大的應用潛力。 圖/拓維信息交通CV大模型在收費稽核場景的應用 誠然,從通識屬性來看,“領域專家型”的垂直大模型難以和“海納百川”的通用大模型抗衡。但站在產(chǎn)業(yè)的角度,新技術究竟能否突破原有的生產(chǎn)力邊界,最終還是要回到具體的應用場景中進行驗證。 可以肯定的是,在人工智能由“技術力”轉向“生產(chǎn)力”的這場商業(yè)化浪潮中,“通用”和“垂直”兩種路線從來都不是有你無我的對立關系,它們終將共同匯入產(chǎn)業(yè)的大江大河,漾出涓涓細流滋養(yǎng)每一方數(shù)字化土壤。一橫一縱之間,中國AI大模型的新版圖已經(jīng)顯現(xiàn)。本期拓客:脆脆
馬上寫完,真的。
往期推薦VOL.1沒有大算力的ChatGPT,不是好AIGC
VOL.2ChatGPT“狂飆”的終途:從模型中來,到場景中去
VOL.3不完美的AI,完美的數(shù)字助手
原文標題:占領垂直場景:國產(chǎn)AI大模型的下半場賽事
文章出處:【微信公眾號:拓維信息】歡迎添加關注!文章轉載請注明出處。
-
拓維信息
+關注
關注
0文章
240瀏覽量
5054 -
AI大模型
+關注
關注
0文章
307瀏覽量
276
原文標題:占領垂直場景:國產(chǎn)AI大模型的下半場賽事
文章出處:【微信號:talkweb1996,微信公眾號:拓維信息】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論