0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型應(yīng)用,必須警惕“速成幻覺”

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-07-26 09:08 ? 次閱讀

我們知道,大模型會編造不正確的答案,產(chǎn)生“幻覺”。

其實,在應(yīng)用層面,還存在一個更隱蔽的“幻覺”,就是創(chuàng)業(yè)公司忽略了大模型落地所需要的長周期、重基建和工程化難度,帶來的“速成幻覺”。

隨著“百模大戰(zhàn)”拉開序幕,大模型過剩帶來的市場擠壓,也給整個大模型生態(tài)帶來了行業(yè)洗牌的風(fēng)險。

越來越多的人有了共識,基礎(chǔ)通用大模型競爭激烈,注定是少數(shù)人的游戲。創(chuàng)業(yè)公司隨時可能倒掉,造成項目爛尾。

具備技術(shù)、產(chǎn)品和行業(yè)優(yōu)勢的“第一梯隊”大廠,比如百度的文心大模型3.5,已經(jīng)跟國內(nèi)其他模型拉開了差距,具有了一定的先發(fā)優(yōu)勢和市場打開度,更容易在這場白熱化競爭中生存下來。

既然大模型很難“速成”,那么創(chuàng)業(yè)公司的“幻覺”,又是從何而來的呢?

第一種“幻覺”:開源干翻閉源

創(chuàng)業(yè)公司紛紛入局大模型,給它們勇氣的,不是梁靜茹,而是開源。

以Meta的Llama 2、智譜AI的ChatGLM為代表的開源大模型,陸續(xù)免費并支持授權(quán)商用,這無疑是一件好事,讓創(chuàng)業(yè)公司不用重復(fù)造輪子,可以用開源大模型作為基座模型,快速開發(fā)出相應(yīng)的商用版本大模型或大模型應(yīng)用。

開源的低門檻、低成本,帶來了“開源干翻閉源”的幻覺。

為什么說是幻覺?我們可以從企業(yè)視角為出發(fā)點——即使有了開源模型,想要落地應(yīng)用大模型,還有哪些必要條件?

一是云基礎(chǔ)設(shè)施。

大模型落地需要進(jìn)一步微調(diào)、訓(xùn)練、運行,要在云平臺上運行。而創(chuàng)業(yè)公司跟OpenAI 、百度等閉源頭部公司的一大差距,就在于缺少跟云平臺的“緊耦合”。

眾所周知,OpenAI有微軟的大力支持,百度文心大模型背后是百度智能云,這些大廠自研大模型,都對云基礎(chǔ)設(shè)施的計算硬件集群、資源調(diào)度等,進(jìn)行針對性的協(xié)調(diào)優(yōu)化,大模型+AI云的緊密配合,可以更高效地利用計算資源,降低大模型的邊際成本。

wKgaomS_1r6AVOnaAABUJ9i0SDU031.jpg

海外大模型開源社區(qū)的“明星”如Together會為企業(yè)客戶提供開源模型及配套的云平臺,MosaicML也提供Mosaic Cloud 和多云混合服務(wù),國內(nèi)的開源項目如ChatGLM,也選擇與多家云廠商合作。

可以看到,開源項目跟云平臺的“松耦合”,會受到云平臺的配合度、商業(yè)政策等的影響,一旦后期出現(xiàn)資源漲價、利益分成、研發(fā)意向變化,都會給基于開源的大模型項目帶來商業(yè)化風(fēng)險。

其次,是二次開發(fā)。

基于開源模型的創(chuàng)業(yè)公司,往往是在底座模型的基礎(chǔ)上做一些微調(diào),靈活有余,但開源模型的分支多、變異快、創(chuàng)新迭代速度快,不承諾任何確定性,一般由程序員自組織來完成開發(fā),這就導(dǎo)致基于開源的大模型穩(wěn)定性不足,對客戶技術(shù)團(tuán)隊二次開發(fā)能力要求很高,選型難度也很大。

目前看,第一梯隊的大廠推出的基礎(chǔ)大模型,更能滿足企業(yè)對大模型穩(wěn)定性、可靠性的需求。

因為閉源大模型,遵循的不是開源范式,而是工程范式,所以,會以保證開發(fā)質(zhì)量為前提,對用戶需求進(jìn)行明確的描述,組織工程師按照規(guī)范的開發(fā)流程和周期,以確定的時間和預(yù)算,更好的控制開發(fā)質(zhì)量,保證開發(fā)效率。

開源是一件好事,但開源并不是一把萬能鑰匙。如果不解決基礎(chǔ)設(shè)施、二次開發(fā)等瓶頸,創(chuàng)業(yè)公司也無法靠開源,快速取得成功。

第二個“幻覺”:三五個人干翻大廠

因為開源,創(chuàng)業(yè)公司和互聯(lián)網(wǎng)企業(yè)都可以叫賣大模型,這就產(chǎn)生了第二個“幻覺”:三五個人的創(chuàng)業(yè)團(tuán)隊,就能干翻AI大廠。

需要注意的是,“百模大戰(zhàn)”帶來了白熱化的淘汰賽,同時,大模型還在以周為單位進(jìn)行迭代。

在激蕩的市場競爭中,具有長期研發(fā)能力和投入意愿的大廠,更容易保持動態(tài)的生長力和持久的話語權(quán),體現(xiàn)在幾個方面:

一是模型本身的技術(shù)城池。

谷歌研發(fā)人員此前曾發(fā)文稱,因為開源,谷歌和OpenAI都沒有護(hù)城河。這在長期看是對的,但大廠在大模型技術(shù)上的領(lǐng)先性,也是現(xiàn)實存在的優(yōu)勢,這個技術(shù)代差,足以在大模型的商用周期中,為大廠帶來顯著的競爭優(yōu)勢。

而且,大模型具有數(shù)據(jù)上的“飛輪效應(yīng)”,更早應(yīng)用、更多用戶的大廠大模型,會不斷拉大效果差距。比如國內(nèi)最早推向大眾的文心大模型,其3.5版本已經(jīng)在一些基準(zhǔn)測試中,超過了GPT3.5的表現(xiàn),而宣稱達(dá)到GPT-3.5的Llama 2剛開源不久,因此目前國產(chǎn)開源大模型最多也就達(dá)到GPT-3的水平。

二是持續(xù)迭代的成長能力。

大模型落地不是一蹴而就的,企業(yè)應(yīng)用大模型也不能上馬后很快不了了之,后續(xù)的算力成本、數(shù)據(jù)工程負(fù)擔(dān)、每一次迭代的資金壓力,很快就成為困擾很多大模型公司的頭疼問題。

目前,已經(jīng)有不少曾經(jīng)想走商業(yè)閉源路線的大模型創(chuàng)業(yè)公司,直接宣布退出競爭。光年之外中途離場,被美團(tuán)接手;Hugging Face專注賣算力資源和咨詢業(yè)務(wù),做大模型更多是“面子工程”。部分企業(yè)的表現(xiàn),也會直接影響到市場對其“是否有錢繼續(xù)做大模型”的信心。

從成長性看,有資金實力、基礎(chǔ)設(shè)施完整、商業(yè)表現(xiàn)良好的大廠,才能陪企業(yè)用戶走得更遠(yuǎn)。

比如“文心一言”3月16日推出以來,在一個月內(nèi)完成4次迭代,將推理成本降為原來的十分之一,離不開百度在大模型上的長期投入,以及人、錢、卡、基建等多種方面的儲備,才讓文心一言可以持續(xù)進(jìn)化,在高速迭代的大模型競爭中保持領(lǐng)先。

wKgZomS_1r6AeoMbAACeQFMMP20279.jpg

三是完善的工具鏈。

沒有人會否認(rèn),大模型是拿來用的,不是為了當(dāng)擺設(shè)或“公關(guān)效應(yīng)”的。

要用,就要考慮到技術(shù)和場景的適配。不同行業(yè)和企業(yè)對于大模型落地的需求,可能是完全不同的,這種差異化,需要更完善、全面的配套工具,來降低應(yīng)用門檻。舉個例子,行業(yè)+大模型需要進(jìn)行專有數(shù)據(jù)的清洗、標(biāo)注、向量化等工作,這個過程是非常復(fù)雜的。

三五人的創(chuàng)業(yè)團(tuán)隊,很難將主要研發(fā)力量,放在開發(fā)這些看上去技術(shù)含量不高、但對用戶十分重要的工具上。

這時候,百度等大廠長期押注AI的優(yōu)勢就凸顯出來了,已經(jīng)沉淀了從數(shù)據(jù)集、模型訓(xùn)練、開發(fā)部署等整套流程的工具,并且開箱即用,把大模型到產(chǎn)業(yè)落地的門檻不斷降低,從而開啟增長飛輪。

四是長期積累的行業(yè)Knowhow。

大模型產(chǎn)業(yè)化,走向ToB和ToG是大勢所趨,要求對行業(yè)Knowhow有深層次的理解。因此,政企客戶在大模型選型時,非??粗貜S商的成功案例和行業(yè)服務(wù)經(jīng)驗。

AI大廠在產(chǎn)業(yè)已經(jīng)深耕多年,因此大模型的商業(yè)開發(fā)度更高。目前,百度“文心大模型+飛槳深度學(xué)習(xí)框架”的組合已與300多家客戶合作,在400多個企業(yè)場景中取得良好測試效果,并打造了10多個行業(yè)大模型。

與之相比,還沒有走通產(chǎn)業(yè)場景的創(chuàng)業(yè)公司,在技術(shù)體驗、功能創(chuàng)新、工程能力等細(xì)節(jié)上,可能還需要花費更多時間去摸索。

從這些角度看,頭部大模型已經(jīng)建立起了較為明顯的優(yōu)勢,并且還在持續(xù)進(jìn)化。三五人的創(chuàng)業(yè)公司,想要在高速迭代的大模型競爭中干翻大廠,需要補的課有點多。

第三個“幻覺”:大模型能“賺快錢”

創(chuàng)業(yè)公司通過“資金換規(guī)?!钡亩唐娇鞈?zhàn)略,上市融資再套現(xiàn)離場,來兌現(xiàn)投資回報,已經(jīng)越來越難了,在大模型領(lǐng)域并不現(xiàn)實。那么,另一條路就是通過ToB客戶付費,來完成大模型的商業(yè)化。

眾所周知,ToB行業(yè)要干苦活累活。

企業(yè)客戶在業(yè)務(wù)場景中接入大模型,可能帶來一系列復(fù)雜的整合動作,是一個體系化工程,這就要求大模型廠商不能單一快節(jié)奏地交付,而要提供解決方案式的整體能力,以及長時間的更新運維服務(wù)。

一個項目的交付、運維、迭代、回款等,可能以年計,是無法快進(jìn)快出的。所以,大模型下沉到行業(yè),必須打消“賺快錢”的念頭,以長期主義的心態(tài)來做生意。

構(gòu)建服務(wù)團(tuán)隊、形成服務(wù)基因,對創(chuàng)業(yè)公司及其背后的投資機構(gòu)的耐心和定力來說,是不小的考驗。

與之相比,大廠在長期走向ToB/ToG市場的過程中,已經(jīng)經(jīng)歷了客戶的捶打,鍛煉出了更加成熟的服務(wù)鐵軍,也證明了自身的定力。

以百度為例,對于不同行業(yè),有深入了解客戶的交付、運維和保障專屬團(tuán)隊,在大模型落地應(yīng)用時,能夠給予更具針對性的方案,從而減少無效支出,讓大模型更好地幫助企業(yè)提質(zhì)增效。

大模型廠商不能一心只想“賺快錢”,要沉下心來走向產(chǎn)業(yè)深處。同樣的,企業(yè)引入大模型也不能一心只“圖便宜”,要從智能化轉(zhuǎn)型升級的這個生命周期出發(fā)算總賬,綜合考慮改造、交付、運維等多項成本。

大模型強大的理解能力和泛化能力,會加速產(chǎn)業(yè)智能化的進(jìn)程,也讓AI企業(yè)和創(chuàng)業(yè)公司發(fā)現(xiàn)了新的機會。

就像啤酒總是伴隨著泡沫,在一擁而上的大模型創(chuàng)投熱潮中,創(chuàng)業(yè)公司和企業(yè)客戶也很容易陷入“速成幻覺”。

大模型走向產(chǎn)業(yè)的長路,更需保持冷靜和理性,警惕“爛尾”風(fēng)險。希望大家真正飲下的,是用時間和技術(shù)沉淀的精釀,而非隨時可能消失的“泡沫”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266221
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6928
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    123

    瀏覽量

    1148
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2136

    瀏覽量

    1979
收藏 人收藏

    評論

    相關(guān)推薦

    TaD+RAG-緩解大模型幻覺”的組合新療法

    TaD:任務(wù)感知解碼技術(shù)(Task-aware Decoding,簡稱TaD),京東聯(lián)合清華大學(xué)針對大語言模型幻覺問題提出的一項技術(shù),成果收錄于IJCAI2024。 RAG:檢索增強生成技術(shù)
    的頭像 發(fā)表于 07-16 15:01 ?1709次閱讀
    TaD+RAG-緩解大<b class='flag-5'>模型</b>“<b class='flag-5'>幻覺</b>”的組合新療法

    阿里達(dá)摩院提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達(dá)摩院(湖畔實驗室)攜手新加坡南洋理工大學(xué)等研究機構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大模型在回答知識型問題時的準(zhǔn)確率,并顯著降低了所謂的“幻覺
    的頭像 發(fā)表于 05-10 11:46 ?560次閱讀

    【大語言模型:原理與工程實踐】大語言模型的應(yīng)用

    幻覺”。此外,大語言模型僅限于生成文字,無法獨立調(diào)用API以滿足多樣化需求。例如,當(dāng)詢問“查詢今天的天氣”時,它會拒絕請求,缺乏根據(jù)環(huán)境反饋調(diào)整行為的能力。動態(tài)調(diào)整行為及克服“幻覺”現(xiàn)象是大語言
    發(fā)表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的預(yù)訓(xùn)練

    進(jìn)行損失計算,得到下一個目標(biāo)的預(yù)測。也會設(shè)計一些其他輔助訓(xùn)練任務(wù),與主任務(wù)共同訓(xùn)練。選擇合適的預(yù)訓(xùn)練數(shù)據(jù)是確保模型性能和泛化能力的關(guān)鍵,通過對預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行混合配比,以確保能夠獲得全面均衡的訓(xùn)練。 預(yù)訓(xùn)練遇到的主要問題涉及訓(xùn)練穩(wěn)定性的問題,思維練如何出現(xiàn)幻覺現(xiàn)象,處理更
    發(fā)表于 05-07 17:10

    微軟下架最新大語言模型WizardLM-2,緣因“幻覺測試疏忽”

    對此,微軟技術(shù)人員在X平臺發(fā)表聲明,表示因?qū)π?b class='flag-5'>模型發(fā)布流程不夠了解,且忽略了幻覺測試環(huán)節(jié),導(dǎo)致模型被緊急下線。目前,開發(fā)團(tuán)隊正在全力以赴進(jìn)行測試,預(yù)計完成后將盡快重新上線。
    的頭像 發(fā)表于 04-22 14:15 ?343次閱讀

    Allegro SPB 16.3 版 PCB 畫板速成教材

    電子發(fā)燒友網(wǎng)站提供《Allegro SPB 16.3 版 PCB 畫板速成教材.pdf》資料免費下載
    發(fā)表于 02-29 09:30 ?6次下載

    利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?943次閱讀
    利用知識圖譜與Llama-Index技術(shù)構(gòu)建大<b class='flag-5'>模型</b>驅(qū)動的RAG系統(tǒng)(下)

    專補大模型短板的RAG有哪些新進(jìn)展?這篇綜述講明白了

    然而,盡管它們的能力令人印象深刻,但它們并非無懈可擊。這些模型可能會產(chǎn)生誤導(dǎo)性的 “幻覺”,依賴的信息可能過時,處理特定知識時效率不高,缺乏專業(yè)領(lǐng)域的深度洞察,同時在推理能力上也有所欠缺。
    的頭像 發(fā)表于 01-17 16:36 ?784次閱讀
    專補大<b class='flag-5'>模型</b>短板的RAG有哪些新進(jìn)展?這篇綜述講明白了

    華為云AI峰會揭示大模型實踐難題

    除此之外,還存在行業(yè)訓(xùn)練數(shù)據(jù)安全控制、大模型幻覺緩解消除及可解釋性、構(gòu)建具有強大邏輯推理規(guī)劃能力的大模型、基于圖數(shù)據(jù)的知識增強技術(shù)、通用結(jié)構(gòu)化數(shù)據(jù)特性對齊和預(yù)訓(xùn)練,以及視覺領(lǐng)域下一個token預(yù)測任務(wù)建模等挑戰(zhàn)。
    的頭像 發(fā)表于 12-25 10:33 ?686次閱讀

    LLM的幻覺問題最新綜述

    幻覺被描述為無意義或不忠實于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾,這些幻覺又進(jìn)一步分為內(nèi)在幻覺和外在幻覺。在LLMs中,幻覺的范圍包含
    的頭像 發(fā)表于 11-22 17:40 ?897次閱讀
    LLM的<b class='flag-5'>幻覺</b>問題最新綜述

    求助,有什么學(xué)習(xí)匯編語言的速成好方法嗎?

    有什么學(xué)習(xí)匯編語言的速成好方法嗎?
    發(fā)表于 11-03 07:32

    全球首款支持 8K(8192)輸入長度的開源向量模型發(fā)布

    在大模型時代,向量模型的重要性進(jìn)一步增強。尤其是在檢索增強生成(RAG)場景中,它成為了一個核心組件,用于解決大模型的上下文長度限制、幻覺問題和知識注入問題。
    的頭像 發(fā)表于 11-02 14:53 ?706次閱讀
    全球首款支持 8K(8192)輸入長度的開源向量<b class='flag-5'>模型</b>發(fā)布

    幻覺降低30%!首個多模態(tài)大模型幻覺修正工作Woodpecker

    視覺幻覺是常見于多模態(tài)大語言模型 (Multimodal Large Language Models, MLLMs) 的一個典型問題,它指的是"模型輸出的描述與圖片內(nèi)容不相符"
    的頭像 發(fā)表于 10-30 11:05 ?361次閱讀
    <b class='flag-5'>幻覺</b>降低30%!首個多模態(tài)大<b class='flag-5'>模型</b><b class='flag-5'>幻覺</b>修正工作Woodpecker

    美國海軍部發(fā)布生成式人工智能和大語言模型使用指南

    生成式AI智能工具并不一定可靠,可能會產(chǎn)生“幻覺”和有偏差的結(jié)果?!?b class='flag-5'>幻覺”是指產(chǎn)生的響應(yīng)包括或結(jié)合了看似真實的虛構(gòu)數(shù)據(jù)。因此,這類工具必須經(jīng)過嚴(yán)格的審查,包括利用人類專業(yè)知識進(jìn)行批判性思考。
    的頭像 發(fā)表于 10-29 10:44 ?1364次閱讀

    最新研究綜述——探索基礎(chǔ)模型中的“幻覺”現(xiàn)象

    這種“幻覺”現(xiàn)象可能是無意中產(chǎn)生的,它可以由多種因素導(dǎo)致,包括訓(xùn)練數(shù)據(jù)集中存在的偏見、模型不能獲取最新的信息,或是其在理解和生成準(zhǔn)確回應(yīng)時的固有限制。為了確保我們可以安全、有效地利用基礎(chǔ)模型,特別是在新聞、醫(yī)療和法律等需要事實準(zhǔn)
    的頭像 發(fā)表于 09-22 16:57 ?483次閱讀