0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型產(chǎn)品化,不過是三支舞

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-06-13 09:27 ? 次閱讀

今天,擺在全球數(shù)百個AI大模型面前的,是一個共同的問題:如何賺錢。

無論模型誕生地在中國還是美國,無論屬于通用大模型還是垂直大模型,商業(yè)化可以說是這項技術(shù)在全球范圍內(nèi)共同面對的問題。

在大模型最初所帶來的震驚與喜悅過后,是大量AIGC平臺走向免費開放,大模型toB服務(wù)大打價格戰(zhàn)?;臃倍嗟拇竽P?,似乎始終無法激活用戶的付費欲望。

而大家都知道,商業(yè)化的前提是產(chǎn)品化。雖然大模型帶來的AIGC能力本身就有著非常強烈的產(chǎn)品化屬性,但以一種軟件應用來說,它還是過于粗陋和黑箱了。用戶需要自己去探索AIGC究竟能帶來什么,可能性有哪些,從而很難獲得確定性的產(chǎn)品滿足。另一方面,大模型在技術(shù)上的潛力也沒有被充分挖掘。一些需要在產(chǎn)品設(shè)計層面放大的基礎(chǔ)能力,還靜靜地躺在平臺那一長串功能簡介里。

于是,在全球共享的商業(yè)化壓力下,大模型產(chǎn)品化開始提速。不分中美,無論是傳統(tǒng)科技巨頭還是新型AI公司,都開始在大模型產(chǎn)品化上發(fā)力,推出了五花八門,千姿百態(tài)的大模型產(chǎn)品化策略。

這種情況導致很多朋友會有點迷茫。放眼望去,感覺每家廠商都在做不一樣的AI產(chǎn)品,提出全新的AI概念。但仔細想象,好像又說不出究竟哪里不同。

為了幫大家克服這種亂花漸欲迷人眼的“AI眩暈感”,我們盤點了目前大模型產(chǎn)品化的三種主要思路。

看不懂大模型產(chǎn)品化的諸多套路不要緊。我們只需要記住,今天的大模型,其實就是在跳三支舞。

通往全模態(tài)的胡旋舞

那些國際AI巨頭眼里的AI產(chǎn)品大概長什么樣,這個問題已經(jīng)漸漸有了答案:他們可能希望AI跟真人差不太多

不久之前,OpenAI和谷歌接連發(fā)布了新的AI產(chǎn)品,也就是OpenAI最新的旗艦大模型GPT-4o,和谷歌的Project Astra。它們的共同點,是都加入了跨文本、音頻與視覺的信息收集能力。換言之,大模型正在從只能聽、讀、寫,變成同時也能看和說。用戶與大模型之間的交互模式,也在越來越像與真人之間的交互模式,而且大模型可以在200到300毫秒的區(qū)間內(nèi)響應音頻輸入,這已經(jīng)與人類之間的交流速度大體相同。

wKgZomZpq7CAGT49AAB2tOGi6aw635.jpg

GPT-4o被稱作OpenAI有史以來最為產(chǎn)品化的一款應用,就是因為它更加重視與用戶之間的互動體驗,打磨了諸如響應速度、具體使用功能等被定義在產(chǎn)品側(cè)的細節(jié)。更重要的是,GPT-4o開創(chuàng)了一種新的產(chǎn)品模式:它比語音助手的交互形態(tài)更多,作用更廣,同時比傳統(tǒng)的AI對話框模式降低了使用門檻,增加了使用場景。

這種AI產(chǎn)品的使用體驗,非常接近于跟真人打視頻電話。很難不讓人想到電影《Her》或者《鋼鐵俠》中的賈維斯,雖然在使用體驗上肯定不如它們,但產(chǎn)品邏輯已經(jīng)與科幻電影里對AI的使用想象一般無二。

我們有理由猜想,OpenAI在AI產(chǎn)品化上的思路,就是比對著科幻作品來進行設(shè)計的,只不過他們恰好有機會把科幻變成現(xiàn)實。

這種“類視頻電話”的大模型產(chǎn)品模式,本質(zhì)上是將不同的AI感知、理解、生成能力進行融合,就像胡旋舞會越轉(zhuǎn)越快,隨著大模型的不斷發(fā)展,AI技術(shù)也在越轉(zhuǎn)越快,把不同模態(tài)下的信息收集能力與內(nèi)容生成能力都卷進來。

沿著這條路走下去,有理由相信接下來的主流AI產(chǎn)品會發(fā)生這樣的變化:

1.類似Sora的視頻生成能力,將很快融合到主流通用模型中。讓AI應用能夠同時聽、看、讀,并且能夠生成包括文字、代碼、音頻、圖片、視頻在內(nèi)的種種內(nèi)容。

2.垂直類的AI模型生存空間會越來越小,通用模型集成的能力不斷增多。就像GPT-4o里的“o”是Omni全能的意思。全能,將是AI產(chǎn)品主要的發(fā)展方式。

3.AI的記憶能力會越來越強,從而導致“全能+定制化”成為AI應用的主要發(fā)展思路。

雖然在目前階段,大模型在很多時候還是為了與搜索、繪圖、語音助手等能力結(jié)合。但隨著全模態(tài)感知,全模態(tài)理解,全模態(tài)生成的“三全大模型產(chǎn)品”不斷發(fā)展,大模型將不再是一種賦能技術(shù),而是更傾向成為獨立且全新的產(chǎn)品形態(tài)。

這個產(chǎn)品方向雖然還不成熟,但方向的確定卻意義重大。

類“視頻電話”的AI應用,可能是除了機器人管家之外,人類對AI的最根本想象。它的出現(xiàn)和發(fā)展,意味著AI時代最大的一座海底金礦正浮出水面。

類ChatGPT應用的集體舞

如果大模型是一支足球隊,OpenAI這樣的公司在前場進行突破,那么更多的AI公司、科技公司則需要在中場進行競爭。在ChatGPT爆火之后,OpenAI開始在智能體、文生視頻模型、全模態(tài)模型等領(lǐng)域發(fā)展,但大量借著這個機會入局大模型的公司,則更多是在打磨自己的類ChatGPT應用。經(jīng)歷了漫長的內(nèi)測之后,如今大量聊天對話框模式的AIGC應用走向公眾。這時候問題來了,投入了這么多,也終于可以面向C端用戶開放了,如此費勁,最后要怎么賺錢呢?

于是我們正在目睹非常奇特的一幕:以國產(chǎn)大模型陣營為代表的大量AI項目,都集中在了類ChatGPT模式這個環(huán)節(jié)上。向前走的文生視頻等應用還沒有完成研發(fā),而環(huán)顧左右則會發(fā)現(xiàn)大家的能力大同小異,動作整齊劃一,只有概念口號是個喊個的。

無論是叫AI助手、智能平臺、智能對話還是智能搜索,本質(zhì)上這些大模型產(chǎn)品都是類ChatGPT應用。從最早的文心一言,到通義千問、豆包、Kimi、騰訊元寶、訊飛星火、天工,市場已經(jīng)充斥了太多的類似產(chǎn)品,大模型變成了一場貨真價實的集體舞。

有一個囚徒困境正在困擾著所有這類產(chǎn)品:想要收費來回收研發(fā)成本,但又怕收費引起用戶不滿,把用戶推向競品;想要通過技術(shù)能力來實現(xiàn)差異化,但又拿不出真正具有說服力的技術(shù)方案,于是只能在概念、名稱、噱頭上下一番功夫。

為了擺脫這個困境,類ChatGPT應用們也找到了一些產(chǎn)品化方案,我們可以做個總結(jié):

1.開始強調(diào)類GPTs模式,以智能體撬動市場升級。

俗話說得好,大模型+對話就是開個場,真正賣票還得看智能體??啥ㄖ苹哂袑I(yè)能力的智能體,被認為是大模型商業(yè)化的真正歸宿。面向這個可能性,各家廠商也開始了自己的探索,包括OpenAI打造了GPTs模式也是如此。

wKgaomZpq7GAbctjAAJw6b__keg454.jpg

比如說,文心大模型已經(jīng)正式落地了智能體能力,推出了文心智能體平臺;火山引擎也公布了一站式AI應用開發(fā)平臺扣子。基礎(chǔ)的AIGC對話免費+高階智能體收費的產(chǎn)品模式,是接下來大模型商業(yè)化的主要考慮方向。

wKgZomZpq7KALmv9AABFBQQgXkY085.jpg

2.把類ChatGPT產(chǎn)品作為流量入口。

另一種類似應用的產(chǎn)品化建設(shè)思路,是大入口+小收費窗口的互聯(lián)網(wǎng)模式,即整體產(chǎn)品免費,但一些特定的功能可能需要開通會員或者使用代幣。收費功能可能相對比較專業(yè),瞄準特定需求人群,或者比較新奇好玩,調(diào)動用戶的獵奇嘗鮮心理。

這種模式的問題在于,會把整個產(chǎn)品變得越來越復雜。用戶會有一種在玩免費手游一樣的“被套路感”。而且整個入口的生態(tài)建設(shè)也需要更清晰的交互思路,以免用戶剛剛接觸大模型就面對非常復雜,到處都是收費入口的交互邏輯。

3.把類ChatGPT應用與自身優(yōu)勢結(jié)合。

第三種相關(guān)產(chǎn)品的建設(shè)方案,是結(jié)合這些平臺類企業(yè)其他的優(yōu)勢項目,從而期望達到1+1>2的效果,至少要將一部分原有平臺的用戶綁定到大模型應用上。比如百度就強調(diào)將搜索、文庫、網(wǎng)盤等應用與大模型結(jié)合,以各種方式調(diào)用文心大模型。騰訊元寶則宣布將與公眾號創(chuàng)作生態(tài)進行結(jié)合,成為創(chuàng)作助手。

wKgaomZpq7KAEjCRAAYJcngXEHA362.jpg

這種生態(tài)矩陣玩法,是互聯(lián)網(wǎng)產(chǎn)品的一貫思路,但用戶是否能夠由此產(chǎn)生與大模型應用的粘性,是一件需要長期考量的事情。

我們必須尷尬地承認,曾經(jīng)風頭無兩的ChatGPT,也已經(jīng)在嘗鮮期過去之后漸漸淡出了用戶熱情追捧的區(qū)間。用戶更希望看到的是非常生動、好玩,能夠引發(fā)流行趨勢的AI應用,而不僅僅是生硬的對話框。

類ChatGPT應用真正的產(chǎn)品化春天,或許在于打破固化的AIGC對話聊天框架。把其能力抽取出來,變成更具有美感與傳播力的軟件產(chǎn)品。

畢竟集體舞里能被記住的,很有可能是不按規(guī)定動作的那一個。

擬人化的貼面舞

在這些大模型產(chǎn)品化的思路之外,還有一種思路應該得到重視,那就是將AI產(chǎn)品進行擬人。

不久之前,如何讓ChatGPT“越獄”搞一些奇怪事情的教程四處流竄,一些網(wǎng)友掀起了跟AI“談戀愛”的新時尚。無論我們怎么評價這些行為,必須意識到的是,人類對AI的基礎(chǔ)想象必須是擬人化、類人化的。也就是說,我們需要AI有名字,有個性,跟人類有共同記憶,而不是冷冰冰且萬能的對話機器。

從這個思路看,AI帶來的最大價值是情緒與情感價值。我們需要與人對話,與人分享,和他人建立聯(lián)系,但這個人可能也未必需要是真人。這種需求是客觀存在,且具有商業(yè)化潛力的。GPT-4o被指責侵權(quán)采用了明星的聲音等行為,其行為動機都是希望AI更加擬人,能夠讓用戶產(chǎn)生與真人進行對話的想象。

讓大模型擬人化,與用戶跳貼面舞,在接下來商業(yè)化壓力越來越大的局面下,很可能成為很多AI項目的重點選擇。

wKgZomZpq7OAMa64AAD_aww4rGI856.jpg

比如說,豆包大模型當中就推出了角色扮演模型,AI會模仿不同人設(shè)、不同性格的人來與用戶進行對話,并且可以通過智能體來自己設(shè)定聊天角色。

有人設(shè)的聊天,重點是多輪對話的記憶能力。這一點上,也有越來越多的大模型產(chǎn)品強調(diào)記憶能力,比如文心一言就強調(diào)多輪對話能力帶給用戶的沉浸體驗角色感。

技術(shù)難度小,價值可能很大,但容易觸碰法律法規(guī)與公序良俗的邊緣地帶。大模型擬人的產(chǎn)品化空間,應該會在未來得到越來越大的重視。由此可能輻射到的數(shù)字人主播、專屬AI助手等產(chǎn)品化形式,有著非常充裕的討論和想象空間。

大模型的產(chǎn)品化,目前整體處在一個高不成低不就的尷尬情況里。向上突破,技術(shù)代差依舊明顯,技術(shù)的未知領(lǐng)域情形不明;橫向競爭,同類大模型產(chǎn)品過多,已經(jīng)產(chǎn)生了讓人窒息的擠壓感;向下覆蓋,大多數(shù)互聯(lián)網(wǎng)用戶其實還對大模型應用沒有感覺,找不到使用與付費的必要性;彎道超車,搞一些擬人項目,還容易觸到各種雷區(qū)。

這種情況下,大模型的產(chǎn)品化必須戴著枷鎖跳舞,既要讓觀眾看到,又要小心舞臺上的荊棘。

或許在不遠的未來,一個或者幾個天才般的產(chǎn)品化創(chuàng)意,將解決一切大模型的苦厄。但在今天,做大模型產(chǎn)品的主旋律依舊是賠錢賺吆喝,打腫臉充胖子。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266195
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6917
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    332

    瀏覽量

    1372
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2134

    瀏覽量

    1971
收藏 人收藏

    評論

    相關(guān)推薦

    人工智能的第三支柱:數(shù)據(jù)存儲

    通過對基礎(chǔ)設(shè)施進行大量投資,來支持創(chuàng)新的應用和用例。我們大都對于時下GPU、CPU和內(nèi)存這類以計算為主的基礎(chǔ)設(shè)施有所耳聞,而數(shù)據(jù)存儲作為AI的“第三支柱”,也正對AI起到更為關(guān)鍵的作用。 ? ?對于文本的AI訓練相對簡單,但當轉(zhuǎn)向音頻、圖像以及視頻時,所
    的頭像 發(fā)表于 09-06 10:45 ?166次閱讀
    人工智能的第<b class='flag-5'>三支</b>柱:數(shù)據(jù)存儲

    車輛動力學仿真模型的可信度評估方法

    隨著汽車智能、網(wǎng)聯(lián)以及自動駕駛技術(shù)的快速發(fā)展,安全問題逐漸凸顯,基于三支柱法的測試是驗證安全的有效手段,其中仿真測試具備場景可量化、可復現(xiàn)、場景覆蓋率高、場景可定制和可控等特點,具備效率高
    的頭像 發(fā)表于 08-06 14:50 ?365次閱讀
    車輛動力學仿真<b class='flag-5'>模型</b>的可信度評估方法

    基于大模型的仿真系統(tǒng)研究一——維重建大模型

    一 基于大模型的仿真系統(tǒng)框架 ? ?傳統(tǒng)的仿真測試驗證普遍基于場景,而場景的構(gòu)建主要由道路和場景編輯器來人工搭建靜態(tài)場景和動態(tài)場景,這種方式費時費力,而且也大大限制了場景要素組合的豐富。針對此痛點
    的頭像 發(fā)表于 07-30 14:51 ?865次閱讀
    基于大<b class='flag-5'>模型</b>的仿真系統(tǒng)研究一——<b class='flag-5'>三</b>維重建大<b class='flag-5'>模型</b>

    PinFin Cooling Master合一水道測試系統(tǒng)

    功能和用途用來測試帶針翅式pinfin功率器件模塊的PinFinCoolingMaster合一水道。產(chǎn)品優(yōu)勢三支路同時使用,可監(jiān)控出水口溫度,可獨立控制三支路的流量。安裝采用快拆方式
    的頭像 發(fā)表于 07-19 08:35 ?169次閱讀
    PinFin Cooling Master<b class='flag-5'>三</b>合一水道測試系統(tǒng)

    【定制配件】PinFin Cooling Master一體臺架測試系統(tǒng)

    合一水道,帶振翅式pinfin功率器件一串三支路水道。產(chǎn)品優(yōu)勢一體臺架測試系統(tǒng)滿足多種不同類型的工裝的測試需求,實現(xiàn)一機多用。拆卸安裝非常方便,臺架內(nèi)部設(shè)計傾斜角度方便
    的頭像 發(fā)表于 07-13 08:35 ?139次閱讀
    【定制配件】PinFin Cooling Master一體<b class='flag-5'>化</b>臺架測試系統(tǒng)

    基于MATLAB 的質(zhì)量守恒空模型(JFO 模型

    可有大佬會基于MATLAB 的質(zhì)量守恒空模型(JFO 模型
    發(fā)表于 07-05 23:32

    使用esp-dl中的example量化我的YOLO模型時,提示ValueError: current model is not supported by esp-dl錯誤,為什么?

    結(jié)構(gòu),我的模型中,只用了con2d, batchnormal, leakyrelu,convtranspos2d,add,concat 這些算子esp-dl中的量化算子規(guī)范都是支持的,不知道為什么還會提示不支持。 我使用的是esp-dl-release-1.1分,esp
    發(fā)表于 06-28 06:47

    模型,站在“向下競底”和“向上定價”的分岔路口

    缺少“向上定價”的實力,降價不過是“殺雞取卵”的游戲
    的頭像 發(fā)表于 05-21 17:04 ?1852次閱讀
    大<b class='flag-5'>模型</b>,站在“向下競底”和“向上定價”的分岔路口

    【大語言模型:原理與工程實踐】大語言模型的評測

    產(chǎn)品化提供了有力的數(shù)據(jù)支持。 對于生活閑聊類評測任務(wù),模型的回答主要從人性程度、內(nèi)容質(zhì)量和社交適應性個方面進行考察。這些方面共同反映了模型
    發(fā)表于 05-07 17:12

    【大語言模型:原理與工程實踐】大語言模型的預訓練

    訓練數(shù)據(jù)時,數(shù)量、質(zhì)量和多樣性者缺一不可。 數(shù)據(jù)的多樣性對于大語言模型至關(guān)重要,這主要體現(xiàn)在數(shù)據(jù)的類別和來源兩個方面。豐富的數(shù)據(jù)類別能夠提供多樣的語言表達特征,如官方知識型數(shù)據(jù)、口語表達的論壇
    發(fā)表于 05-07 17:10

    廣場擾民問題能用廣場定向音響智慧桿解決嗎?

    廣場擾民問題能用廣場定向音響智慧桿解決嗎?在回答這個問題之前,我們先來簡單了解一下什么是廣場定向音響智慧桿,它是一種基于智慧桿的具有方向性的擴音設(shè)備,它利用聲學原理中的指向性效應,通過聲學波束
    的頭像 發(fā)表于 04-20 22:20 ?272次閱讀
    廣場<b class='flag-5'>舞</b>擾民問題能用廣場<b class='flag-5'>舞</b>定向音響智慧桿解決嗎?

    廣場音箱藍牙音響上應用的數(shù)字功放

    數(shù)字功放是一種利用數(shù)字信號處理技術(shù)來實現(xiàn)音頻放大的設(shè)備;徹底改變了傳統(tǒng)模擬功放的局限性;在音響領(lǐng)域中的應用日益廣泛;對于廣場音響藍牙音箱來說,采用數(shù)字功放能使音質(zhì)更加清晰、音量更大、功耗更低
    的頭像 發(fā)表于 04-08 10:41 ?392次閱讀
    廣場<b class='flag-5'>舞</b>音箱藍牙音響上應用的數(shù)字功放

    泰來維|文物維掃描,文物模型怎樣制作

    文物維掃描,文物模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒?,需要文?b class='flag-5'>三維數(shù)字保護,所以
    的頭像 發(fā)表于 03-12 11:10 ?438次閱讀
    泰來<b class='flag-5'>三</b>維|文物<b class='flag-5'>三</b>維掃描,文物<b class='flag-5'>三</b>維<b class='flag-5'>模型</b>怎樣制作

    人工智能十大趨勢預測:更多多模態(tài)、大模型端側(cè)部署加速!智能應用呈爆發(fā)式增長

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2023年在大模型技術(shù)的推動下,人工智能迎來新一輪發(fā)展高潮。經(jīng)過一年多時間的迅猛發(fā)展,現(xiàn)在人工智能大模型技術(shù)已經(jīng)相對成熟,接下來則是大模型產(chǎn)品化和商業(yè)
    的頭像 發(fā)表于 02-18 00:03 ?3542次閱讀

    成功轉(zhuǎn)型Fab-Lite模式 加速核心技術(shù)產(chǎn)品化 格科微發(fā)布系列5000萬像素圖像傳感器

    看見中國的創(chuàng)新為使命,格科微經(jīng)過二十年的發(fā)展,成功實現(xiàn)了從Fabless到Fab-Lite的戰(zhàn)略轉(zhuǎn)型,迎來了歷史最佳的經(jīng)營局面。值此良機,格科微高端產(chǎn)品再傳佳訊,公司推出款全新單芯片高階產(chǎn)品,為未來加速核心技術(shù)
    發(fā)表于 12-27 17:33 ?386次閱讀
    成功轉(zhuǎn)型Fab-Lite模式 加速核心技術(shù)<b class='flag-5'>產(chǎn)品化</b> 格科微發(fā)布系列5000萬像素圖像傳感器