0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型+搜索:一盤跳棋和三位選手

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-11-30 21:10 ? 次閱讀

我們都知道,大模型必須誕生應(yīng)用才有價值。那么,哪種應(yīng)用才能最快發(fā)揮出AI大模型的價值潛力,成為大模型落地的第一站?提起這個問題,很多人會首先回答:搜索。

這一方面是因為,在ChatGPT爆火之后,“大股東”微軟首先就將其能力融入到Bing搜索中,并且一度宣布要憑借大模型優(yōu)勢,把行業(yè)老大哥谷歌挑落馬下。那么在中國AI圈大規(guī)模復(fù)刻大模型的背景下,在應(yīng)用側(cè)也自然會想到首先推進搜索+大模型。

另一方面,搜索引擎天然有著與AI深度結(jié)合的優(yōu)勢。早在2014、2015年,百度和谷歌這些傳統(tǒng)搜索引擎巨頭就開始將深度學(xué)習(xí)、知識圖譜等AI技術(shù)融入搜索當(dāng)中,以此提升搜索引擎對用戶指令的理解能力,增強搜索結(jié)果的內(nèi)在關(guān)聯(lián)性。

由此可見,大模型+搜索,可謂是天時地利人和。經(jīng)過近一年時間的探索,中國AI行業(yè)的大模型+搜索應(yīng)用也逐漸豐富了起來。雖然大模型帶給搜索的改變并沒有徹底浮現(xiàn)出來,但已經(jīng)形成了較為多樣化的探索思路。

為了能讓大家更生動了解大模型+搜索的目前進展,理解不同思路的差異化。我們想了一個比喻:大模型+搜索,就像一盤跳棋。各位選手手里的棋子都是一樣的,即大模型技術(shù)與搜索技術(shù)。而他們的最終目標(biāo)是一致的,即孵化大模型時代的第一個爆款應(yīng)用。

但在下棋的過程中,各自的棋路卻有不同。目前來看,它們分為三個流派。

選手一:大模型作為搜索引擎的增強插件

搜索,是互聯(lián)網(wǎng)時代人與信息之間最為頻繁的接觸場景。搜索引擎既需要理解用戶意圖,也需要理解海量信息。作為信息與人之間的樞紐,搜索引擎提升智能水平的需求是永無止境的。

而大模型為搜索引擎帶來的差異在于,它不僅能夠加強傳統(tǒng)搜索引擎的體驗,還能夠通過AIGC模式帶來各種對用戶意圖與搜索結(jié)果的內(nèi)容生成能力。

舉個例子,大模型不僅能夠提高搜索精準(zhǔn)度,還可以把搜索出的多個結(jié)果合并生成到一個內(nèi)容框里,節(jié)省用戶時間。這相當(dāng)于在傳統(tǒng)的搜索框架外,給用戶了一些額外的搜索工具。

基于這種思路,業(yè)界開始探索大模型+搜索的第一種模式:把大模型能力,當(dāng)做搜索引擎的增強插件。在國內(nèi)市場上,這個流派的代表是百度。

搜索業(yè)務(wù),可以說是百度通過文心大模型能力進行產(chǎn)品改造的第一站。目前階段,百度已經(jīng)在搜索引擎中添加了兩種基于AIGC能力的“增強插件”。

首先,是在首條回答中進行信息聚合。

在AI技術(shù)與搜索結(jié)合的過程中,百度非常強調(diào)“首條搜索結(jié)果即滿足用戶需求”的理念。而大模型能力,可以將搜索結(jié)果進行關(guān)鍵信息的聚合,從而生成內(nèi)容摘要?;谶@種模式,百度在搜索引擎中更新了首條回答能力,其覆蓋范圍不僅是文字信息,還可以通過大模型對視頻進行理解從而歸納摘要。在這種模式下,加入用戶想要搜索的結(jié)果在視頻內(nèi)容中,用戶就可以不再去觀看視頻,而是通過首條回答直接得到視頻內(nèi)容的總結(jié)歸納。

百度公布的數(shù)據(jù)顯示,過去首條搜索滿足率只有40%左右,而在加入大模型能力后,這一比率達到了70%??梢姶竽P湍芰ψ鳛樗阉饕娌寮鞘斋@正向反饋的。

另一種“增強插件”式的大模型結(jié)合搜索,是在搜索欄之外專門提供一個AI對話欄,也就是百度搜索在今年5月移動生態(tài)大會上推出的“AI伙伴”能力。

AI伙伴可以與用戶進行AIGC問答,幫助用戶在使用搜索引擎時完成諸如答案標(biāo)記、提供信息來源、總結(jié)文檔概要等能力,同時還支持其他工具和服務(wù)的調(diào)用。

也就是說,百度在搜索引擎界面內(nèi),以及搜索引擎之外,都提供了基于大模型能力的AIGC插件,從而讓搜索引擎獲得多個角度的大模型重構(gòu)。無獨有偶,這一思路與谷歌將Bard聊天機器人整合到搜索引擎中非常相似

可見具有搜索引擎?zhèn)鹘y(tǒng)優(yōu)勢的廠商,更傾向于將大模型作為增強插件,多角度融入傳統(tǒng)搜索引擎這種“1+1大于2”的思路。

選手二:類ChatGPT的搜索應(yīng)用

在增強傳統(tǒng)搜索引擎能力之外,大模型還帶來了另一個問題:是否有可能繞開傳統(tǒng)搜索形態(tài),直接基于AIGC能力產(chǎn)生新的搜索產(chǎn)品?

在這種可能性上也出現(xiàn)了一些探索。ChatGPT本身即具備語義理解、多輪問答、內(nèi)容生成等能力,從某種程度上看,這也可以看作是一種“搜索”。只不過搜索的內(nèi)容從關(guān)鍵詞變成了提問和需求,搜索結(jié)果從網(wǎng)頁變成了直接生成文字內(nèi)容。

于是,中國AI行業(yè)中出現(xiàn)的一種新型搜索產(chǎn)品,可以被稱為類ChatGPT搜索。其中具有代表性的“參賽選手”,是昆侖萬維推出的天工AI搜索。

wKgaomVoiaeAALVpAAFwPv5P_uI006.jpg

這種搜索引擎完全以AIGC作為產(chǎn)品核心邏輯。用戶通過自然語言來表達需求意圖,隨后搜索界面反饋出相關(guān)答案,而不再像傳統(tǒng)搜索引擎一樣展現(xiàn)大量網(wǎng)頁鏈接。

相對來看,天工AI搜索的一個創(chuàng)新點在于信源索引。在使用ChatGPT等AIGC平臺時,我們經(jīng)常會面臨一個問題,就是AI回答內(nèi)容的不確定性。極多問題大模型都無法給出正確答案,甚至?xí)鷣y編造論據(jù)、文獻出處、新聞源等,也就是廣受吐槽的“AI一本正經(jīng)地胡說八道”。

而天工AI搜索則強調(diào)了生成答案的同時給出參考信息源,從而確保用戶能夠追溯信息的可參考性,極大規(guī)避了AIGC平臺的信任難題。并且其參考信息源也相對豐富,包含了新聞網(wǎng)站、知識問答平臺、視頻等。

但在目前階段,類ChatGPT搜索與AIGC平臺的界限還難以區(qū)分,用戶對其認知還不明確。這種模式有待于進一步的市場普及與用戶檢驗。

選手三:大模型落地垂類搜索

在搜索引擎格局相對穩(wěn)定之后,曾經(jīng)出現(xiàn)過這樣一種產(chǎn)業(yè)思路:通用搜索機會不大之后,搜索引擎可以在垂直搜索領(lǐng)域發(fā)力,從而夯實對該領(lǐng)域有持續(xù)搜索需求的用戶群。搜狗搜索、夸克,都曾經(jīng)在垂直搜索領(lǐng)域發(fā)力。其中夸克憑借垂直搜索能力,在年輕用戶群中獲得了不錯的成績。

大模型+搜索的第三種思路,是將大模型率先落地在垂直搜索當(dāng)中。以此強化具體搜索領(lǐng)域的自然語言理解能力與信息檢索體驗。在這個領(lǐng)域,目前的代表選手是夸克。11月14日,阿里巴巴智能信息事業(yè)群發(fā)布了夸克大模型。立足于自身的差異化定位,夸克大模型應(yīng)用會優(yōu)先落地在專業(yè)搜索等信息服務(wù)領(lǐng)域。而除了基礎(chǔ)的大語言模型之外,夸克大模型還將衍生出醫(yī)療、教育等垂類模型,可見夸克對專用知識領(lǐng)域的重視程度。

目前來看,醫(yī)療、教育、人文社科,是大模型落地垂直搜索的幾個主要方向。這幾個方向都對信息源有著極強的要求,并且存在關(guān)鍵詞模糊、有效信息較少、邏輯性較強等特點,相比于通用類搜索來說,更加適合大模型發(fā)揮出自己的特性。同時,優(yōu)先將大模型與垂直搜索進行結(jié)合,也可以很好地降低產(chǎn)品成本,提升大模型的應(yīng)用于搜索領(lǐng)域的整體效率。

事實上,還有一種垂類搜索與大模型結(jié)合的變體,就是各家網(wǎng)盤目前都在上線具備自然語言理解能力的搜索功能??梢酝ㄟ^模糊描述、形容詞等關(guān)鍵信息來檢索網(wǎng)盤資料,尤其是對圖片、視頻等內(nèi)容進行搜索。

都是超級應(yīng)用的跳板

那么問題來了,到底哪種模式才是大模型+搜索的正確解答呢?

不好意思,答案只能是虛席以待。

大模型+搜索,是一個在邏輯上非常具有前景的大模型落地場景。因此在ChatGPT剛剛開始爆火后,微軟就將大模型能力打造為BingChat,并對谷歌搜索放出了諸多狠話。但時間過去了快一年,微軟已經(jīng)將很多AI能力剝離出了搜索業(yè)務(wù),而谷歌的市場霸主地位也沒有受到什么影響。可見這一場景從理論到實踐,還有不斷的路要走。

wKgaomVoiaiAcD5uAADv_EB6WZA182.jpg

回望國內(nèi)市場,會發(fā)現(xiàn)三種探索模式還各自為戰(zhàn),并沒有產(chǎn)生太多交鋒,在用戶側(cè)也沒有掀起對大模型+搜索的普遍認知,甚至其落地程度遠不如類ChatGPT的對話應(yīng)用本身。究其原因,可以發(fā)現(xiàn)三點:

1.這三種大模型+搜索的嘗試,都沒有完成產(chǎn)品形態(tài)從0到1的突破。而生在此前的搜索引擎、AI對話產(chǎn)品上進行加強和補完,因此不具備非常引人關(guān)注的產(chǎn)品爆發(fā)點。

2.目前階段,大模型對搜索體驗的提升在大眾用戶端體驗感不強。其更多只能作為學(xué)術(shù)、IT等領(lǐng)域的專業(yè)工具。

3.除此之外,大模型+搜索的商業(yè)化空間并不明晰。加入大模型技術(shù)之后,搜索產(chǎn)品的商業(yè)模式與商業(yè)化水平都沒有發(fā)生較大的變化,因此受到資本市場的關(guān)注不足。

長遠來看,大模型+搜索的最終目標(biāo),一定是形成大模型時代的超級應(yīng)用。如同互聯(lián)網(wǎng)時代搜索引擎的出現(xiàn)一樣,徹底改變?nèi)藗兊男畔@取與交互模式。

而如果以此為目標(biāo),今天的大模型+搜索探索必然還是棋子行進路上的跳板。也只有讓棋子持續(xù)跳下去,未來某個節(jié)點才可能發(fā)生質(zhì)變。

只要能讓大模型和搜索互為動力,持續(xù)跳向前方,那么前景中的光明依然遠大于黑暗。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29820

    瀏覽量

    268111
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1547

    瀏覽量

    7362
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2278

    瀏覽量

    2360
收藏 人收藏

    評論

    相關(guān)推薦

    如何利用大型語言模型驅(qū)動的搜索為公司創(chuàng)造價值

    ,IlanaGolbinBlumenfeld和JacobT.Wilson等三位PwC合伙人,在《如何利用大型語言模型驅(qū)動的搜索為公司創(chuàng)造價值》書中,探討大型語言模型(LL
    的頭像 發(fā)表于 10-13 08:07 ?104次閱讀
    如何利用大型語言<b class='flag-5'>模型</b>驅(qū)動的<b class='flag-5'>搜索</b>為公司創(chuàng)造價值

    NVIDIA榮登《財富》“100家最適合工作的公司”榜單第三位

    NVIDIA 在《財富》雜志和卓越職場(Great Place to Work)最新評選出的“100 家最適合工作的公司”榜單上躍居第三位。
    的頭像 發(fā)表于 10-10 09:27 ?310次閱讀

    貼片電阻的阻值如何識別?每個廠家都樣的嗎?

    貼片電阻的阻值識別方法主要有以下幾種: 阻值識別方法 數(shù)字編碼法: 三位數(shù)字編碼:前兩位數(shù)字代表電阻值的有效數(shù)字,第三位數(shù)字表示乘數(shù)(即10的冪次方)。例如,“103”的電阻阻值為10 × 10^3
    的頭像 發(fā)表于 09-19 15:33 ?331次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統(tǒng)搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網(wǎng)絡(luò)、知識庫、大模型大支柱。借助首創(chuàng)的 CoE 技術(shù)架構(gòu),360AI
    的頭像 發(fā)表于 09-09 13:44 ?367次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b>成為全球增速最快的AI<b class='flag-5'>搜索</b>引擎

    電商搜索革命:大模型如何重塑購物體驗?

    自我介紹:京東零售搜推算法部算法工程師,專注于大模型技術(shù)以及在 AI 助手搜推等領(lǐng)域的應(yīng)用探索和實踐。在 AI 助手,NLP 和搜索領(lǐng)域有十多年研發(fā)實踐經(jīng)驗,在 AI/NLP 領(lǐng)域申請超過 15
    的頭像 發(fā)表于 08-19 15:09 ?230次閱讀

    三位半和四半萬用表的區(qū)別

    三位半和四半萬用表是電子測量領(lǐng)域中常用的兩種數(shù)字萬用表,它們在測量精度、顯示方式、應(yīng)用范圍等方面存在定的差異。本文將從多個方面詳細分析這兩種萬用表的區(qū)別。 、基本概念
    的頭像 發(fā)表于 07-14 14:23 ?4418次閱讀

    AI搜索新貴彎道超車難

    ,尤其國內(nèi)市場,百度家獨大的態(tài)勢已維持了近20年。不過,AI大模型的到來,打破了這僵局。2024上半年,AI搜索正成為新共識并迎來了
    的頭像 發(fā)表于 07-09 08:05 ?231次閱讀
    AI<b class='flag-5'>搜索</b>新貴彎道超車難

    極化繼電器的三位置式的特點是什么

    極化繼電器是種特殊類型的繼電器,它具有個位置:正常位置、極化位置和反極化位置。這種繼電器廣泛應(yīng)用于電力系統(tǒng)、自動化控制、通信設(shè)備等領(lǐng)域。本文將詳細介紹極化繼電器的三位置式的特點,包括其工作原理
    的頭像 發(fā)表于 06-24 09:34 ?355次閱讀

    鐵威馬推出128TB容量4+4硬盤柜

    D8 Hybrid包括四個SATA和四個M.2NVMe,SATA最高支持24TB機械硬盤,而M.2
    的頭像 發(fā)表于 05-06 11:45 ?530次閱讀

    蘋果與谷歌探索iOS/iPadOS引入Gemini模型

    確認Apple與Google確已開啟會談,下代iPhone或?qū)⒋钶dGemini的生成式AI模型。三位知情人士表示,如今的談判尚屬初級階段,潛在交易的具體細節(jié)暫未確定。
    的頭像 發(fā)表于 03-20 10:38 ?441次閱讀

    新火種AI|從GPT-5到AI芯片廠,山姆·奧特曼在下一盤多大的棋?

    標(biāo)題:從GPT-5到AI芯片廠,山姆·奧特曼在下一盤多大的棋? 轉(zhuǎn)發(fā)語:山姆·奧特曼暴露野心,同時挑戰(zhàn)英偉達和臺積電?
    的頭像 發(fā)表于 01-26 09:54 ?353次閱讀
    新火種AI|從GPT-5到AI芯片廠,山姆·奧特曼在下<b class='flag-5'>一盤</b>多大的棋?

    三位通電磁閥基本結(jié)構(gòu)及工作原理

    三位通電磁閥是種常用的控制執(zhí)行元件,廣泛應(yīng)用于各種自動化領(lǐng)域。它們通常用于控制液壓、氣動系統(tǒng)中的液體和氣體的流動,并實現(xiàn)各種不同的控制功能。本文將詳細介紹三位
    的頭像 發(fā)表于 01-24 11:00 ?4892次閱讀

    matlab怎么取三位數(shù)的每一位

    在MATLAB中,可以使用些基本的算術(shù)和邏輯運算來取得三位數(shù)的每一位。下面是種基本的方法: 步驟1: 輸入
    的頭像 發(fā)表于 12-28 14:44 ?2085次閱讀

    請問ADXL355 0X24 REGISTER中的ACT_Z ACT_Y ACT_X是干么用的,測量軸加速度值時需要將這三位都設(shè)置為1嗎?

    請問ADXL3550X24 REGISTER中的ACT_ZACT_YACT_X是干么用的,測量軸加速度值時需要將這三位都設(shè)置為1嗎?謝謝!
    發(fā)表于 12-28 07:21

    Holtek HT45F5Q 控制三位數(shù)七段顯示器 請益

    我用Holtek HT45F5Q 控制三位數(shù)七段顯示器,透過根PIN來控制 目前沒辦法個顯示不同的數(shù)字,想請教各位大大有沒有想法或是我的程式上有問題,謝謝
    發(fā)表于 12-18 15:48