0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型卷價格,向量數(shù)據(jù)庫“卷”什么?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-05-23 09:24 ? 次閱讀

“不是我不明白,這世界變化快”,崔健在20世紀(jì)寫下的這句歌詞,放在公有云市場也同樣適用。技術(shù)風(fēng)向的變化之快,讓不少人感到驚訝。

2023年初大模型、生成式 AI的起飛,也帶來了向量數(shù)據(jù)庫的爆火。投融資項目爆發(fā)式增長,頭部公有云廠商都推出了AI向量數(shù)據(jù)庫的相關(guān)產(chǎn)品。

然而一年狂飆之后,市場逐漸退潮,全球最著名的 AI 項目之一AutoGPT在2024年初宣布,不再使用向量數(shù)據(jù)庫。因此有人質(zhì)疑,向量數(shù)據(jù)庫又涼了?

不過,隨著5月份公有云廠商們掀起價格戰(zhàn),接連調(diào)低大模型API的價格,高性價比的大模型+向量數(shù)據(jù)庫,在行業(yè)應(yīng)用、企業(yè)市場又顯現(xiàn)出了一定的商業(yè)價值。

向量數(shù)據(jù)庫這一年的潮起潮落,究竟是火了還是涼了?大模型正在卷價格,向量數(shù)據(jù)庫又該卷什么?公有云廠商又在這一市場發(fā)揮了什么作用?今天我們就來聊聊這些問題。

向量數(shù)據(jù)庫,剛剛開始

新技術(shù)的火爆,必然會伴隨炒作和泡沫,但向量作為大模型理解世界的數(shù)據(jù)形式,向量數(shù)據(jù)庫作為AI革命重要基建的位置,長期來看是不會動搖的。

為什么這么說?

向量數(shù)據(jù)庫并不是一種特別新的數(shù)據(jù)庫技術(shù),在AI領(lǐng)域已經(jīng)應(yīng)用了七八年,谷歌在2015年就宣布使用RankBrain語義檢索來處理搜索任務(wù)。如果說數(shù)據(jù)庫是數(shù)據(jù)的“硬盤”,那么,向量數(shù)據(jù)庫就是更適合AI體質(zhì)的“硬盤”。

其“AI原生”的體質(zhì),具體表現(xiàn)在幾個方面:

1.更高的效率。AI算法,要從圖像、音頻和文本等海量的非結(jié)構(gòu)化數(shù)據(jù)中學(xué)習(xí),提取出以向量為表示形式的“特征”,以便模型能夠理解和處理。因此,向量數(shù)據(jù)庫比傳統(tǒng)基于索引的數(shù)據(jù)庫有明顯優(yōu)勢。

2.更低的成本。大模型要從一種新技術(shù)轉(zhuǎn)化為產(chǎn)業(yè)價值,必須達(dá)到合理的投入產(chǎn)出比,而向量數(shù)據(jù)庫可以有效減少存儲和計算成本。一個公開數(shù)據(jù)是,通過騰訊云向量數(shù)據(jù)庫,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%,就在于檢索效率、運行穩(wěn)定性、運營效率、推薦算法等,有了較大的提升。

3.更強的數(shù)據(jù)安全。有企業(yè)直言:“沉淀了幾十年的內(nèi)部數(shù)據(jù)是我的核心競爭力,讓我無償去公開給大模型做訓(xùn)練,我肯定不愿意?!毕胱龃竽P停€要確保數(shù)據(jù)的隱私安全,就必須與數(shù)據(jù)庫產(chǎn)品做好配合,這給向量數(shù)據(jù)庫的本地部署帶來了廣闊的需求。

4.更大的擴展性。隨著大模型走向行業(yè)應(yīng)用,垂直領(lǐng)域的AI用例不斷增多,洶涌的數(shù)據(jù)洪潮和存算任務(wù),會帶來大量向量搜索的需求。而向量數(shù)據(jù)庫嵌入向量的長度不受限制,具有良好的擴展性,可以根據(jù)AI用例和模型而變化,更好地處理大規(guī)模數(shù)據(jù)集。

從大模型技術(shù)標(biāo)桿的OpenAI發(fā)布的GPT-4o和即將發(fā)布的GPT-5消息來看,以及國內(nèi)外商業(yè)化大模型的進(jìn)展來看,大模型的技術(shù)路線還沒有發(fā)生顛覆性的變革,因此落地應(yīng)用還是需要向量檢索和向量數(shù)據(jù)庫。

由此可以肯定,向量數(shù)據(jù)庫市場必然還會迎來一輪增長。趨于冷靜,只是2023年熱情過度高漲的適當(dāng)回調(diào)。

兩大新勢力,云是方向

據(jù)東北證券預(yù)測,到2030年,全球向量數(shù)據(jù)庫市場規(guī)模有望達(dá)到 500 億美元,國內(nèi)向量數(shù)據(jù)庫市場規(guī)模有望超過600億人民幣。向量數(shù)據(jù)庫市場吸引了“群雄逐鹿”,從引爆到飽和,進(jìn)展迅猛,

傳統(tǒng)數(shù)據(jù)庫廠商不必多說,既有相應(yīng)的能力建設(shè),也有一定的客戶基礎(chǔ),推出相關(guān)產(chǎn)品是必然。一些在AI領(lǐng)域積淀已久的科技大廠,如谷歌、微軟、Meta、百度等大廠,都有向量數(shù)據(jù)庫的技術(shù)積累,也都可以向外輸出相關(guān)能力和產(chǎn)品。

除了這些常規(guī)面孔,向量數(shù)據(jù)庫市場也吸引了新的參與者。

作為這一輪大模型投資熱和創(chuàng)業(yè)熱的主要目標(biāo)之一,向量數(shù)據(jù)庫領(lǐng)域誕生了不少創(chuàng)新創(chuàng)業(yè)公司。比如AI創(chuàng)業(yè)新秀Pinecone就是閉源的領(lǐng)跑者,憑借良好的開箱即用的產(chǎn)品體驗,獲得了非常大的增長,B輪估值達(dá)到7.5億美元。其他競爭者大多建立在開源項目的基礎(chǔ)上。

wKgaomZN6zqASh3_AAEdKosVPYA445.jpg

不過,作為創(chuàng)業(yè)公司,長期盈利能力還有待驗證。一個主要原因,是客戶大多是嘗鮮、實驗性質(zhì)。

企業(yè)需要先將非結(jié)構(gòu)化的私密數(shù)據(jù),進(jìn)行一個小的模型,進(jìn)行向量化,產(chǎn)生一個向量的矩陣,再存儲到向量數(shù)據(jù)庫里,來供大模型學(xué)習(xí)和檢索。這個過程涉及大量的工程化,會耗費企業(yè)許多開發(fā)人員、時間成本,一開始可能會因為AI大模型很火而對向量數(shù)據(jù)庫產(chǎn)生興趣,但能否真正在業(yè)務(wù)中落地還是個未知數(shù)。因此,長期付費意愿還有較大的不確定性。

另一股積極參與的新勢力,就是公有云廠商。

不是所有企業(yè)都有能力自建大模型所需要的基礎(chǔ)設(shè)施,通過MaaS(模型即服務(wù))業(yè)務(wù)來訓(xùn)練應(yīng)用大模型,是更靈活的選擇。此外,很多政企客戶往往會選擇公有云或行業(yè)云來滿足其業(yè)務(wù)需求,對云數(shù)據(jù)庫的關(guān)注度和接受度上升,而這些用戶在探索大模型時,會傾向于以整體解決方案的形式來交付,這就給了云廠商參與游戲的機會,同時也要求云廠商提供向量數(shù)據(jù)庫的全棧支持。

如今頭部云廠商基本建立了全生命周期AI化的向量數(shù)據(jù)庫。有數(shù)據(jù)顯示,企業(yè)原先接入一個大模型需要花1個月左右時間,使用某公有云的向量數(shù)據(jù)庫后,3天時間即可完成,極大降低了企業(yè)的接入成本。

更何況,前不久火山引擎、阿里云、百度智能云等都圍繞大模型API價格,打起了互相抄底的“價格戰(zhàn)”,意味著AI創(chuàng)新門檻的降低,而AI應(yīng)用市場的用戶規(guī)模擴大,也會帶動向量數(shù)據(jù)庫的使用需求。

綜上,整個云AI市場的格局還在快速變化之中,風(fēng)物長宜放眼量,AI Native的向量數(shù)據(jù)庫,前景仍然值得期待。

接下來,向量數(shù)據(jù)庫卷什么?

有人可能會問了,大模型開始卷價格,那向量數(shù)據(jù)庫市場正在卷什么?

需要注意的是,大模型降價是以云廠商為主,而零一萬物等創(chuàng)業(yè)公司已經(jīng)明確表示會以技術(shù)創(chuàng)新為競爭力,而不會(與云廠商)對標(biāo)價格。云廠商在AI基礎(chǔ)設(shè)施、商業(yè)生態(tài)、市場規(guī)模效應(yīng)上的既定優(yōu)勢,確實也會表現(xiàn)在向量數(shù)據(jù)庫市場。

目前來看,公有云廠商有幾重特殊優(yōu)勢,或許會讓向量數(shù)據(jù)庫加速走向商業(yè)成功:

  1. 多元化部署。垂直行業(yè)大模型,數(shù)據(jù)都是私有機密的,客戶一般不愿意放到公有云上,這對一部分支持混合多云的云廠商是一大利好,通過私有部署、分布式、混合云等多種方案,打消行業(yè)客戶將數(shù)據(jù)放到云端的現(xiàn)實疑慮。

2.一體化AI能力。向量數(shù)據(jù)庫的火爆,本質(zhì)是由AI驅(qū)動的,而AI Native時代的數(shù)據(jù)工程,還有許多復(fù)雜問題尚待解決,比如檢索效率,在處理大規(guī)模數(shù)據(jù)的并行任務(wù)時,保持快速響應(yīng)時間是一個挑戰(zhàn),需要優(yōu)化索引結(jié)構(gòu)和搜索算法;高負(fù)載下的系統(tǒng)穩(wěn)定性,需要確保數(shù)據(jù)庫系統(tǒng)具備高可用性和容錯能力,防止服務(wù)中斷;存儲海量的向量數(shù)據(jù),成本效益比要進(jìn)一步優(yōu)化……目前來看,云廠商具備從底層算力集群、Maas模型平臺到全棧工具鏈的AI能力,有望通過技術(shù)協(xié)同創(chuàng)新,持續(xù)優(yōu)化向量數(shù)據(jù)庫的性能和成本。

3.產(chǎn)業(yè)服務(wù)能力。各行業(yè)對AI與業(yè)務(wù)的結(jié)合熱情高漲,但大多還處于嘗試探索期,需要結(jié)合自身場景、AI應(yīng)用、IT設(shè)施等多種因素試錯并迭代。這個過程中,隨叫隨到、幫助客戶及時解決問題的ToB服務(wù)能力,也是非??粗氐?。深耕產(chǎn)業(yè)的公有云,有望降低很多企業(yè)在AI技術(shù)革命中的機會成本。

有人說,AI云市場越來越卷了,隨著大模型性能邊際效益不斷走低,云廠商不得不用低價換規(guī)模。但有句話:“東方不亮西方亮,黑了南方有北方。”只要公有云廠商在AI領(lǐng)域的產(chǎn)品陣營足夠龐大,用多元化綜合優(yōu)勢鎖定用戶,那么即使大模型收益下降,在商業(yè)回報上也不愁沒有回旋的余地。

從這個角度看,或許公有云市場下一個卷起來的,就是向量大模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3711

    瀏覽量

    64021
  • 向量
    +關(guān)注

    關(guān)注

    0

    文章

    55

    瀏覽量

    11631
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2134

    瀏覽量

    1970
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?66次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)—存儲中被刪除后重建如何恢復(fù)被刪除數(shù)據(jù)

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 某品牌FlexStorage P5730服務(wù)器存儲,存儲中有一組由24塊硬盤組建的RAID5陣列,包括1塊熱備硬盤。 服務(wù)器存儲故障: 存儲中的2個被刪除,刪除之后重建了一個新。需要恢復(fù)之
    的頭像 發(fā)表于 06-05 11:03 ?406次閱讀

    搭載英偉達(dá)GPU,全球領(lǐng)先的向量數(shù)據(jù)庫公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫

    在美國硅谷圣何塞召開的 NVIDIA GTC 大會上,全球領(lǐng)先的向量數(shù)據(jù)庫公司 Zilliz 發(fā)布了 Milvus 2.4 版本。這是一款革命性的向量數(shù)據(jù)庫系統(tǒng),在業(yè)界首屈一指,它首次
    的頭像 發(fā)表于 04-01 14:33 ?355次閱讀
    搭載英偉達(dá)GPU,全球領(lǐng)先的<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>公司Zilliz發(fā)布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】Oracle數(shù)據(jù)庫ASM實例無法掛載的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫ASM磁盤組掉線,ASM實例不能掛載。數(shù)據(jù)庫管理員嘗試修復(fù)數(shù)據(jù)庫,但是沒有成功。
    的頭像 發(fā)表于 02-01 17:39 ?370次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】Oracle<b class='flag-5'>數(shù)據(jù)庫</b>ASM實例無法掛載的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    騰訊云把向量數(shù)據(jù)庫”到哪一步了?

    被大模型“帶飛”這一年,向量數(shù)據(jù)庫才剛剛寫下序言
    的頭像 發(fā)表于 01-15 09:49 ?1495次閱讀
    騰訊云把<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>“<b class='flag-5'>卷</b>”到哪一步了?

    OPPO推出GPT大模型手機 搭載天璣9300地卷大模型

    OPPO推出GPT大模型手機?是的,只能說生成式 AI 實在是太爆火了,智能手機市場的競爭都只能繼續(xù)。 今天OPPO推出 GPT 大模型手機 Find X7 系列。Find X7 系列的外觀設(shè)計
    的頭像 發(fā)表于 01-08 18:52 ?881次閱讀

    誠邀報名 | AI 向量、云原生、開源,今年的數(shù)據(jù)庫熱點技術(shù)都在這里

    訓(xùn)練和推理的精準(zhǔn)度對數(shù)據(jù)和信息的存儲、檢索、處理提出了更高的要求。為此,存算分離、向量數(shù)據(jù)庫、圖數(shù)據(jù)庫、分布式數(shù)據(jù)庫和開源
    的頭像 發(fā)表于 12-20 20:48 ?283次閱讀
    誠邀報名 | AI <b class='flag-5'>向量</b>、云原生、開源,今年的<b class='flag-5'>數(shù)據(jù)庫</b>熱點技術(shù)都在這里

    第五代英特爾? 至強? 可擴展處理器助力星環(huán)科技分布式向量數(shù)據(jù)庫 Transwarp Hippo 實現(xiàn)大幅性能提升

    ,這在大模型訓(xùn)練等場景中有著重要的 意義,可幫助用戶更高效、 更精確地打造大模型產(chǎn)品。 — 朱珺辰 星環(huán)科技聯(lián)合創(chuàng)始人兼副總裁 百花齊放的大模型時代凸顯了分布式向量
    的頭像 發(fā)表于 12-16 16:15 ?401次閱讀
    第五代英特爾? 至強? 可擴展處理器助力星環(huán)科技分布式<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b> Transwarp Hippo 實現(xiàn)大幅性能提升

    服務(wù)器數(shù)據(jù)恢復(fù)-raid5故障導(dǎo)致上層無法掛載的數(shù)據(jù)恢復(fù)案例

    : raid5陣列中有兩塊硬盤出現(xiàn)故障掉線,導(dǎo)致服務(wù)器上層無法掛載,oracle數(shù)據(jù)庫無法正常使用。 通過管理后臺查看服務(wù)器中硬盤的狀態(tài),顯示有兩塊硬盤處于離線狀態(tài)。
    的頭像 發(fā)表于 12-14 11:32 ?402次閱讀

    誠邀報名 | AI 向量、云原生、開源,今年的數(shù)據(jù)庫熱點技術(shù)都在這里

    和推理的精準(zhǔn)度對數(shù)據(jù)和信息的存儲、檢索、處理提出了更高的要求。為此,存算分離、向量數(shù)據(jù)庫、圖數(shù)據(jù)庫、分布式數(shù)據(jù)庫和開源
    的頭像 發(fā)表于 12-13 16:05 ?253次閱讀

    關(guān)于JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運作,它為應(yīng)用程序開發(fā)者帶來了哪些價值呢?
    的頭像 發(fā)表于 12-06 13:46 ?710次閱讀
    關(guān)于JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    什么是JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運作,它為應(yīng)用程序開發(fā)者帶來了哪些價值呢?文章速覽:什么是JSON什么是JSON
    的頭像 發(fā)表于 12-02 08:04 ?686次閱讀
    什么是JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    NoSQL 數(shù)據(jù)庫如何選型

    什么是NoSQL數(shù)據(jù)庫?為什么要使用NoSQL數(shù)據(jù)庫?鍵值數(shù)據(jù)庫內(nèi)存鍵值數(shù)據(jù)庫文檔數(shù)據(jù)庫列式數(shù)據(jù)庫
    的頭像 發(fā)表于 11-26 08:05 ?356次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型

    一文解析向量數(shù)據(jù)庫的大模型之路

    數(shù)據(jù)在 MaaS 時代很重要,市場的火熱映射到具體的企業(yè)行為上,表現(xiàn)為大批量垂直模型的推出、數(shù)據(jù)庫企業(yè)融資數(shù)量增加、數(shù)據(jù)庫使用量陡然增長等。
    發(fā)表于 11-17 11:37 ?434次閱讀
    一文解析<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>的大<b class='flag-5'>模型</b>之路

    探尋向量數(shù)據(jù)庫爆火的真相,Zilliz 技術(shù)合伙人帶你解惑

    模型時代的到來將向量數(shù)據(jù)庫的熱度推向了高點,在此氛圍下,有人發(fā)出了哲學(xué)家般的一問:究竟是大模型選擇了向量
    的頭像 發(fā)表于 09-28 11:40 ?456次閱讀
    探尋<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫</b>爆火的真相,Zilliz 技術(shù)合伙人帶你解惑