定義一種全新的“定制化”模式。
百川智能依然保持著一如既往的快節(jié)奏。
12月19日,百川智能宣布開放基于搜索增強的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超長上下文窗口的基礎(chǔ)上,還增加了搜索增強知識庫的能力。
即日起,API用戶可上傳文本資料來創(chuàng)建自身專屬知識庫,從而根據(jù)自身業(yè)務(wù)需求打造更完整、高效的智能解決方案。
2個多月前的9月25日,百川智能便發(fā)布了Baichuan2-53B閉源大模型,全面升級了Baichuan1-53B的各項能力。作為首批通過備案的大模型企業(yè)之一,百川智能此次還開放了Baichuan2-53B API接口,正式進軍to B領(lǐng)域,開啟商業(yè)化進程。
在當天的媒體溝通會上,百川智能創(chuàng)始人、CEO王小川,百川智能聯(lián)合創(chuàng)始人、聯(lián)席總裁洪濤,百川智能技術(shù)聯(lián)創(chuàng)陳煒鵬及百川智能商用業(yè)務(wù)部總經(jīng)理李劍共同出席,為「甲子光年」等媒體解答了百川智能在to B模式中最新的技術(shù)與商業(yè)思考。
1.行業(yè)模型之外,大模型to B的第二條路
在過去一年對大模型商業(yè)化的討論中,行業(yè)大模型一直被認為是大模型在B端商業(yè)落地的主要路徑。
而百川智能此次走出了一條不同的路。
百川智能認為,企業(yè)自有數(shù)據(jù)/知識庫是企業(yè)的核心競爭力。大模型如果不能與企業(yè)自有數(shù)據(jù)/知識庫進行結(jié)合,對企業(yè)而言是沒有價值的。
如何將大模型與企業(yè)自有數(shù)據(jù)/知識庫更好地相結(jié)合呢?
一個已經(jīng)為人熟知的方法是,打造行業(yè)大模型。然而,基于特定數(shù)據(jù)預訓練或微調(diào)垂直行業(yè)大模型需要高密度的技術(shù)人才團隊、大量的算力支持,并且每更新一次數(shù)據(jù)都要重新訓練或微調(diào)模型。
這種方式不僅成本高昂、靈活性差,更關(guān)鍵的是不能保證訓練的可靠性和應(yīng)用的穩(wěn)定性,多次訓練后仍會出現(xiàn)問題。
此外,大部分企業(yè)數(shù)據(jù),都是結(jié)構(gòu)化的數(shù)據(jù),也不適合SFT(Supervised fine-tuning,有監(jiān)督微調(diào)),模型無法準確記憶結(jié)構(gòu)化信息,就會帶來幻覺。
針對這些痛點,行業(yè)摸索了一套基本操作,即“向量數(shù)據(jù)庫+長上下文窗口”。而百川智能在此基礎(chǔ)上進一步完善了大模型技術(shù)棧,拓展至四個維度:
向量數(shù)據(jù)庫,百川智能在向量檢索c-mteb位列第一
長窗口Baichuan2-192K,一次可輸入35萬字
實現(xiàn)稀疏檢索(索引庫)與向量搜索并行,模型的可用率從80%提升至95%
搜索系統(tǒng)和大模型對齊
具體來看,百川智能將向量數(shù)據(jù)庫升級為搜索增強知識庫,提升了大模型獲取外部知識的能力;把搜索增強知識庫和超長上下文窗口結(jié)合,讓模型可以連接全部企業(yè)知識庫以及全網(wǎng)信息,能夠替代絕大部分的企業(yè)個性化微調(diào),解決99%企業(yè)知識庫的定制化需求。 這套技術(shù)棧背后,也反映了百川智能對于大模型更深層次的思考。 在百川智能的技術(shù)思考中,大模型+搜索增強是大模型時代的新計算機——
大模型類似于計算機的CPU,通過預訓練將知識內(nèi)化在模型內(nèi)部,然后根據(jù)用戶的Prompt生成結(jié)果;
上下文窗口可以看做計算機的內(nèi)存,存儲了當下正在處理的文本;
互聯(lián)網(wǎng)實時信息與企業(yè)完整知識庫共同構(gòu)成了大模型時代的硬盤。
那么,百川智能如何將這套技術(shù)棧真正落地在商業(yè)場景呢?
2.用“產(chǎn)品化”取代“項目化”
事實上,無論王小川還是他所召集的搜狗“舊部”,過往的工作經(jīng)驗更多集中在to C領(lǐng)域。此次帶領(lǐng)百川智能進軍to B,無疑會面臨諸多挑戰(zhàn)。
洪濤告訴「甲子光年」:“企業(yè)真正要用好大模型的起點,是把企業(yè)知識和大模型結(jié)合,而這也是最大的困難。”
王小川認為,to B要面對的最大需求是定制化,光靠調(diào)用API可能不夠。
“我們今天用搜索增強最大的意愿不是解決幻覺問題,而是解決大模型可定制化的問題。如何讓企業(yè)的私有數(shù)據(jù)為模型所用,讓模型為企業(yè)服務(wù),是大模型to B商業(yè)化過程中要解決的關(guān)鍵問題?!蓖跣〈ū硎尽?/p>
在上一波以計算機視覺為核心的AI浪潮中,AI公司變成了集成商,需要下場做很重交付的定制化項目,往往利潤很低,甚至越做越虧。如何避免在定制化項目中“越做越虧”的故事在大模型的商業(yè)化路上重演,是所有大模型創(chuàng)業(yè)公司今天要面對的一大難題。
在王小川的判斷中,定制化是客戶天生的需求,to B企業(yè)真正要避免的是“項目化”。
所以,基于上述技術(shù)棧,百川智能定義了一種全新的“定制化”方式——用“產(chǎn)品化”取代“項目化”。
“整體來看,一些能盈利的to B公司賣的大多是產(chǎn)品。我們目前打造的可配置、可調(diào)整的搜索增強知識庫,就是希望用產(chǎn)品的方式,以更低的成本解決客戶的定制化需求。客戶提出的各種需求可以通過我們不同的產(chǎn)品組合來解決, 我們不需要單獨開發(fā)一套全新的數(shù)據(jù)庫?!焙闈M一步解釋道。
據(jù)「甲子光年」觀察,百川智能并不直接針對某個行業(yè)做“企業(yè)服務(wù)”,而是基于不同的場景需求,構(gòu)建大模型解決問題的能力。這些能力最終可被應(yīng)用在多個行業(yè)。
在眾多場景中,百川智能主要瞄準有兩大特征的場景——有大量文本數(shù)據(jù),并且需要與客戶打交道,如客服場景。
目前,和大多數(shù)企業(yè)類似,百川智能為企業(yè)提供API調(diào)用、云上部署以及本地部署三種大模型部署方式。
在此次溝通會中,王小川還透露了C端產(chǎn)品的最新信息。
王小川表示,C端產(chǎn)品依然是百川智能十分看重的方向。關(guān)于C端超級應(yīng)用的定義,王小川認為:“以往做應(yīng)用更多是在造工具,我們要求它以更精確的方式和我們互動,提高我們的效率。但今天,我們要造的是新物種,是一種人類的伙伴。”
王小川進一步透露,百川智能的C端產(chǎn)品第一重心是醫(yī)療方向,產(chǎn)品預計會在明年上線。
-
API
+關(guān)注
關(guān)注
2文章
1472瀏覽量
61750 -
大模型
+關(guān)注
關(guān)注
2文章
2278瀏覽量
2360
原文標題:百川智能發(fā)布Baichuan2 Turbo系列API,或?qū)⑻娲袠I(yè)大模型|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論