0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI開啟推理算力新Scaling Law,AI PC和CPU的機會來了

愛云資訊 ? 2024-09-27 16:20 ? 次閱讀

OpenAI的新模型o1,可謂是開啟了Scaling Law的新篇章——

隨著更多的強化學(xué)習(xí)(訓(xùn)練時計算)和更多的思考時間(測試時計算),o1在邏輯推理能力上已經(jīng)達到了目前天花板級別。

尤其是在北大給出的一項評測中,**o1-mini**模型的跑分比o1-preview還要高:

wKgZomb2ar-AHVUKAAFwv-IFH54843.png

這就展示一種新的思路和可能性——

**小模型專門加強推理能力,放棄在參數(shù)中存儲大量世界知識。**

OpenAI科學(xué)家趙盛佳給出的解釋是:

>o1-mini是高度專業(yè)化的模型,只關(guān)注少部分能力可以更深入。

wKgaomb2ar-AceyIAADWKpJKZ4g63.jpeg

但與此同時,也出現(xiàn)了另一個問題:

若是想讓AI同時掌握高階推理能力和大量知識的任務(wù)應(yīng)該怎么辦?

于是乎,技術(shù)的聚光燈再次對焦到了**大模型和RAG的組合**。

具體而言,向量數(shù)據(jù)庫讓大模型能夠快速有效地檢索和處理大量的向量數(shù)據(jù),為大模型提供了更豐富和準(zhǔn)確的信息,從而增強了模型的整體性能和應(yīng)用范圍。

可以說是讓大模型有了“好記憶”,減少出現(xiàn)答非所問的情況。

而且這一次,小模型專業(yè)化的新趨勢還對RAG中的向量數(shù)據(jù)庫提出了更高的要求:

一方面是小模型存儲的知識少了,對于外部知識存儲和檢索的質(zhì)量要求就更高。

另一方面是AI應(yīng)用落地的腳步加快,面對多用戶、高并發(fā)的場景,對整個系統(tǒng)的性能也更高。

在此背景下,業(yè)界先進企業(yè)正將目光投向更強大的**分布式向量數(shù)據(jù)庫**。

向量數(shù)據(jù)庫代表玩家**星環(huán)科技**就和**英特爾**強強聯(lián)手,對此提出了一種新解法:

用更強性能的數(shù)據(jù)中心CPU與酷睿? Ultra支持的AI PC組合,加上專門優(yōu)化過的分布式向量數(shù)據(jù)庫,提供更經(jīng)濟、更通用的方案,有效解決企業(yè)部署大模型的瓶頸問題。

分布式向量數(shù)據(jù)庫推動大模型應(yīng)用落地

正如我們剛才提到的,RAG的重要組成部分就是外掛的專業(yè)知識庫,因此這個知識庫中需得涵蓋能夠精準(zhǔn)回答問題所需要的專業(yè)知識和規(guī)則。

而要構(gòu)建這個外掛知識庫,常見的方法包括向量數(shù)據(jù)庫、知識圖譜,甚至也可以直接把ElasticSearch數(shù)據(jù)接入。

但由于向量數(shù)據(jù)庫具備對高維向量的檢索能力,能夠跟大模型很好地匹配,效果也較好,所以成為了目前主流的形式。

向量數(shù)據(jù)庫可以對向量化后的數(shù)據(jù)進行高效的存儲、處理與管理。

如下圖展示的那樣,數(shù)據(jù)向量化過程利用了諸如詞向量模型和卷積神經(jīng)網(wǎng)絡(luò)人工智能技術(shù)。

wKgZomb2ar-AEPZ8AAIRQVLXz68752.png

通過Embedding過程,這些技術(shù)能夠?qū)⑽谋尽D像、音視頻等多種形式的數(shù)據(jù)轉(zhuǎn)換成向量形式,并將其存儲在向量數(shù)據(jù)庫中。

至于向量數(shù)據(jù)庫的查詢功能,則是通過計算向量間的相似度來實現(xiàn)的。

星環(huán)科技所提出的創(chuàng)新成果,便是**無涯·問知Infinity Intelligence**。

這是一款基于星環(huán)大模型底座,結(jié)合個人知識庫、企業(yè)知識庫、法律法規(guī)、財經(jīng)等多種知識源的企業(yè)級垂直領(lǐng)域問答產(chǎn)品,可以實現(xiàn)企業(yè)級智能問答。

例如面對“國家大基金三期會投向哪些領(lǐng)域”這樣非常專業(yè)的問題,無涯·問知不僅可以輕松作答,還能提供相關(guān)圖譜、關(guān)鍵信息等

而且還能圖文并茂地展示作答:

wKgZomb2ar-AX9cUAAFhxpqqfyM132.png

上傳本地的視頻文件等,無涯·問知“唰唰唰”地就可以做總結(jié):

wKgZomb2asCAJDU-AA9kgavX6zU364.gif

整體來看,無涯·問知在**個人知識庫**上,支持用戶一鍵上傳文檔、表格、圖片、音視頻等多模態(tài)數(shù)據(jù),快速實現(xiàn)海量多模知識的檢索與智能問答。

在**企業(yè)知識庫**方面,則是通過管理端構(gòu)建企業(yè)知識庫后,員工可以基于企業(yè)知識庫進行問答,知識庫作為企業(yè)內(nèi)部的知識共享平臺,促進不同團隊和部門之間的協(xié)作和信息交流。

除此之外,無涯·問知內(nèi)置了各大交易所的交易規(guī)則、監(jiān)管要求等常見的**法律法規(guī)知識**,用戶可針對法律法規(guī)的具體條款、監(jiān)管規(guī)則、試行辦法等提出問題,無涯·問知將提供法律風(fēng)險預(yù)警以及應(yīng)對建議。

它還內(nèi)置了豐富的上市公司財報和產(chǎn)業(yè)鏈圖譜數(shù)據(jù),能夠為金融機構(gòu)提供全面深入的**投資研究分析工具**。

即便是面對金融、法律等眾多既要求時效性、又要求數(shù)據(jù)隱私的行業(yè),星環(huán)也有無需上云聯(lián)網(wǎng)的無涯問知AI PC版,它可以在配備英特爾? 酷睿? Ultra的主流個人電腦上,基于集成顯卡和NPU流暢運行。

它不僅具備強大的本地化向量庫,支持多格式、不限長度的文件資料入庫,還支持影、音、圖、文等多模態(tài)數(shù)據(jù)的“知識化”處理,以及“語義化”查詢和應(yīng)用能力,極大地豐富了知識獲取和應(yīng)用場景。

wKgaomb2asCABa6DAACSwl4s5tg786.png

無涯·問知可以算是星環(huán)知識平臺Transwarp Knowledge Hub中重要的組成部分,其為用戶打通了從人工智能基礎(chǔ)設(shè)施建設(shè)到大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用的完整鏈條。

值得一提的是,TKH同樣提供了AI PC版本,基于本地大模型技術(shù),能夠回答用戶各類問題,為用戶帶來文檔總結(jié)、知識問答等全新體驗,同時保障用戶隱私數(shù)據(jù)安全。

AI PC版本星環(huán)大模型知識庫提供本地大模型和遠程大模型供選擇,簡單問題可以由本地模型快速處理,而復(fù)雜疑難問題則可以提交給云端大模型進行深入分析。

這種彈性擴展的能力,確保了企業(yè)在面對不同挑戰(zhàn)時,都能夠獲得足夠的計算支持。

wKgaomb2ar-Afq8vAADo6DpCDQo617.png

而這一系列產(chǎn)品之所以能夠做到在云端和本地都能提供高效的知識管理和智能化工具,離不開星環(huán)科技自研的幾個關(guān)鍵技術(shù)。

首先就是基于星環(huán)自研**向量數(shù)據(jù)庫Hippo的向量索引技術(shù)**,能夠在龐大的數(shù)據(jù)集中快速精準(zhǔn)地召回相關(guān)信息,提升了信息檢索的速度和準(zhǔn)確性,使模型在處理查詢時更加高效。

wKgZomb2asCAAy2GAAB8kJAG6mk139.png

其次是利用了**圖計算框架**,讓大模型能夠識別實體間的多層次關(guān)系,從而進行深度的關(guān)聯(lián)分析,提供了更為深入和準(zhǔn)確的洞察結(jié)論。

在**數(shù)據(jù)**方面,覆蓋官方資訊、門戶類網(wǎng)站、自媒體財經(jīng)等1600多個信息源,涵蓋了全市場的各類宏觀、價格指數(shù)以及大部分新聞數(shù)據(jù)。

不僅包括通常渠道可獲取的數(shù)據(jù),還包含高可信度、擁有第一手資料的新聞合作商數(shù)據(jù),同時也對所有官方政策數(shù)據(jù)進行實時全覆蓋。

但隨著大模型的發(fā)展,數(shù)據(jù)規(guī)??芍^是極速暴增,這就對數(shù)據(jù)庫和智能問答的性能提出更高要求。

因此,數(shù)據(jù)壓縮、算力提升也成為了各個大模型玩家發(fā)力的關(guān)鍵點。

在這方面,星環(huán)科技與英特爾深度合作,從端側(cè)的AIPC到后端的數(shù)據(jù)中心和云,通過軟硬協(xié)同優(yōu)化為大模型的應(yīng)用落地打造了可行的方案。

CPU助力向量數(shù)據(jù)庫應(yīng)用性能大幅提升

向量數(shù)據(jù)庫搭配CPU,其實本來就已經(jīng)是行業(yè)內(nèi)現(xiàn)階段的主流共識。

究其原因,向量相似度檢索、高密度向量聚類等都屬于CPU密集型負載。因此,CPU的性能至關(guān)重要。

第五代英特爾? 至強? 可擴展處理器,正是帶來了一系列面向AI時代的關(guān)鍵特性更新。

首先,它搭載了更大容量的高帶寬內(nèi)存,有效緩解了向量數(shù)據(jù)庫中數(shù)據(jù)密集型工作負載的內(nèi)存墻問題。

此外,它還集成了英特爾? AMX(高級矩陣擴展)加速引擎,能高效地處理向量數(shù)據(jù)庫查詢所需的矩陣乘法運算,并在單次運算中處理更大矩陣。

對于云端部署的版本來說,搭載第五代至強? 處理器后,星環(huán)Transwarp Hippo的整體性能較第三代提升高達2.07倍。

那么本地AI算力,是否能支撐在AI PC上使用大模型來支持企業(yè)應(yīng)用呢?

星環(huán)嘗試后給出了答案:完全夠用。

從AI PC誕生到現(xiàn)在近一年時間,整體AI算力提升了200%多,能耗又降低了50%。

這背后就要歸功于英特爾? 酷睿? Ultra系列CPU的升級改進了。

最新的英特爾? 酷睿? Ultra 處理器 (第二代)200V系列處理器支持下,整個AI PC平臺算力最高能達到120 TOPS。

特別是其中搭載的第四代NPU,性能比上一代強大4倍,非常適合在節(jié)能的同時運行持續(xù)的AI工作負載。

wKgZomb2asCAENZ1AAF6Gnt0y40529.png

在軟件層面,英特爾和星環(huán)合作,還對數(shù)據(jù)庫底層做了性能優(yōu)化。

通過水平擴展架構(gòu)、基于CPU的向量化指令優(yōu)化、多元芯片加速等技術(shù),有助于分布式向量數(shù)據(jù)庫發(fā)揮并行檢索能力,為海量、多維向量處理提供強大算力支持。

經(jīng)過優(yōu)化后的Transwarp Hippo實現(xiàn)了海量、高維度向量數(shù)據(jù)處理,并具備低時延、高精確度等優(yōu)勢。

同時提升了Transwarp Hippo了服務(wù)器節(jié)點的性能密度,在性能提升的同時,具備更高的每瓦性能,有助于節(jié)省單位性能的能耗支出,最終體現(xiàn)為降低總體擁有成本 (TCO)。

存算融合趨勢明顯,CPU大有可為

隨著OpenAI o1系列為代表的大模型不斷革新算法,大模型推理時的算力消耗正在飛速攀升,對支撐大模型運轉(zhuǎn)的基礎(chǔ)設(shè)施平臺提出了更高的要求。

特別是對于需要頻繁訪問外部知識庫的大模型應(yīng)用,存儲與計算深度融合儼然成為當(dāng)務(wù)之急。

在這一技術(shù)變革大潮中,CPU成為其中關(guān)鍵角色之一。

此外,英特爾基于CPU的解決方案還為用戶帶來了更具成本優(yōu)勢的選擇。由于通用CPU擁有成熟、完善的供應(yīng)鏈體系和生態(tài)支持,企業(yè)用戶可以獲得穩(wěn)定可靠的算力供給。

同時,英特爾? 至強? 和酷睿? 處理器能同時覆蓋端側(cè)和云側(cè)的算力需求,為不同的應(yīng)用場景提供強大的支持。

展望未來,存算一體化的趨勢將愈發(fā)明顯。

從大模型應(yīng)用的角度看,知識檢索和AI推理將不再涇渭分明,而是深度交織、彼此強化。

在這樣一個智能融合的未來圖景中,CPU作為連接存儲、網(wǎng)絡(luò)和各類加速器的紐帶,其地位將變得舉足輕重。

(文章來源:量子位,作者:夢晨 金磊”)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10721

    瀏覽量

    209572
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    995

    瀏覽量

    6270
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2157

    瀏覽量

    2012
收藏 人收藏

    評論

    相關(guān)推薦

    CPU\GPU引領(lǐng),國產(chǎn)AI PC進階

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)當(dāng)前AI PC已經(jīng)成為PC產(chǎn)業(yè)的下一個浪潮,國產(chǎn)CPU、GPU廠商在PC市場一直處于追趕態(tài)勢,
    的頭像 發(fā)表于 09-01 02:15 ?4705次閱讀
    <b class='flag-5'>CPU</b>\GPU引領(lǐng),國產(chǎn)<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>進階

    OpenAI即將發(fā)布“草莓”推理大模型

    科技界迎來新動態(tài),據(jù)可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發(fā)布——預(yù)計在兩周內(nèi),將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務(wù)中。這款以卓越推理
    的頭像 發(fā)表于 09-11 16:53 ?404次閱讀

    浪潮信息趙帥:開放計算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

    Scaling Law帶來的AI基礎(chǔ)設(shè)施Scale up和Scale out的挑戰(zhàn),數(shù)據(jù)中心需要以開放創(chuàng)新加速算力系統(tǒng)、管理和基礎(chǔ)設(shè)施的全向Scale進程,推動AI產(chǎn)業(yè)的創(chuàng)新發(fā)展。 ?
    的頭像 發(fā)表于 08-15 16:02 ?180次閱讀
    浪潮信息趙帥:開放計算創(chuàng)新 應(yīng)對<b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>挑戰(zhàn)

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當(dāng)?shù)貢r間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎(chǔ)上,這種迭代擁有顯著的改進。在發(fā)布會的演示中,OpenAI展示該模型的高級
    發(fā)表于 05-27 15:43

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?393次閱讀
    英特爾助力京東云用<b class='flag-5'>CPU</b>加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    奕斯偉展示全球首款RISC-V邊緣計算芯片EIC7700X與高算AI PC芯片

    隨著AI大模型和AI PC的興起,具備多模態(tài)能力的AI大模型不斷涌現(xiàn),AI推理芯片成為市場焦點。
    的頭像 發(fā)表于 05-18 16:31 ?969次閱讀

    OpenAIAI搜索也要來了,但我們需要這么多AI搜索么

    OpenAI要做AI搜索挑戰(zhàn)谷歌這件事已經(jīng)傳了很久,傳說中的SearchGPT似乎真的要來了。據(jù)軟件開發(fā)者TiborBlaho爆料,OpenAIA
    的頭像 發(fā)表于 05-10 08:05 ?348次閱讀
    <b class='flag-5'>OpenAI</b>的<b class='flag-5'>AI</b>搜索也要<b class='flag-5'>來了</b>,但我們需要這么多<b class='flag-5'>AI</b>搜索么

    新火種AI|這家“中國OpenAI”,能趕超OpenAI嗎?

    全面對標(biāo)OpenAI,智譜AI能成為“中國的OpenAI”嗎?
    的頭像 發(fā)表于 01-18 17:56 ?548次閱讀
    新火種<b class='flag-5'>AI</b>|這家“中國<b class='flag-5'>OpenAI</b>”,能趕超<b class='flag-5'>OpenAI</b>嗎?

    AI PC是什么?如何變革PC產(chǎn)業(yè)(2023)

    AI PC整合了輕量化AI模型,將實現(xiàn)各種生成式AI應(yīng)用的離線穩(wěn)態(tài)運行。作為設(shè)備、邊緣計算和云技術(shù)的混合體,AI
    的頭像 發(fā)表于 12-27 17:37 ?1320次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>PC</b>是什么?如何變革<b class='flag-5'>PC</b>產(chǎn)業(yè)(2023)

    HarmonyOS:使用MindSpore Lite引擎進行模型推理

    ); OH_AI_ContextSetThreadAffinityMode(context, 1); //設(shè)置運行設(shè)備為CPU,不使用Float16推理 OH_AI_DeviceInf
    發(fā)表于 12-14 11:41

    AI PC 靈魂拷問

    。今年9月英特爾CEO帕特·基辛格在硅谷提出了PC的革命性概念——AI PC。 問題2:什么是AI PC? 答:
    的頭像 發(fā)表于 12-08 19:15 ?442次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>PC</b> 靈魂拷問

    2024年將開啟AI PC規(guī)模出貨元年,全球PC邁入AI新時代!

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI PC是一種集成了AI技術(shù)的個人電腦。它通過集成NPU、CPU、GPU等硬件,在實現(xiàn)高能、低耗的同時從根本上改變、重塑和重構(gòu)
    的頭像 發(fā)表于 12-02 01:14 ?2376次閱讀

    點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅(qū)動的 Windows PC 上運行新模型

    的 Windows PC 和工作站提高生產(chǎn)帶來前所未有的機會。NVIDIA RTX 技術(shù)使開發(fā)者更輕松地創(chuàng)建 AI 應(yīng)用,從而改變?nèi)藗兪褂糜嬎銠C的方式。 在微軟 Ignite 20
    的頭像 發(fā)表于 11-16 21:15 ?602次閱讀
    點亮未來:TensorRT-LLM 更新加速 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>性能,支持在 RTX 驅(qū)動的 Windows <b class='flag-5'>PC</b> 上運行新模型

    高通自研PC平臺驍龍X Elite發(fā)布 高性能低功耗強AI

      在2023驍龍峰會期間,高通技術(shù)公司宣布推出公司迄今為止面向PC打造的最強計算處理器:驍龍X Elite。這款開創(chuàng)性平臺將開啟頂級計算新時代,憑借一流的CPU性能、領(lǐng)先的終端側(cè)AI
    的頭像 發(fā)表于 10-27 13:55 ?643次閱讀

    高通推出驍龍XElite——AI賦能的強大平臺將為PC帶來變革

    10月24日,在美國夏威夷驍龍峰會期間,高通技術(shù)公司宣布推出公司迄今為止面向PC打造的最強計算處理器:驍龍X Elite。這款開創(chuàng)性平臺將開啟頂級計算新時代,憑借一流的CPU性能、領(lǐng)先的終端側(cè)
    發(fā)表于 10-25 10:18 ?364次閱讀
    高通推出驍龍XElite——<b class='flag-5'>AI</b>賦能的強大平臺將為<b class='flag-5'>PC</b>帶來變革