0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新MLCommons結(jié)果公布 英特爾展現(xiàn)強(qiáng)大AI推理性能

英特爾中國(guó) ? 來(lái)源:未知 ? 2023-09-15 19:35 ? 次閱讀

近日,MLCommons公布針對(duì)60億參數(shù)大語(yǔ)言模型及計(jì)算機(jī)視覺(jué)與自然語(yǔ)言處理模型GPT-J的MLPerf推理v3.1性能基準(zhǔn)測(cè)試結(jié)果,其中包括英特爾所提交的基于HabanaGaudi2加速器、第四代英特爾至強(qiáng)可擴(kuò)展處理器,以及英特爾至強(qiáng)CPU Max系列的測(cè)試結(jié)果。該結(jié)果顯示了英特爾在AI推理方面極具競(jìng)爭(zhēng)力的表現(xiàn),并進(jìn)一步加強(qiáng)了其對(duì)加速?gòu)脑频?a target="_blank">網(wǎng)絡(luò)到邊緣再到端的工作負(fù)載中大規(guī)模部署AI的承諾。

正如最新的MLCommons結(jié)果顯示,我們擁有強(qiáng)大的、具有競(jìng)爭(zhēng)力的人工智能產(chǎn)品組合以滿(mǎn)足客戶(hù)對(duì)高性能、高效率的深度學(xué)習(xí)推理及訓(xùn)練的需求,同時(shí),針對(duì)各種規(guī)模的人工智能模型,英特爾產(chǎn)品組合均具有領(lǐng)先的性?xún)r(jià)比優(yōu)勢(shì)。

--Sandra Rivera

英特爾執(zhí)行副總裁

兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理

根據(jù)6月披露的MLCommonsAI訓(xùn)練結(jié)果1和Hugging Face性能基準(zhǔn)測(cè)試2驗(yàn)證,Gaudi2在先進(jìn)的視覺(jué)語(yǔ)言模型上擁有卓越的性能,而今天的結(jié)果進(jìn)一步證明了英特爾能夠提供滿(mǎn)足AI計(jì)算需求的絕佳解決方案。

考慮到客戶(hù)的個(gè)性化需求,英特爾正在通過(guò)能夠幫助解決AI工作負(fù)載中推理與訓(xùn)練問(wèn)題的產(chǎn)品,讓AI無(wú)處不在。英特爾的AI產(chǎn)品為客戶(hù)提供了可根據(jù)各自性能、效率及目標(biāo)成本進(jìn)行靈活匹配以獲取最佳AI解決方案的理想選擇,同時(shí)亦幫助客戶(hù)開(kāi)放生態(tài)系統(tǒng)。

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

關(guān)于Habana Gaudi2的測(cè)試結(jié)果:

Habana Gaudi2在GPT-J模型上的推理結(jié)果強(qiáng)有力地驗(yàn)證了其具有競(jìng)爭(zhēng)力的性能。

Gaudi2在GPT-J-99和GPT-J-99.9上的服務(wù)器查詢(xún)和離線樣本的推理性能分別為78.58次/秒和84.08次/秒。

Gaudi2提交的結(jié)果采用FP8數(shù)據(jù)類(lèi)型,并在這種新數(shù)據(jù)類(lèi)型上達(dá)到了99.9%的準(zhǔn)確率。

隨著每6-8周公布的Gaudi2軟件更新,英特爾將繼續(xù)在MLPerf基準(zhǔn)測(cè)試中展現(xiàn)其產(chǎn)品的性能提升,以及持續(xù)擴(kuò)大的模型覆蓋范圍。

wKgZomUEQpSAOHLSAAXSxMWr49Y014.png

Habana Gaudi2在GPT-J模型上的推理結(jié)果

驗(yàn)證了其具有競(jìng)爭(zhēng)力的性能

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

關(guān)于第四代至強(qiáng)可擴(kuò)展處理器的測(cè)試結(jié)果:

英特爾提交了基于第四代英特爾至強(qiáng)可擴(kuò)展處理器的7個(gè)推理基準(zhǔn)測(cè)試,其中包括GPT-J模型。結(jié)果顯示,包括視覺(jué)、語(yǔ)言處理、語(yǔ)音和音頻翻譯模型,以及更大的DLRM v2深度學(xué)習(xí)推薦模型及ChatGPT-J模型在內(nèi),第四代至強(qiáng)處理器對(duì)于通用AI工作負(fù)載擁有出色的性能。此外,截至目前,英特爾仍是唯一一家使用行業(yè)標(biāo)準(zhǔn)的深度學(xué)習(xí)生態(tài)系統(tǒng)軟件提交公開(kāi)CPU結(jié)果的廠商。

第四代英特爾至強(qiáng)可擴(kuò)展處理器是通過(guò)流行的AI框架與庫(kù)構(gòu)建及部署通用AI工作負(fù)載的理想選擇。對(duì)于GPT-J對(duì)約1000-1500字新聞稿進(jìn)行100字總結(jié)的任務(wù),第四代至強(qiáng)可擴(kuò)展處理器可在離線模式下完成每秒兩段的總結(jié)提要,在實(shí)時(shí)服務(wù)器模式下完成每秒一段的總結(jié)提要。

英特爾首次提交了英特爾至強(qiáng)CPU Max系列的MLPerf結(jié)果,該系列可提供高達(dá)64GB的高帶寬內(nèi)存。對(duì)于GPT-J而言,它是僅有的能夠達(dá)到99.9%準(zhǔn)確度的CPU,這對(duì)于對(duì)精度要求極高的應(yīng)用來(lái)說(shuō)至關(guān)重要。

英特爾與OEM廠商合作提交了測(cè)試結(jié)果,進(jìn)一步展示了其AI性能的可擴(kuò)展性,以及基于英特爾至強(qiáng)處理器的通用服務(wù)器的可獲取性,充分滿(mǎn)足客戶(hù)服務(wù)水平協(xié)議(SLA)。

wKgZomUEQpWAFJSKAAO8Ll3VFIE534.png

第四代至強(qiáng)可擴(kuò)展處理器

是構(gòu)建及部署通用AI工作負(fù)載的理想選擇

MLPerf是業(yè)內(nèi)享有盛名的AI性能基準(zhǔn)測(cè)試,旨在實(shí)現(xiàn)公平、可重復(fù)的產(chǎn)品性能比較。英特爾計(jì)劃為下一個(gè)MLPerf測(cè)試提交新的AI訓(xùn)練性能結(jié)果。持續(xù)的性能更新彰顯了英特爾致力于幫助客戶(hù)、助力AI技術(shù)演進(jìn)所邁出的每一步,無(wú)論是低成本的AI處理器,還是面向網(wǎng)絡(luò)、云和企業(yè)用戶(hù)的高性能AI硬件加速器或是GPU。

注釋?zhuān)?/p>

  1. https://www.intel.com/content/www/us/en/newsroom/news/new-mlcommons-results-ai-gains-intel.html#gs.51njha

  2. https://huggingface.co/blog/bridgetower


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9861

    瀏覽量

    171289
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210829

原文標(biāo)題:最新MLCommons結(jié)果公布 英特爾展現(xiàn)強(qiáng)大AI推理性能

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾AI PC無(wú)所不能的實(shí)力

    百業(yè)的最后一公里問(wèn)題。而客戶(hù)端的AI能力也在不斷提升,最終將解決個(gè)人AI的數(shù)據(jù)隱私和個(gè)性化問(wèn)題??梢?jiàn),AI非常適合云邊端三級(jí)架構(gòu),按照用戶(hù)場(chǎng)景進(jìn)行針對(duì)性部署。英特爾為云邊端都提供了
    的頭像 發(fā)表于 10-12 10:26 ?346次閱讀

    開(kāi)箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》(征求意見(jiàn)稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的AI大模型
    的頭像 發(fā)表于 09-06 15:33 ?261次閱讀
    開(kāi)箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)處理器的卓越<b class='flag-5'>推理性能</b>

    英特爾IT的發(fā)展現(xiàn)狀和創(chuàng)新動(dòng)向

    AI大模型的爆發(fā),客觀上給IT的發(fā)展帶來(lái)了巨大的機(jī)會(huì)。作為把IT發(fā)展上升為戰(zhàn)略高度的英特爾,自然在推動(dòng)IT發(fā)展中注入了強(qiáng)勁動(dòng)力。英特爾IT不僅專(zhuān)注于創(chuàng)新、AI和優(yōu)化,以及
    的頭像 發(fā)表于 08-16 15:22 ?482次閱讀

    英特爾發(fā)布AI創(chuàng)作應(yīng)用AI Playground,將于今夏正式上線!

    AI PC入門(mén)應(yīng)用程序AI Playground,讓廣大用戶(hù)在本地即可快速實(shí)現(xiàn)AI個(gè)性化創(chuàng)作。 英特爾Xe2 GPU架構(gòu),帶來(lái)50%的性能
    的頭像 發(fā)表于 06-14 09:44 ?406次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布<b class='flag-5'>AI</b>創(chuàng)作應(yīng)用<b class='flag-5'>AI</b> Playground,將于今夏正式上線!

    英特爾CEO:AI時(shí)代英特爾動(dòng)力不減

    英特爾CEO帕特·基辛格堅(jiān)信,在AI技術(shù)的飛速發(fā)展之下,英特爾的處理器仍能保持其核心地位?;粮窆_(kāi)表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術(shù)上的創(chuàng)新能力將持續(xù)驅(qū)動(dòng)公司前進(jìn)。
    的頭像 發(fā)表于 06-06 10:04 ?357次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?474次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

    “基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器,可以在滿(mǎn)足大量AI推理場(chǎng)景在吞吐量、時(shí)延、容量、并發(fā)能力等方面的需求,而且與專(zhuān)用的GPU服務(wù)器相比,在靈活性方面更具優(yōu)勢(shì)。我們希望能夠與
    的頭像 發(fā)表于 05-27 11:46 ?749次閱讀
    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代<b class='flag-5'>英特爾</b>至強(qiáng)可擴(kuò)展處理器

    英特爾首推面向AI時(shí)代的系統(tǒng)級(jí)代工—英特爾代工

    英特爾首推面向AI時(shí)代的系統(tǒng)級(jí)代工——英特爾代工(Intel Foundry),在技術(shù)、韌性和可持續(xù)性方面均處于領(lǐng)先地位。
    的頭像 發(fā)表于 02-25 10:38 ?484次閱讀
    <b class='flag-5'>英特爾</b>首推面向<b class='flag-5'>AI</b>時(shí)代的系統(tǒng)級(jí)代工—<b class='flag-5'>英特爾</b>代工

    英特爾專(zhuān)家為您揭秘第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器如何為AI加速

    % 1 ,AI 推理性能提升42% 2 。 這一系列性能提升的背后,存在著怎樣的創(chuàng)新與突破?第五代英特爾 至強(qiáng) 可擴(kuò)展處理器為什么要強(qiáng)調(diào)為AI
    的頭像 發(fā)表于 12-23 12:20 ?696次閱讀

    CPU也可以完美運(yùn)行大模型 英特爾第五代至強(qiáng)重磅發(fā)布

    大語(yǔ)言模型(LLM)已經(jīng)在多個(gè)領(lǐng)域展示出了卓越的性能和巨大的潛力,然而,要想真正發(fā)揮出這些模型的強(qiáng)大能力,需要強(qiáng)大的算力基礎(chǔ)設(shè)施,而芯片是關(guān)鍵。 千呼萬(wàn)喚始出來(lái),第五代英特爾?? 至強(qiáng)
    的頭像 發(fā)表于 12-22 11:52 ?598次閱讀
    CPU也可以完美運(yùn)行大模型 <b class='flag-5'>英特爾</b>第五代至強(qiáng)重磅發(fā)布

    AI PC助力創(chuàng)新無(wú)限想象,英特爾人工智能創(chuàng)新應(yīng)用大賽正式啟動(dòng)

    睿??Ultra等設(shè)備及軟件工具套件,助力開(kāi)發(fā)者利用基于英特爾AI PC出色的計(jì)算和圖形性能進(jìn)行創(chuàng)意開(kāi)發(fā),讓每一位用戶(hù)都能真切體驗(yàn)到AI PC帶來(lái)的智能生產(chǎn)力躍升以及更加
    的頭像 發(fā)表于 12-19 11:23 ?638次閱讀

    英特爾推出新一代強(qiáng)大產(chǎn)品, 加速實(shí)現(xiàn) “AI 無(wú)處不在 ”

    英特爾? 酷睿? Ultra 和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器豐富了英特爾出色的AI產(chǎn)品組合,加速 AI 惠及千行百業(yè),開(kāi)啟全民
    發(fā)表于 12-16 16:27 ?420次閱讀
    <b class='flag-5'>英特爾</b>推出新一代<b class='flag-5'>強(qiáng)大</b>產(chǎn)品, 加速實(shí)現(xiàn) “<b class='flag-5'>AI</b> 無(wú)處不在 ”

    AI 無(wú)處不在,英特爾酷睿Ultra 和第五代英特爾至強(qiáng)可擴(kuò)展處理器正式發(fā)布

    英特爾 ?酷睿?Ultra處理器和第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器支持的AI產(chǎn)品亮相,展現(xiàn)英特爾從云到端全方位的
    的頭像 發(fā)表于 12-16 16:05 ?669次閱讀
    <b class='flag-5'>AI</b> 無(wú)處不在,<b class='flag-5'>英特爾</b>酷睿Ultra 和第五代<b class='flag-5'>英特爾</b>至強(qiáng)可擴(kuò)展處理器正式發(fā)布

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來(lái),英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第一個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai加速和邊緣
    的頭像 發(fā)表于 12-11 11:26 ?905次閱讀

    用上這個(gè)工具包,大模型推理性能加速達(dá)40倍

    作者: 英特爾公司 沈海豪、羅嶼、孟恒宇、董波、林俊 編者按: 只需不到9行代碼, 就能在CPU上實(shí)現(xiàn)出色的LLM推理性能英特爾 ?Extension for Transformer 創(chuàng)新
    的頭像 發(fā)表于 12-01 20:40 ?1084次閱讀
    用上這個(gè)工具包,大模型<b class='flag-5'>推理性能</b>加速達(dá)40倍