0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾發(fā)布中國定制版大模型專用芯片Gaudi2,用性價比挑戰(zhàn)英偉達

甲子光年 ? 來源:甲子光年 ? 2023-07-12 14:40 ? 次閱讀

訓練大模型,英偉達GPU不再是唯一選項。

7月11日,英特爾在北京舉辦AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會,正式于中國市場推出第二代深度學習加速器——Habana Gaudi2。

Habana是成立于2016年的AI芯片廠商,總部位于以色列,為數(shù)據(jù)中心提供可編程深度學習加速器。Habana在2019年推出了第一代Gaudi芯片,并在這一年12月被其早期投資人英特爾收購。

其實在2022年5月,英特爾已經(jīng)發(fā)布過Gaudi2。而這一次在北京的產(chǎn)品發(fā)布,是面向中國市場的“定制版”,類似英偉達推出A100與H100的定制版A800與H800。

英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera強調(diào),Gaudi2是完全合法合規(guī)的。

在性能方面,這款中國定制版訓練最主要的性能裁剪在于網(wǎng)絡(luò)端口。Gaudi2有21個百兆端口,而國際版有24個。不過,英特爾Habana Labs首席運營官Eitan Medina表示,“從客戶使用情況來看,預計影響會非常小”。

Gaudi2的推出,為訓練大模型提供了英偉達之外的替代方案。在此之前,英偉達的GPU芯片——A100與H100,幾乎壟斷了訓練大模型的市場。供需的極度不平衡也讓GPU一芯難求。

相比英偉達GPU,Gaudi2最顯著的優(yōu)勢在于“更高的性價比”。英特爾表示,將致力于為中國用戶提供更高的深度學習性能和效率,從而成為大規(guī)模部署AI的更優(yōu)解。

目前,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學習加速器的浪潮信息AI服務(wù)器。此外,新華三與超聚變也是英特爾的合作伙伴。

1.用性價比挑戰(zhàn)英偉達

目前,業(yè)內(nèi)普遍認為生成式AI和大語言模型僅適宜在GPU上運行。但英特爾Gaudi2正在向英偉達發(fā)起挑戰(zhàn)。

Gaudi2深度學習加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),采用了臺積電7nm工藝,專為訓練大語言模型而構(gòu)建。該加速器具備:

24個可編程Tensor處理器核心(TPCs)

21個100 Gbps(RoCEv2)以太網(wǎng)接口

96GB HBM2E內(nèi)存容量

2.4TB/秒的總內(nèi)存帶寬

48MB片上SRAM

集成多媒體處理引擎

Gaudi2真實性能表現(xiàn)如何?在發(fā)布會現(xiàn)場,英特爾多次與英偉達進行參數(shù)對比。

在6月公布的MLCommons MLPerf基準測試(被普遍認為是最具信服力的AI性能測試基準)結(jié)果中,Gaudi2在GPT-3模型、計算機視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了比A100更優(yōu)異的結(jié)果,但還弱于H100。

不僅如此,Gaudi2在性價比上更具優(yōu)勢。

在MLCommons剛剛公布的MLPerf訓練3.0結(jié)果中,Gaudi2在1750億參數(shù)的GPT-3模型上,從256個加速器到384個加速器可實現(xiàn)接近線性的95%擴展效果。

英特爾表示,Gaudi2的每瓦性能大約是A100的兩倍。而隨著性能的進一步優(yōu)化,英特爾預計在今年9月,Gaudi2的性價比將會超過H100。

值得一提的是,Gaudi2是僅有的兩個向GPT-3大模型訓練基準提交性能結(jié)果的解決方案之一。

英特爾Habana Labs首席運營官Eitan Medina強調(diào):“這說明了其他半導體廠商還無法構(gòu)建針對GPT-3的解決方案”。

除了模型的訓練,還需要模型的推理。Gaudi2可為大規(guī)模的多模態(tài)和語言模型提供出色的推理性能。

在最近的Hugging Face評估中,Gaudi2在大規(guī)模推理方面的表現(xiàn),包括在運行Stable Diffusion、70億以及1760億參數(shù)BLOOMz模型時,都在行業(yè)內(nèi)保持領(lǐng)先。

其中,與英偉達A100相比,Stable Diffusion推理時延降低2.21倍。

值得一提的是,下一代Gaudi3預計在明年推出,采用臺積電5nm工藝。

2.英特爾的AI戰(zhàn)略

英特爾擁有龐大豐富的產(chǎn)品線,Gaudi2并非唯一的AI產(chǎn)品。

針對AI在不同場景、不同環(huán)節(jié)的異構(gòu)計算需求,英特爾將其產(chǎn)品線分為通用計算與加速計算。

其中,英特爾的CPU產(chǎn)品,第四代至強處理器解決通用計算,滿足客戶在大部分模型較小場景的AI推理需求;Gaudi2解決加速計算,解決大模型的訓練及推理需求。

在通用計算層面,第四代英特爾至強可擴展處理器(英特爾AMX)為廣泛的AI負載和用例提供10倍的推理和訓練性能以及代際性能提升,同時每瓦性能比也比前代提高7.7倍。

在6月底公布的MLPerf訓練3.0結(jié)果表明,第四代至強可擴展處理器為企業(yè)提供了“開箱即用”的功能,可以在通用系統(tǒng)上部署AI,避免了引入專用AI系統(tǒng)的高昂成本和復雜性。

第四代至強可擴展處理器也能夠支持Stable Diffusion。英偉達DGX H100系統(tǒng)也會選擇搭配英特爾CPU,從而為企業(yè)級AI提供高速、高能效并節(jié)省成本。

百度、美團是英特爾AMX的客戶。英特爾AMX助力百度文心一言輕量版ERNIE-Tiny性能提升2.66倍,助力美團加速視覺AI推理服務(wù),成本降低80%。

值得一提的是,在加速計算層面,英特爾除了推出人工智能專用芯片Gaudi2之外,也在2022年推出了面向數(shù)據(jù)中心的的GPU Max系列(代號為Ponte Vecchio)。兩款產(chǎn)品在AI計算層面存在一定的重合度。

對此,英特爾透露會在2025年把Gaudi產(chǎn)品線與GPU產(chǎn)品線整合為統(tǒng)一架構(gòu)的新產(chǎn)品,并帶來更好的軟件適配能力與AI處理能力。

此外,正如英偉達依靠CUDA構(gòu)建護城河,英特爾也在加強軟件開發(fā)生態(tài)的支持。

英特爾推出的軟件套件針對Gaudi平臺深度學習業(yè)務(wù)進行了優(yōu)化,集成了對TensorFlow和PyTorch框架的支持,并面向400多個機器學習和深度學習AI模型進行驗證,涵蓋每個業(yè)務(wù)領(lǐng)域使用的最常見AI用例。

總結(jié)來看,英特爾正在通過異構(gòu)產(chǎn)品組合、開放式的軟件棧以及用于大模型訓練的Gaudi2集群,來降低人工智能的準入門檻,來滿足龐大的市場需求。

芯片是大模型訓練及推理的基礎(chǔ)設(shè)施,也是這場大模型淘金熱必不可少的“鏟子”。如今,隨著主流半導體巨頭紛紛布局,這場大模型的芯片戰(zhàn)已經(jīng)徹底打響了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50206

    瀏覽量

    420888
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9861

    瀏覽量

    171289
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3720

    瀏覽量

    90683
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2274

    瀏覽量

    2356
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    95

原文標題:英特爾發(fā)布中國定制版大模型專用芯片Gaudi2,用性價比挑戰(zhàn)英偉達|甲子光年

文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項重要決策,其最新的企業(yè)平臺將放棄采用英偉(Nvidia)的GPU,轉(zhuǎn)而選擇英特爾Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?420次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負載設(shè)計的Gaudi3加速器,這款新芯片雖在速度上不及英偉熱門
    的頭像 發(fā)表于 09-26 16:16 ?721次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預計該服務(wù)將于2025年初正式上線。此次合作標志著兩家
    的頭像 發(fā)表于 09-03 15:52 ?336次閱讀

    消息稱英特爾英偉封裝訂單

    市場需求,但仍面臨供需失衡的挑戰(zhàn)。據(jù)業(yè)內(nèi)消息,英偉等GPU大廠已轉(zhuǎn)向英特爾尋求封裝產(chǎn)能支持,凸顯了當前市場的緊迫性。
    的頭像 發(fā)表于 08-06 10:50 ?429次閱讀

    英偉、AMD、英特爾GPU產(chǎn)品及優(yōu)勢匯總

    主導地位,其銷售額預計將達到400億美元,遠超過競爭對手AMD和英特爾。那么這三家公司都有哪些GPU產(chǎn)品,各自的產(chǎn)品有何優(yōu)勢呢? ? 英偉????????????????????????????????????????????
    的頭像 發(fā)表于 05-10 00:59 ?4732次閱讀

    英特爾特供芯片性能暴降92%!

    英特爾針對中國市場推出的特供版Gaudi 3芯片在性能上確實存在大幅下降的情況,這主要是由于美國對于AI芯片的出口管制規(guī)則限制所導致的。
    的頭像 發(fā)表于 04-17 16:57 ?743次閱讀

    英特爾擬推出中國市場“特供版芯片Gaudi 3

    英特爾計劃在中國市場推出“特供版”Gaudi 3 AI芯片,這一決策主要是基于美國對于AI芯片的出口管制政策。
    的頭像 發(fā)表于 04-16 14:48 ?514次閱讀

    英特爾的最強AI芯片要來了,聲稱性能完勝英偉H100

    增加了近1.5倍。 與競爭對手的正面對標也不落下風。英特爾聲稱Gaudi3已全面超越英偉去年發(fā)布的H100
    的頭像 發(fā)表于 04-11 23:36 ?405次閱讀

    英特爾進軍AI芯片市場:推出Gaudi 3 AI加速卡與Xeon 6處理器

    Gaudi 3作為英特爾在AI領(lǐng)域的最新力作,旨在與英偉等市場領(lǐng)導者展開競爭。據(jù)英特爾透露,這款芯片
    的頭像 發(fā)表于 04-10 15:37 ?746次閱讀

    英偉顯卡和英特爾顯卡哪個好

    英偉(NVIDIA)和英特爾(Intel)在顯卡領(lǐng)域都有各自的優(yōu)勢和特點,具體哪個更好取決于您的需求和預算。
    的頭像 發(fā)表于 03-01 17:26 ?6934次閱讀

    英偉采用英特爾封裝技術(shù)提升產(chǎn)能

    臺積電仍將堅守主打地位,為英偉供應高達90%的尖端封裝產(chǎn)能。但推測中提到,自2024年第二季度起,英偉有意將英特爾的產(chǎn)能納入多款產(chǎn)品的制
    的頭像 發(fā)表于 02-01 15:27 ?588次閱讀

    英偉吸納英特爾加入供應鏈,緩解先進封裝產(chǎn)能緊張

    據(jù)it之家引用的報道稱,預計自今年2月份起,英特爾將會正式成為英偉供應鏈成員,每月能夠提供5000片晶圓的產(chǎn)能。英特爾已表達愿意參與
    的頭像 發(fā)表于 01-31 13:55 ?527次閱讀

    英特爾推出汽車版AI芯片,與高通、英偉展開競爭

    在2024年的國際消費電子展(CES)上,英特爾正式發(fā)布了一款專為汽車領(lǐng)域設(shè)計的人工智能(AI)芯片。這一創(chuàng)新產(chǎn)品標志著英特爾正式進軍車載AI市場,與高通和
    的頭像 發(fā)表于 01-15 15:43 ?885次閱讀

    英特爾宣布進軍汽車AI芯片市場

    英特爾發(fā)布推出了一系列AI軟件定義汽車系統(tǒng)芯片(SDV SoC),在車芯片市場與高通和英偉
    的頭像 發(fā)表于 01-12 11:33 ?807次閱讀

    英特爾Gaudi2C處理器或為Gaudi2的簡化版,Gaudi3預計2024年面世

    對于Gaudi2C和Gaudi2之間的差別,有推測認為它可能是“部分”改動后的產(chǎn)品,針對中國市場專門定制。Tomshardware則猜測可能是Gau
    的頭像 發(fā)表于 12-20 13:44 ?1073次閱讀