0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

針對英特爾,博通、微軟、谷歌他們做了什么

要長高 ? 來源:半導體行業(yè)觀察 ? 作者:半導體行業(yè)觀察 ? 2023-04-23 09:24 ? 次閱讀

憑借其GPU的領先優(yōu)勢,英偉達過去幾年炙手可熱,乘著ChatGPT熱潮,公司的市值從今年年初至今更是大漲了93.6%,過去五年的漲幅更是達到驚人的385%。雖然GPU是英偉達的最重要倚仗,但這絕不是美國芯片“當紅炸子雞”的唯一武器。

通過過去幾年的收購和自研,英偉達已經(jīng)打造起了一個涵蓋DPU、CPU和Switch,甚至硅光在內的多產(chǎn)品線巨頭,其目的就是想在一個服務器甚至一個機架中做很多的生意。但和很多做GPGPU或者AI芯片的競爭對手想取替GPU一樣,英偉達的“取替”計劃似乎也不是不能一帆風順。

近日,三巨頭更是再次出手,想把英偉達拒之門外。

1/博通芯片,瞄準Infiniband

熟悉博通的讀者應該知道,面向Switch市場,美國芯片巨頭擁有三條高端產(chǎn)品線,分別是面向高帶寬需求的Tomahawk、面向更多功能的 Trident,以及雖然帶寬不高,但是卻擁有更深的Buffer和更高可編程性的Jericho。

昨日,他們帶來了Jericho系列最新的產(chǎn)品Jericho3-AI。在他們看來,這是比英偉達Infiniband更適合AI的一個新選擇。

052a4dd4-e05c-11ed-bfe3-dac502259ad0.jpg

據(jù)博通所說,大公司(甚至 NVIDIA) 都認為 AI 工作負載會受到網(wǎng)絡延遲和帶寬的限制,而Jericho3-AI 的存在則旨在減少 AI 訓練期間花在網(wǎng)絡上的時間。其結構的主要特性是負載平衡以保持鏈路不擁塞、結構調度、零影響故障轉移以及具有高以太網(wǎng)基數(shù)(radix)。

博通強調,AI 工作負載具有獨特的特征,例如少量的大型、長期流,所有這些都在 AI 計算周期完成后同時開始。Jericho3-AI 結構為這些工作負載提供最高性能,具有專為 AI 工作負載設計的獨特功能:

完美的負載均衡將流量均勻分布在結構的所有鏈路上,確保在最高網(wǎng)絡負載下實現(xiàn)最大網(wǎng)絡利用率。

端到端流量調度的無擁塞操作可確保無流量沖突和抖動。

超高基數(shù)獨特地允許 Jericho3-AI 結構將連接擴展到單個集群中的 32,000 個 GPU,每個 800Gbps。

零影響故障轉移功能可確保在 10 納秒內自動收斂路徑,從而不會影響作業(yè)完成時間。

利用這一獨特的功能,與 All-to-All 等關鍵 AI 基準測試的替代網(wǎng)絡解決方案相比,Jericho3-AI 結構的工作完成時間至少縮短了 10%。這種性能改進對降低運行 AI 工作負載的成本具有乘法效應,因為它意味著昂貴的 AI 加速器的使用效率提高了10%。此外,Jericho3-AI 結構提供每秒 26 PB 的以太網(wǎng)帶寬,幾乎是上一代帶寬的四倍,同時每千兆比特的功耗降低 40%。

053d3890-e05c-11ed-bfe3-dac502259ad0.jpg

此外,Broadcom 表示,因為它可以處理 800Gbps 的端口速度(對于 PCIe Gen6 服務器)等等,所以它是一個更好的選擇。對于將“AI”放在產(chǎn)品名稱中,Broadcom 并沒有做出過多解讀,甚至關于網(wǎng)絡 AI計算功能,他們也沒涉及,這著實讓人摸不著頭腦,因為這是英偉達Infiniband 架構的主要賣點。

盡管如此,Broadcom 表示其 Jericho3-AI 以太網(wǎng)在 NCCL 性能方面比 NVIDIA 的 Infiniband 好大約 10%。

055e8324-e05c-11ed-bfe3-dac502259ad0.jpg

“Jericho3-AI 結構的一個獨特之處在于它提供了最高的性能,同時還實現(xiàn)了最低的總擁有成本。這是通過長距離 SerDes、分布式緩沖和高級遙測等屬性實現(xiàn)的,所有這些都使用行業(yè)標準以太網(wǎng)提供。這些因素為最大的硬件和軟件提供商生態(tài)系統(tǒng)提供了網(wǎng)絡架構和部署選項的高度靈活性?!辈┩◤娬{。

2/微軟,自研芯片再曝進展

因為ChatGPT大火的企業(yè)除了英偉達外,作為ChatGPT投資人的微軟也備受關注。在半導體行業(yè)觀察日前發(fā)布的文章《英偉達H100市面價格飆升!Elon Musk:每個人都在買GPU》中我們也披露,為了發(fā)展ChatGPT,微軟已經(jīng)搶購了不少GPU。隨著算力需求的增加,微軟在后續(xù)必須要更多的芯片支持。

如果一如既往地購買英偉達GPU,這對英偉達來說會是一筆昂貴的支出,他們也會為此不爽。于是,就恰如其分地,微軟的自研芯片有了更多信息曝光。

據(jù)路透社引述The Information 的報道,微軟公司正在開發(fā)自己的代號為“Athena”的人工智能芯片,該芯片將為 ChatGPT 等人工智能聊天機器人背后的技術提供支持。

根據(jù)該報告,這些芯片將用于訓練大型語言模型和支持推理——這兩者都是生成 AI 所需要的,例如 ChatGPT 中使用的 AI 來處理大量數(shù)據(jù)、識別模式并創(chuàng)建新的輸出來模仿人類對話。報告稱,微軟希望該芯片的性能優(yōu)于目前從其他供應商處購買的芯片,從而為其昂貴的 AI 工作節(jié)省時間和金錢。

雖然目前尚不清楚微軟是否會向其 Azure 云客戶提供這些芯片,但據(jù)報道,這家軟件制造商計劃最早于明年在微軟和 OpenAI 內部更廣泛地提供其 AI 芯片。據(jù)報道,該芯片的初始版本計劃使用臺積電 (TSMC) 的 5 納米工藝,不過作為該項目的一部分,可能會有多代芯片,因為微軟已經(jīng)制定了包括多個后代芯片的路線圖。

據(jù)報道,微軟認為自己的 AI 芯片并不能直接替代 Nvidia 的芯片,但隨著微軟繼續(xù)推動在Bing、Office 應用程序、GitHub和其他地方推出 AI 驅動的功能,內部的努力可能會大幅削減成本。研究公司 SemiAnalysis 的 Dylan Patel 也告訴The Information,“如果 Athena 具有競爭力,與 Nvidia 的產(chǎn)品相比,它可以將每芯片的成本降低三分之一?!?/p>

關于微軟造芯,最早可以追溯到2020年。據(jù)彭博社在當時的報道,微軟公司正在研究用于運行公司云服務的服務器計算機的內部處理器設計,以促進全行業(yè)減少對英特爾公司芯片技術依賴的努力。知情人士透露,這家全球最大的軟件制造商正在使用Arm的設計來生產(chǎn)將用于其數(shù)據(jù)中心的處理器。它還在探索使用另一種芯片來為其部分 Surface 系列個人電腦提供動力。

近年來,微軟加大了處理器工程師招聘力度,在英特爾、超微、英偉達等芯片制造商的后院招聘。2022年,他們甚至還從蘋果公司挖走了一位經(jīng)驗豐富的芯片設計師,以擴大自身的服務器芯片業(yè)務。據(jù)報道,這位名為Mike Filippo 的資深專家將在由 Rani Borkar 運營的微軟 Azure 集團內從事處理器方面的工作。微軟發(fā)言人證實了 Filippo 的聘用,他也曾在 Arm和英特爾公司工作過。

今年年初,微軟更是宣布收購了一家名為Fungible的DPU芯片公司。

微軟 Azure 核心部門的 CVP Girish Bablani 在一篇博文中寫道:“Fungible 的技術有助于實現(xiàn)具有可靠性和安全性的高性能、可擴展、分解、橫向擴展的數(shù)據(jù)中心基礎設施”。他進一步指出:“今天的公告進一步表明微軟致力于數(shù)據(jù)中心基礎設施進行長期差異化投資,這增強了公司的技術和產(chǎn)品范圍,包括卸載、改善延遲、增加數(shù)據(jù)中心服務器密度、優(yōu)化能源效率和降低成本?!盕ungible 在其網(wǎng)站上的一份聲明中寫道?!拔覀兒茏院滥艹蔀橐患覔碛?Fungible 愿景的公司的一員,并將利用 Fungible DPU 和軟件來增強其存儲和網(wǎng)絡產(chǎn)品?!?/p>

由此我們可以看到微軟在芯片上做更多的發(fā)布也不足為奇。

3/谷歌TPU,已經(jīng)第四代

在取代英偉達的這條路上,谷歌無疑是其中最堅定,且走得最遠的一個。

按照谷歌所說,公司谷歌早在 2006 年就考慮為神經(jīng)網(wǎng)絡構建專用集成電路 (ASIC),但到 2013 年情況變得緊迫。那時他們意識到神經(jīng)網(wǎng)絡快速增長的計算需求可能需要我們將數(shù)量 增加一倍我們運營的數(shù)據(jù)中心。從2015年開始,谷歌就將其TPU部署到了服務器中,并在后續(xù)的測試中獲得了不邵的反饋,以迭代其產(chǎn)品。

058d619e-e05c-11ed-bfe3-dac502259ad0.jpg

近日,谷歌對其TPUv4及其基于這個芯片的打造的超級計算系統(tǒng)進行了深度披露。

據(jù)他們在一篇博客中介紹,得益于互連技術和領域特定加速器 (DSA) 方面的關鍵創(chuàng)新,谷歌云 TPU v4 在擴展 ML 系統(tǒng)性能方面比 TPU v3 有了近 10 倍的飛躍;與當代 ML DSA 相比,提高能源效率約 2-3 倍。在與Nvidia A100 相比時,谷歌表示,TPU v4比前者快 1.2-1.7 倍,功耗低 1.3-1.9 倍。在與Graphcore的IPU BOW相比,谷歌表示,其芯片也擁有領先的優(yōu)勢。

05c4ec40-e05c-11ed-bfe3-dac502259ad0.png

基于這個芯片,谷歌打造了一個擁有 4,096 個張量處理單元 (TPU)的TPU v4 超級計算機。谷歌表示,這些芯片由內部開發(fā)的行業(yè)領先的光電路開關 (OCS) 互連,OCS 互連硬件允許谷歌的 4K TPU 節(jié)點超級計算機與 1,000 個 CPU 主機一起運行,這些主機偶爾(0.1-1.0% 的時間)不可用而不會引起問題。

據(jù)谷歌介紹,OCS 動態(tài)重新配置其互連拓撲,以提高規(guī)模、可用性、利用率、模塊化、部署、安全性、功率和性能。與 Infiniband 相比,OCS 和底層光學組件更便宜、功耗更低且速度更快,不到 TPU v4 系統(tǒng)成本的 5% 和系統(tǒng)功耗的 5% 以下。下圖顯示了 OCS 如何使用兩個 MEM 陣列工作。不需要光到電到光的轉換或耗電的網(wǎng)絡分組交換機,從而節(jié)省了電力。

05d6d4fa-e05c-11ed-bfe3-dac502259ad0.png

值得一提的是,TPU v4 超級計算機包括 SparseCores,這是一種更接近高帶寬內存的中間芯片,許多 AI 運算都發(fā)生在該芯片上。SparseCores 的概念支持 AMD、英特爾和高通等公司正在研究的新興計算架構,該架構依賴于計算更接近數(shù)據(jù),以及數(shù)據(jù)進出內存之間的協(xié)調。

此外,谷歌還在算法-芯片協(xié)同方面做了更大的投入。如半導體行業(yè)觀察之前的文章《從谷歌TPU 看AI芯片的未來》中所說;“隨著摩爾定律未來越來越接近物理極限,預計未來人工智能芯片性能進一步提升會越來越倚賴算法-芯片協(xié)同設計,而另一方面,由于有算法-芯片協(xié)同設計,我們預計未來人工智能芯片的性能仍然將保持類似摩爾定律的接近指數(shù)級提升,因此人工智能芯片仍然將會是半導體行業(yè)未來幾年最為熱門的方向之一,也將會成為半導體行業(yè)未來繼續(xù)發(fā)展的重要引擎?!?/p>

寫在最后

綜合上述報道我們可以直言,對于英偉達而言,其面臨的挑戰(zhàn)是方方面面的,而不是僅僅局限于其GPU。其對手也不僅僅是芯片公司,因此如何在規(guī)?;瘍?yōu)勢的情況下,保證其高性價比,是安然度過未來潛在挑戰(zhàn)的有效方法之一。

不過,可以肯定的是,圍繞著數(shù)據(jù)中心的創(chuàng)新遠未接近停止,甚至可以說因為大模型的流行,這場戰(zhàn)斗才剛剛開始。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    60

    文章

    9747

    瀏覽量

    170640
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10698

    瀏覽量

    209329
  • 谷歌
    +關注

    關注

    27

    文章

    6080

    瀏覽量

    104347
  • 服務器
    +關注

    關注

    12

    文章

    8700

    瀏覽量

    84531
  • DPU
    DPU
    +關注

    關注

    0

    文章

    343

    瀏覽量

    24044
收藏 人收藏

    評論

    相關推薦

    英特爾或被道瓊斯指數(shù)除名

    近期,英特爾公司因其在股市的持續(xù)疲軟表現(xiàn),正面臨被道瓊斯工業(yè)平均指數(shù)(DJIA)除名的風險。作為1999年互聯(lián)網(wǎng)熱潮時期首批躋身道指的科技巨頭之一(另一家為微軟),英特爾如今卻成為該指數(shù)中表現(xiàn)最為黯淡的成員。
    的頭像 發(fā)表于 09-04 15:54 ?175次閱讀

    英特爾CEO:AI時代英特爾動力不減

    英特爾CEO帕特·基辛格堅信,在AI技術的飛速發(fā)展之下,英特爾的處理器仍能保持其核心地位?;粮窆_表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術上的創(chuàng)新能力將持續(xù)驅動公司前進。
    的頭像 發(fā)表于 06-06 10:04 ?298次閱讀

    英特爾、AMD等聯(lián)手推出UALink,希望用它取代Nvidia NVLink接口

    周四,英特爾、AMD、通、思科、谷歌、HPE、Meta和微軟宣布正在建立一個新的行業(yè)組織——Ultra Accelerator Link(UALink)推廣組,以指導數(shù)據(jù)中心AI加速
    的頭像 發(fā)表于 05-31 11:46 ?1475次閱讀
    <b class='flag-5'>英特爾</b>、AMD等聯(lián)手推出UALink,希望用它取代Nvidia NVLink接口

    英特爾微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

    近日,英特爾針對微軟的多個Phi-3家族的開放模型,驗證并優(yōu)化了其跨客戶端、邊緣和數(shù)據(jù)中心的AI產(chǎn)品組合。
    的頭像 發(fā)表于 05-27 11:15 ?443次閱讀

    微軟正在與英偉達、AMD和英特爾合作以改進PC游戲畫質技術

    微軟公布了一項新的Windows API,旨在為游戲開發(fā)者提供一種無縫的方式,讓他們能夠集成英偉達、AMD和英特爾的超分辨率AI Up scaling功能。
    的頭像 發(fā)表于 03-11 16:48 ?725次閱讀

    英特爾:2025年全球AIPC將超1億臺占比20%

    英特爾行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月29日 09:15:26

    英特爾1nm投產(chǎn)時間曝光!領先于臺積電

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月28日 16:28:32

    Cirrus Logic與英特爾微軟在全新的PC參考設計上進行合作

    Cirrus Logic 近日與英特爾微軟在全新的PC參考設計上進行合作。該設計將采用Cirrus Logic的高性能音頻和電源技術以及英特爾即將推出的代碼為Lunar Lake的客戶端處理器。
    的頭像 發(fā)表于 02-27 13:49 ?325次閱讀

    微軟英特爾達成價值數(shù)十億美元的定制芯片交易

    英特爾將生產(chǎn)由微軟設計的定制芯片,這是英特爾稱價值超過150億美元的交易的一部分。
    的頭像 發(fā)表于 02-26 16:26 ?804次閱讀

    英特爾拿下微軟芯片代工訂單

    。此外,英特爾還宣布推出了全球首個專為人工智能(AI)時代設計的系統(tǒng)級晶圓代工服務(Systems Foundry),并透露微軟已成為其首個重要客戶,將采用Intel 18A制程技術打造新芯片。
    的頭像 發(fā)表于 02-26 10:01 ?537次閱讀

    英特爾重塑代工業(yè)務的五個關鍵要點簡析

    英特爾將為微軟代工新芯片,挑戰(zhàn)臺積電地位。
    的頭像 發(fā)表于 02-25 16:59 ?697次閱讀
    <b class='flag-5'>英特爾</b>重塑代工業(yè)務的五個關鍵要點簡析

    微軟將使用英特爾的18A技術生產(chǎn)芯片

    微軟將使用英特爾的18A技術生產(chǎn)芯片 據(jù)外媒報道微軟公司計劃使用英特爾的18A制造技術生產(chǎn)自研芯片。但是目前沒有確切的消息表明微軟將生產(chǎn)什么
    的頭像 發(fā)表于 02-22 17:35 ?665次閱讀

    英特爾登頂2023年全球半導體榜單之首

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月01日 11:55:16

    英特爾和AMD處理器的區(qū)別和特點

    英特爾和AMD處理器的區(qū)別和特點 英特爾(Intel)和AMD是全球最著名的兩個處理器制造商。他們都提供高性能、可靠的芯片,為消費者和企業(yè)用戶提供強大的計算能力。然而,他們之間存在很多
    的頭像 發(fā)表于 01-30 14:28 ?1941次閱讀

    #高通 #英特爾 #Elite 高通X Elite芯片或終結蘋果、英特爾的芯片王朝

    高通英特爾蘋果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07