在早前舉辦的Computex,Nvidia 通過推出其 Spectrum-X 平臺(tái)承諾為生成 AI 工作負(fù)載提供“無損以太網(wǎng)”——但如果你問 Broadcom,這甚至不是一個(gè)新想法。
Broadcom 核心交換組高級(jí)副總裁 Ram Velaga 告訴The Register說:“他們的設(shè)備沒有什么我們沒有的獨(dú)特之處?!?/p>
他解釋說,Nvidia 實(shí)際上用 Spectrum-X 所做的是構(gòu)建一個(gè)垂直集成的以太網(wǎng)平臺(tái),該平臺(tái)擅長(zhǎng)以最小化尾延遲和減少 AI 作業(yè)完成時(shí)間的方式管理擁塞。
Velaga 認(rèn)為,這與 Broadcom 對(duì)其Tomahawk5和Jericho3-AI交換機(jī) ASIC所做的沒有什么不同。他還認(rèn)為 Nvidia 承認(rèn)以太網(wǎng)對(duì)于處理 AI 中的 GPU 流更有意義。
Nvidia 的 Spectrum-X
就 Nvidia 而言,它并沒有放棄 InfiniBand 網(wǎng)絡(luò)。InfiniBand 非常適合那些運(yùn)行少量非常大的工作負(fù)載的用戶——例如 GPT3 或數(shù)字孿生。然而,Nvidia 網(wǎng)絡(luò)部門營(yíng)銷副總裁 Gilad Shainer 告訴The Register,在某些環(huán)境中,尤其是多租戶云,以太網(wǎng)是首選。
Shainer 說,對(duì)于較小的 AI/ML 工作負(fù)載,傳統(tǒng)的以太網(wǎng)基礎(chǔ)設(shè)施工作得很好——但現(xiàn)在這些工作負(fù)載的增長(zhǎng)超出了一個(gè)節(jié)點(diǎn),速度太慢了。
Nvidia 的 Spectrum-X 平臺(tái)聲稱可以應(yīng)對(duì)這一挑戰(zhàn)。
需要明確的是,Nvidia 的 Spectrum-X 不是產(chǎn)品。它是硬件和軟件的集合,我們過去已經(jīng)介紹了其中的大部分內(nèi)容。核心組件包括 Nvidia 的 51.2Tbit/sec Spectrum-4 以太網(wǎng)交換機(jī)和BlueField-3數(shù)據(jù)處理單元 (DPU)。
基本思想是,只要您同時(shí)使用 Nvidia 的交換機(jī)和它的 DPU,它們就會(huì)協(xié)同工作以緩解流量擁塞,并且——如果 Nvidia 可信的話——完全消除數(shù)據(jù)包丟失。
雖然 Shainer 聲稱這是 Nvidia 的一個(gè)全新功能單元,但 Velaga 認(rèn)為“無損以太網(wǎng)”的想法只是營(yíng)銷。“與其說它是無損的,不如說你有效地管理了擁塞,以至于你擁有了一個(gè)非常高效的以太網(wǎng)結(jié)構(gòu),”他爭(zhēng)辯道。
換句話說,不是包丟失是給定的以太網(wǎng)網(wǎng)絡(luò),而是規(guī)則的例外。無論如何,這就是想法。
此外,Velaga 聲稱這種擁塞管理已經(jīng)內(nèi)置到 Broadcom 最新一代的交換機(jī) ASIC 中——只有它們可以與任何供應(yīng)商或云服務(wù)提供商的 smartNIC 或 DPU 一起使用?!澳悴槐卦?NIC 上做,你可以從一個(gè) Jericho3-AI 到另一個(gè) Jericho3-AI ,”他補(bǔ)充道。
當(dāng)我們向 Shainer 詢問 Broadcom 的 Tomahawk5 和 Jericho3-AI 時(shí),他拒絕與這些芯片進(jìn)行比較,他辯稱 Spectrum-X 屬于自己的一類,并暗示一些供應(yīng)商只是將“AI”附加到現(xiàn)有產(chǎn)品上。
“無論你怎么稱呼它,都沒有任何東西具有專為 AI 設(shè)計(jì)的功能,”他說。
垂直整合與分解
根據(jù) Velaga 的說法,Nvidia 試圖實(shí)現(xiàn)的垂直整合與以太網(wǎng)相沖突?!耙蕴W(wǎng)今天成功的全部原因是它是一個(gè)非常開放的生態(tài)系統(tǒng),”他說。
正因?yàn)槿绱耍琋vidia 的 Spectrum-X 可能被證明對(duì)云提供商來說是一個(gè)艱難的銷售,云提供商傾向于盡可能避免供應(yīng)商鎖定。他們強(qiáng)烈希望避免這種情況,導(dǎo)致廣泛采用與供應(yīng)商無關(guān)的網(wǎng)絡(luò)操作系統(tǒng),如 SONiC。這使他們能夠在任何兼容的交換機(jī)上運(yùn)行他們的云。
就其價(jià)值而言,Nvidia 的 Spectrum-4確實(shí)支持 SONiC,以及它自己的 Cumulus NOS 和 Linux Switch 驅(qū)動(dòng)程序。但是,由于 Spectrum-X 平臺(tái)依賴于同時(shí)擁有 Spectrum-4 和 BlueField,因此您不能只將一個(gè)換成另一個(gè)兼容 SONiC 的開關(guān)或 DPU 而不會(huì)損失功能。
說到 DPU,許多最大的云服務(wù)提供商已經(jīng)擁有適合其環(huán)境的 SmartNIC。Amazon Web Services 擁有 Nitro,Google 與 Intel 共同開發(fā)了基于 ASIC 的 SmartNIC,Microsoft在 1 月份收購了 Fungible 。這些設(shè)備對(duì)云提供商來說非常有價(jià)值,因?yàn)樗鼈冊(cè)试S他們卸載常見的網(wǎng)絡(luò)、存儲(chǔ)和安全工作負(fù)載——釋放 CPU 來運(yùn)行租戶工作負(fù)載。
Shainer 說這完全沒問題。他認(rèn)為云提供商可以使用他們現(xiàn)有的 DPU 來管理他們的基礎(chǔ)設(shè)施和控制南北流量,并使用 Nvidia 的 BlueField-3 來控制集群中節(jié)點(diǎn)之間的東西向流量。
他補(bǔ)充說,也沒有什么能阻止人們將 Nvidia 的交換機(jī)或 DPU 作為獨(dú)立產(chǎn)品進(jìn)行部署。
“如果有人想使用我們的交換機(jī)并構(gòu)建他們自己的東西,我們非常歡迎。如果有人想使用我們的 DPU 并使用其他人的交換機(jī),當(dāng)然 - 去吧。你可以自己開發(fā)這些東西,”Shainer 說?!暗?,如果你想獲得完全優(yōu)化的東西,全堆棧......并在四個(gè)星期而不是六、七或八個(gè)月內(nèi)啟動(dòng)系統(tǒng)?無價(jià)之寶?!?/p>
Broadcom 的 Velaga 不太確定客戶會(huì)如何接受這個(gè)想法?!昂茈y說在一個(gè)一切都被分解的世界里,他們將如何銷售垂直集成以太網(wǎng)解決方案的價(jià)值。”
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5348瀏覽量
170850 -
DPU
+關(guān)注
關(guān)注
0文章
353瀏覽量
24103 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3723瀏覽量
90711
原文標(biāo)題:博通評(píng)論英偉達(dá)競(jìng)品:沒有獨(dú)到之處
文章出處:【微信號(hào):TenOne_TSMC,微信公眾號(hào):芯片半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論