當(dāng)?shù)貢r(shí)間 9 月 12 日,思科正式宣布已停止生產(chǎn)其 HyperFlex 超融合基礎(chǔ)設(shè)施(HCI)產(chǎn)品。
思科表示,做出這個(gè)決定有兩方面的考慮。一方面是不斷變化的客戶需求和市場(chǎng)形勢(shì),讓自己重新考慮了針對(duì)這款設(shè)備的計(jì)劃;另一方面是超大規(guī)模計(jì)算公司開始涉足這個(gè)市場(chǎng)。例如,甲骨文剛剛將其本地云精簡(jiǎn)為一款可與大型超融合設(shè)備競(jìng)爭(zhēng)的產(chǎn)品。
思科沒有詳細(xì)解釋為何停止 HyperFlex,只是說,這是為客戶、合作伙伴和員工提供更有力的支持。思科發(fā)言人稱,思科“仍然致力于簡(jiǎn)化混合多云運(yùn)營(yíng)”。但實(shí)現(xiàn)這一目標(biāo)背后出力的是 Nutanix 而不是思科。兩家公司最近宣布合作,在思科硬件上運(yùn)行 Nutanix 的軟件堆棧,思科出售最終的設(shè)備并獲得傭金。
思科承諾為 HyperFlex 客戶提供五年的支持和服務(wù)。不過,對(duì)于使用 HyperFlex 運(yùn)行 VMware ESXi 虛擬機(jī)管理程序的客戶來說,這項(xiàng)服務(wù)很復(fù)雜。思科不會(huì)在其硬件上認(rèn)證未來版本的 ESXi ,也就是說 VMware 客戶要么在 ESXi 8.0 退出支持后依舊使用,要么運(yùn)行不受支持的代碼。
另一種選擇是完全放棄 HyperFlex,思科已經(jīng)針對(duì)這種情況發(fā)布了一份白皮書。亦或是清理 HyperFlex 并將其運(yùn)行的機(jī)器用作普通 UCS 服務(wù)器使用。為了讓該平臺(tái)的用戶有時(shí)間做好準(zhǔn)備。思科將在 2024 年 3 月 12 日之前繼續(xù)接受 HyperFlex 硬件和軟件的訂單,并嘗試在同年 6 月 10 日之前全部發(fā)貨。
厭倦了成為“others”
思科之所以放棄 HyperFlex,可能是因?yàn)樗匿N量始終沒能達(dá)到讓思科滿意。
IDC 2022 年底的數(shù)據(jù)顯示,在該市場(chǎng)中,VMware 占據(jù)了絕對(duì)優(yōu)勢(shì)的 41% 份額, Nutanix 占 25%,排名第三的HPE 占 7.3% ,這使得思科只能“屈居”于“其他”類別中。
思科一直在大肆宣傳自己在刀片服務(wù)器領(lǐng)域的實(shí)力——UCS 服務(wù)器占據(jù)利基市場(chǎng),但實(shí)際上從未撼動(dòng)過戴爾、 HPE 或聯(lián)想等其他玩家的地位。HyperFlex 對(duì)于改變這種局面似乎幫助不大,在思科將大部分工具轉(zhuǎn)向云和訂閱模式的時(shí)期,反而給思科帶來了維護(hù)管理軟件堆棧的負(fù)擔(dān)。
鑒于這塊業(yè)務(wù)始終無法做出成績(jī),而超大規(guī)模云又對(duì)服務(wù)器制造商構(gòu)成威脅,混合云又減少了對(duì)本地設(shè)備的需求,這也不難看出為什么思科決定讓 HyperFlex 的時(shí)代提前結(jié)束了。
不過思科沒有錯(cuò)過這輪AI網(wǎng)絡(luò)的風(fēng)口,此前就制定了一系列基于以太網(wǎng)的AI網(wǎng)絡(luò)戰(zhàn)略。
思科基于以太網(wǎng)的AI網(wǎng)絡(luò)戰(zhàn)略
思科云網(wǎng)絡(luò)、Nexus和ACI產(chǎn)品線產(chǎn)品管理副總裁Thomas Scheibe表示:“各組織正坐擁海量數(shù)據(jù),他們正在研究人工智能技術(shù),試圖讓這些數(shù)據(jù)更容易訪問,并更快地從中獲得價(jià)值??蛻粝胫浪麄冃枰诰W(wǎng)絡(luò)方面做什么,以便能運(yùn)行其龐大的 GPU 集群并處理大量數(shù)據(jù)。對(duì)于大多數(shù)客戶來說,以太網(wǎng)將是答案?!?/p>
為此,思科制定了一份藍(lán)圖,定義組織如何使用現(xiàn)有數(shù)據(jù)中心以太網(wǎng)來支持人工智能工作負(fù)載。思科人工智能藍(lán)圖的核心組件是其 Nexus 9000 數(shù)據(jù)中心交換機(jī),這些交換機(jī)的每個(gè) ASIC 高達(dá) 25.6Tbps 的帶寬,并且擁有可用的硬件和軟件功能,可提供所需的低延遲、擁塞管理機(jī)制和遙測(cè), 可提供 AI/ML 集群所需的極高吞吐量。
此外,最近思科在面向AI的新型高端可編程Silicon One處理器取得了全新進(jìn)展,芯片產(chǎn)品家族又添新成員。全新處理器包括Silicon One G202和Silicon One G200,能夠?qū)崿F(xiàn)25.6Tbps和51.2Tbps的轉(zhuǎn)發(fā)性能。兩款處理器建立在 Cisco Silicon One G100統(tǒng)一架構(gòu)的技術(shù)基礎(chǔ)之上實(shí)現(xiàn)突破創(chuàng)新。針對(duì)高帶寬、超大規(guī)模數(shù)據(jù)中心以及 AI/ML高性能網(wǎng)絡(luò)進(jìn)行了全面優(yōu)化,構(gòu)建無損、低延遲和高能效的AI數(shù)據(jù)中心。
RoCEv2 作為 AI 集群的傳輸
RDMA是眾所周知的用于高性能計(jì)算和存儲(chǔ)網(wǎng)絡(luò)環(huán)境的技術(shù)。RDMA 的優(yōu)點(diǎn)是在內(nèi)存到內(nèi)存級(jí)別的計(jì)算節(jié)點(diǎn)之間實(shí)現(xiàn)高吞吐量和低延遲的信息傳輸,而不會(huì)給 CPU 帶來負(fù)擔(dān)。該傳輸功能被卸載到網(wǎng)絡(luò)適配器硬件以繞過操作系統(tǒng)軟件網(wǎng)絡(luò)堆棧。
RDMA 提供了多種網(wǎng)絡(luò)傳輸實(shí)現(xiàn),包括InfiniBand 和基于以太網(wǎng)的RoCE。
InfiniBand (IB) 提供高吞吐量和 CPU 旁路,從而降低延遲。InfiniBand 還在協(xié)議中內(nèi)置了擁塞管理,這些優(yōu)勢(shì)使 InfiniBand 成為高性能計(jì)算傳輸?shù)氖走x。對(duì)于需要 HPC 工作負(fù)載的企業(yè)網(wǎng)絡(luò),InfiniBand 設(shè)計(jì)了一個(gè)單獨(dú)的網(wǎng)絡(luò)以利用其所有優(yōu)勢(shì),但這些專門構(gòu)建的網(wǎng)絡(luò)給企業(yè)帶來了額外的成本和復(fù)雜性。
RoCE 是 InfiniBand 的以太網(wǎng)轉(zhuǎn)發(fā)擴(kuò)展。RoCEv2 將 IB 傳輸封裝在以太網(wǎng)、IP 和 UDP 報(bào)頭中,因此可以通過以太網(wǎng)進(jìn)行路由。ROCEv2是一種高性能網(wǎng)絡(luò)計(jì)算技術(shù),可以讓數(shù)據(jù)直接在兩個(gè)設(shè)備的內(nèi)存之間傳輸,而無需涉及服務(wù)器CPU。它允許通過單個(gè)連接同時(shí)傳輸或路由多個(gè)數(shù)據(jù)包,從而減少延遲和復(fù)雜性并提高吞吐量。
RoCE 和 RoCEv2 幀格式,其中 RoCEv2 IP 和 UDP 報(bào)頭位于以太網(wǎng)之上
以太網(wǎng)在企業(yè)數(shù)據(jù)中心中無處不在,網(wǎng)絡(luò)管理員對(duì)以太網(wǎng)非常熟悉,這是該技術(shù)的一大優(yōu)勢(shì)。除此之外,經(jīng)濟(jì)性和創(chuàng)建承載常規(guī)企業(yè)流量以及 RDMA 工作負(fù)載的“融合”結(jié)構(gòu)對(duì)客戶非常有吸引力,這也是在數(shù)據(jù)中心網(wǎng)絡(luò)中實(shí)施 RoCEv2 的原因之一。
RoCEv2 需要無損傳輸,可以通過使用顯式擁塞通知 (ECN) 和優(yōu)先級(jí)流量控制 (PFC) 擁塞避免算法來實(shí)現(xiàn)。
AI集群需要無損網(wǎng)絡(luò)
對(duì)于RoCEv2傳輸,網(wǎng)絡(luò)必須提供高吞吐量和低延遲,同時(shí)避免在發(fā)生擁塞的情況下流量下降。Cisco Nexus 9000 通過 ECN 和 PFC 中的軟件和硬件遙測(cè)在無損網(wǎng)絡(luò)中提供支持和可見性。
顯式擁塞通知 (ECN)
在需要端到端傳播擁塞信息的情況下,可以使用ECN進(jìn)行擁塞管理。ECN 在 IP 報(bào)頭服務(wù)類型 (TOS) 字段內(nèi)的 2 個(gè)最低有效位內(nèi)經(jīng)歷擁塞的網(wǎng)絡(luò)節(jié)點(diǎn)中進(jìn)行標(biāo)記。當(dāng)接收方收到 ECN 擁塞經(jīng)歷位設(shè)置為 0x11 的數(shù)據(jù)包時(shí),它會(huì)生成擁塞通知數(shù)據(jù)包 (CNP) 并將其發(fā)送回發(fā)送方。當(dāng)發(fā)送方收到擁塞通知時(shí),它會(huì)減慢與該通知匹配的流量。這種端到端流程構(gòu)建在數(shù)據(jù)路徑中,因此是管理?yè)砣挠行Х椒ā?/p>
網(wǎng)絡(luò)設(shè)備和終端主機(jī)使用的 ECN 位值
ECN 本質(zhì)上是通過監(jiān)控網(wǎng)絡(luò)擁塞或其他可能導(dǎo)致數(shù)據(jù)包丟失的情況,并限制網(wǎng)絡(luò)以確保這種情況不會(huì)發(fā)生,從而實(shí)現(xiàn)無損以太網(wǎng)。無損以太網(wǎng)不僅是AI網(wǎng)絡(luò)的關(guān)鍵要求,也是當(dāng)今 VOIP 或視頻環(huán)境的關(guān)鍵要求。
優(yōu)先流量控制 (PFC)
優(yōu)先級(jí)流量控制在第 2 層網(wǎng)絡(luò)中引入,作為實(shí)現(xiàn)無損以太網(wǎng)的主要機(jī)制。流量控制由第 2 層幀中的服務(wù)類別 (COS) 值驅(qū)動(dòng),并使用暫停幀和暫停機(jī)制來指示和管理?yè)砣?。然而,?gòu)建可擴(kuò)展的第 2 層網(wǎng)絡(luò)對(duì)于網(wǎng)絡(luò)管理員來說是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。因此,網(wǎng)絡(luò)設(shè)計(jì)大多演變?yōu)榈?3 層路由結(jié)構(gòu)。
由于 RoCEv2 可以路由,因此 PFC 被調(diào)整為與DSCP 優(yōu)先級(jí)配合使用,以發(fā)出網(wǎng)絡(luò)中路由跳之間的擁塞信號(hào)。DSCP 是一種用于對(duì) IP 網(wǎng)絡(luò)上的網(wǎng)絡(luò)流量進(jìn)行分類的機(jī)制。它使用 IP 報(bào)頭中的 6 位差分服務(wù)字段來進(jìn)行數(shù)據(jù)包分類。使用第 3 層標(biāo)記使流量能夠跨路由器維護(hù)分類語(yǔ)義。由于 PFC 幀使用鏈路本地尋址,因此網(wǎng)絡(luò)設(shè)備可以接收并執(zhí)行路由和交換流量的暫停信令。PFC 從擁塞位置到流量源逐跳傳輸。此逐步行為可能需要一些時(shí)間才能傳播到源。PFC 用作管理 RoCEv2 傳輸擁塞的主要工具。
Cisco Nexus 9000 交換機(jī)支持 PFC 擁塞管理和 ECN 標(biāo)記,通過加權(quán)隨機(jī)早期檢測(cè) (WRED) 或近似公平丟棄 (AFD) 來指示網(wǎng)絡(luò)節(jié)點(diǎn)中的擁塞情況。
PFC 和 ECN 相輔相成,提供最高效的擁塞管理。它們共同在擁塞期間提供最高的吞吐量和最低的延遲損失,在構(gòu)建無損以太網(wǎng)中發(fā)揮著重要作用??偠灾?,這些技術(shù)可以使以太網(wǎng)能夠?qū)δ承┕ぷ髫?fù)載進(jìn)行優(yōu)先級(jí)排序,例如人工智能工作負(fù)載,它們不能容忍任何丟包,并且即使出現(xiàn)擁塞也始終獲得網(wǎng)絡(luò)優(yōu)先級(jí)。
Silicon One
思科AI網(wǎng)絡(luò)基礎(chǔ)設(shè)施的另一個(gè)要素是其新型高端可編程Silicon One處理器,該處理器旨在為企業(yè)提供大規(guī)模 AI/ML基礎(chǔ)設(shè)施。
思科將 5 納米 51.2Tbps Silicon One G200 和 25.6Tbps G202 添加到其Silicon One 系列中。這些處理器可以針對(duì)單個(gè)芯片組的路由或交換進(jìn)行定制,從而無需為每個(gè)網(wǎng)絡(luò)功能使用不同的芯片架構(gòu)。這是通過通用操作系統(tǒng)、P4 可編程轉(zhuǎn)發(fā)代碼和 SDK 來完成的。
思科表示,這些新設(shè)備位于 Silicon One 系列的頂端,將帶來網(wǎng)絡(luò)增強(qiáng)功能,使其成為要求苛刻的 AI/ML 部署或其他高度分布式應(yīng)用的理想選擇。Silicon One 系統(tǒng)的核心是支持增強(qiáng)的以太網(wǎng)功能,例如改進(jìn)的流量控制、擁塞感知和避免。該系統(tǒng)還包括先進(jìn)的負(fù)載平衡功能和“packet-spraying”功能,可將流量分散到多個(gè) GPU 或交換機(jī)上,以避免擁塞并改善延遲。思科表示,基于硬件的鏈路故障恢復(fù)還有助于確保網(wǎng)絡(luò)以最高效率運(yùn)行。
結(jié)合這些增強(qiáng)型以太網(wǎng)技術(shù)并進(jìn)一步推進(jìn),最終使客戶能夠建立思科所謂的Scheduled Fabric。思科表示,在Scheduled Fabric中,芯片物理組件、光學(xué)器件、交換機(jī)像一個(gè)大型模塊化機(jī)箱一樣連接在一起,并相互通信,以提供最佳的調(diào)度行為和更高的帶寬吞吐量。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
19100瀏覽量
228815 -
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5343瀏覽量
170803 -
交換機(jī)
+關(guān)注
關(guān)注
20文章
2610瀏覽量
99101 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237090 -
GPU芯片
+關(guān)注
關(guān)注
1文章
303瀏覽量
5770
原文標(biāo)題:思科新動(dòng)作:放棄 HyperFlex超融合,強(qiáng)化基于以太網(wǎng)的AI網(wǎng)絡(luò)戰(zhàn)略!
文章出處:【微信號(hào):SDNLAB,微信公眾號(hào):SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論