国产拍揄自揄免费观看,GOGOGO大但人文艺术,手机看片1024欧美日韩你懂的

思科宣布停止HyperFlex產(chǎn)品

當(dāng)?shù)貢r(shí)間 9 月 12 日，思科正式宣布已停止生產(chǎn)其 HyperFlex 超融合基礎(chǔ)設(shè)施（HCI）產(chǎn)品。

思科表示，做出這個(gè)決定有兩方面的考慮。一方面是不斷變化的客戶需求和市場(chǎng)形勢(shì)，讓自己重新考慮了針對(duì)這款設(shè)備的計(jì)劃；另一方面是超大規(guī)模計(jì)算公司開始涉足這個(gè)市場(chǎng)。例如，甲骨文剛剛將其本地云精簡(jiǎn)為一款可與大型超融合設(shè)備競(jìng)爭(zhēng)的產(chǎn)品。

思科沒有詳細(xì)解釋為何停止 HyperFlex，只是說，這是為客戶、合作伙伴和員工提供更有力的支持。思科發(fā)言人稱，思科“仍然致力于簡(jiǎn)化混合多云運(yùn)營(yíng)”。但實(shí)現(xiàn)這一目標(biāo)背后出力的是 Nutanix 而不是思科。兩家公司最近宣布合作，在思科硬件上運(yùn)行 Nutanix 的軟件堆棧，思科出售最終的設(shè)備并獲得傭金。

思科承諾為 HyperFlex 客戶提供五年的支持和服務(wù)。不過，對(duì)于使用 HyperFlex 運(yùn)行 VMware ESXi 虛擬機(jī)管理程序的客戶來說，這項(xiàng)服務(wù)很復(fù)雜。思科不會(huì)在其硬件上認(rèn)證未來版本的 ESXi ，也就是說 VMware 客戶要么在 ESXi 8.0 退出支持后依舊使用，要么運(yùn)行不受支持的代碼。

另一種選擇是完全放棄 HyperFlex，思科已經(jīng)針對(duì)這種情況發(fā)布了一份白皮書。亦或是清理 HyperFlex 并將其運(yùn)行的機(jī)器用作普通 UCS 服務(wù)器使用。為了讓該平臺(tái)的用戶有時(shí)間做好準(zhǔn)備。思科將在 2024 年 3 月 12 日之前繼續(xù)接受 HyperFlex 硬件和軟件的訂單，并嘗試在同年 6 月 10 日之前全部發(fā)貨。

厭倦了成為“others”

思科之所以放棄 HyperFlex，可能是因?yàn)樗匿N量始終沒能達(dá)到讓思科滿意。

IDC 2022 年底的數(shù)據(jù)顯示，在該市場(chǎng)中，VMware 占據(jù)了絕對(duì)優(yōu)勢(shì)的 41% 份額， Nutanix 占 25%，排名第三的HPE 占 7.3% ，這使得思科只能“屈居”于“其他”類別中。

思科一直在大肆宣傳自己在刀片服務(wù)器領(lǐng)域的實(shí)力——UCS 服務(wù)器占據(jù)利基市場(chǎng)，但實(shí)際上從未撼動(dòng)過戴爾、 HPE 或聯(lián)想等其他玩家的地位。HyperFlex 對(duì)于改變這種局面似乎幫助不大，在思科將大部分工具轉(zhuǎn)向云和訂閱模式的時(shí)期，反而給思科帶來了維護(hù)管理軟件堆棧的負(fù)擔(dān)。

鑒于這塊業(yè)務(wù)始終無法做出成績(jī)，而超大規(guī)模云又對(duì)服務(wù)器制造商構(gòu)成威脅，混合云又減少了對(duì)本地設(shè)備的需求，這也不難看出為什么思科決定讓 HyperFlex 的時(shí)代提前結(jié)束了。

不過思科沒有錯(cuò)過這輪AI 網(wǎng)絡(luò)的風(fēng)口，此前就制定了一系列基于以太網(wǎng)的AI網(wǎng)絡(luò)戰(zhàn)略。

思科基于以太網(wǎng)的AI網(wǎng)絡(luò)戰(zhàn)略

思科云網(wǎng)絡(luò)、Nexus和ACI產(chǎn)品線產(chǎn)品管理副總裁Thomas Scheibe表示：“各組織正坐擁海量數(shù)據(jù)，他們正在研究人工智能技術(shù)，試圖讓這些數(shù)據(jù)更容易訪問，并更快地從中獲得價(jià)值?？蛻粝胫浪麄冃枰诰W(wǎng)絡(luò)方面做什么，以便能運(yùn)行其龐大的 GPU 集群并處理大量數(shù)據(jù)。對(duì)于大多數(shù)客戶來說，以太網(wǎng)將是答案?！?/p>

為此，思科制定了一份藍(lán)圖，定義組織如何使用現(xiàn)有數(shù)據(jù)中心以太網(wǎng)來支持人工智能工作負(fù)載。思科人工智能藍(lán)圖的核心組件是其 Nexus 9000 數(shù)據(jù)中心交換機(jī)，這些交換機(jī)的每個(gè) ASIC 高達(dá) 25.6Tbps 的帶寬，并且擁有可用的硬件和軟件功能，可提供所需的低延遲、擁塞管理機(jī)制和遙測(cè)，可提供 AI/ML 集群所需的極高吞吐量。

此外，最近思科在面向AI的新型高端可編程Silicon One處理器取得了全新進(jìn)展，芯片產(chǎn)品家族又添新成員。全新處理器包括Silicon One G202和Silicon One G200，能夠?qū)崿F(xiàn)25.6Tbps和51.2Tbps的轉(zhuǎn)發(fā)性能。兩款處理器建立在 Cisco Silicon One G100統(tǒng)一架構(gòu)的技術(shù)基礎(chǔ)之上實(shí)現(xiàn)突破創(chuàng)新。針對(duì)高帶寬、超大規(guī)模數(shù)據(jù)中心以及 AI/ML高性能網(wǎng)絡(luò)進(jìn)行了全面優(yōu)化，構(gòu)建無損、低延遲和高能效的AI數(shù)據(jù)中心。

RoCEv2 作為 AI 集群的傳輸

RDMA是眾所周知的用于高性能計(jì)算和存儲(chǔ)網(wǎng)絡(luò)環(huán)境的技術(shù)。RDMA 的優(yōu)點(diǎn)是在內(nèi)存到內(nèi)存級(jí)別的計(jì)算節(jié)點(diǎn)之間實(shí)現(xiàn)高吞吐量和低延遲的信息傳輸，而不會(huì)給 CPU 帶來負(fù)擔(dān)。該傳輸功能被卸載到網(wǎng)絡(luò)適配器硬件以繞過操作系統(tǒng)軟件網(wǎng)絡(luò)堆棧。

RDMA 提供了多種網(wǎng)絡(luò)傳輸實(shí)現(xiàn)，包括InfiniBand 和基于以太網(wǎng)的RoCE。

InfiniBand (IB) 提供高吞吐量和 CPU 旁路，從而降低延遲。InfiniBand 還在協(xié)議中內(nèi)置了擁塞管理，這些優(yōu)勢(shì)使 InfiniBand 成為高性能計(jì)算傳輸?shù)氖走x。對(duì)于需要 HPC 工作負(fù)載的企業(yè)網(wǎng)絡(luò)，InfiniBand 設(shè)計(jì)了一個(gè)單獨(dú)的網(wǎng)絡(luò)以利用其所有優(yōu)勢(shì)，但這些專門構(gòu)建的網(wǎng)絡(luò)給企業(yè)帶來了額外的成本和復(fù)雜性。

RoCE 是 InfiniBand 的以太網(wǎng)轉(zhuǎn)發(fā)擴(kuò)展。RoCEv2 將 IB 傳輸封裝在以太網(wǎng)、IP 和 UDP 報(bào)頭中，因此可以通過以太網(wǎng)進(jìn)行路由。ROCEv2是一種高性能網(wǎng)絡(luò)計(jì)算技術(shù)，可以讓數(shù)據(jù)直接在兩個(gè)設(shè)備的內(nèi)存之間傳輸，而無需涉及服務(wù)器CPU。它允許通過單個(gè)連接同時(shí)傳輸或路由多個(gè)數(shù)據(jù)包，從而減少延遲和復(fù)雜性并提高吞吐量。

RoCE 和 RoCEv2 幀格式，其中 RoCEv2 IP 和 UDP 報(bào)頭位于以太網(wǎng)之上

以太網(wǎng)在企業(yè)數(shù)據(jù)中心中無處不在，網(wǎng)絡(luò)管理員對(duì)以太網(wǎng)非常熟悉，這是該技術(shù)的一大優(yōu)勢(shì)。除此之外，經(jīng)濟(jì)性和創(chuàng)建承載常規(guī)企業(yè)流量以及 RDMA 工作負(fù)載的“融合”結(jié)構(gòu)對(duì)客戶非常有吸引力，這也是在數(shù)據(jù)中心網(wǎng)絡(luò)中實(shí)施 RoCEv2 的原因之一。

RoCEv2 需要無損傳輸，可以通過使用顯式擁塞通知 (ECN) 和優(yōu)先級(jí)流量控制 (PFC) 擁塞避免算法來實(shí)現(xiàn)。

AI集群需要無損網(wǎng)絡(luò)

對(duì)于RoCEv2傳輸，網(wǎng)絡(luò)必須提供高吞吐量和低延遲，同時(shí)避免在發(fā)生擁塞的情況下流量下降。Cisco Nexus 9000 通過 ECN 和 PFC 中的軟件和硬件遙測(cè)在無損網(wǎng)絡(luò)中提供支持和可見性。

顯式擁塞通知 (ECN)

在需要端到端傳播擁塞信息的情況下，可以使用ECN進(jìn)行擁塞管理。ECN 在 IP 報(bào)頭服務(wù)類型 (TOS) 字段內(nèi)的 2 個(gè)最低有效位內(nèi)經(jīng)歷擁塞的網(wǎng)絡(luò)節(jié)點(diǎn)中進(jìn)行標(biāo)記。當(dāng)接收方收到 ECN 擁塞經(jīng)歷位設(shè)置為 0x11 的數(shù)據(jù)包時(shí)，它會(huì)生成擁塞通知數(shù)據(jù)包 (CNP) 并將其發(fā)送回發(fā)送方。當(dāng)發(fā)送方收到擁塞通知時(shí)，它會(huì)減慢與該通知匹配的流量。這種端到端流程構(gòu)建在數(shù)據(jù)路徑中，因此是管理?yè)砣挠行Х椒ā?/p>

網(wǎng)絡(luò)設(shè)備和終端主機(jī)使用的 ECN 位值

ECN 本質(zhì)上是通過監(jiān)控網(wǎng)絡(luò)擁塞或其他可能導(dǎo)致數(shù)據(jù)包丟失的情況，并限制網(wǎng)絡(luò)以確保這種情況不會(huì)發(fā)生，從而實(shí)現(xiàn)無損以太網(wǎng)。無損以太網(wǎng)不僅是AI網(wǎng)絡(luò)的關(guān)鍵要求，也是當(dāng)今 VOIP 或視頻環(huán)境的關(guān)鍵要求。

優(yōu)先流量控制 (PFC)

優(yōu)先級(jí)流量控制在第 2 層網(wǎng)絡(luò)中引入，作為實(shí)現(xiàn)無損以太網(wǎng)的主要機(jī)制。流量控制由第 2 層幀中的服務(wù)類別 (COS) 值驅(qū)動(dòng)，并使用暫停幀和暫停機(jī)制來指示和管理?yè)砣?。然而，?gòu)建可擴(kuò)展的第 2 層網(wǎng)絡(luò)對(duì)于網(wǎng)絡(luò)管理員來說是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。因此，網(wǎng)絡(luò)設(shè)計(jì)大多演變?yōu)榈?3 層路由結(jié)構(gòu)。

由于 RoCEv2 可以路由，因此 PFC 被調(diào)整為與DSCP 優(yōu)先級(jí)配合使用，以發(fā)出網(wǎng)絡(luò)中路由跳之間的擁塞信號(hào)。DSCP 是一種用于對(duì) IP 網(wǎng)絡(luò)上的網(wǎng)絡(luò)流量進(jìn)行分類的機(jī)制。它使用 IP 報(bào)頭中的 6 位差分服務(wù)字段來進(jìn)行數(shù)據(jù)包分類。使用第 3 層標(biāo)記使流量能夠跨路由器維護(hù)分類語(yǔ)義。由于 PFC 幀使用鏈路本地尋址，因此網(wǎng)絡(luò)設(shè)備可以接收并執(zhí)行路由和交換流量的暫停信令。PFC 從擁塞位置到流量源逐跳傳輸。此逐步行為可能需要一些時(shí)間才能傳播到源。PFC 用作管理 RoCEv2 傳輸擁塞的主要工具。

Cisco Nexus 9000 交換機(jī)支持 PFC 擁塞管理和 ECN 標(biāo)記，通過加權(quán)隨機(jī)早期檢測(cè) (WRED) 或近似公平丟棄 (AFD) 來指示網(wǎng)絡(luò)節(jié)點(diǎn)中的擁塞情況。

PFC 和 ECN 相輔相成，提供最高效的擁塞管理。它們共同在擁塞期間提供最高的吞吐量和最低的延遲損失，在構(gòu)建無損以太網(wǎng)中發(fā)揮著重要作用?？偠灾?，這些技術(shù)可以使以太網(wǎng)能夠?qū)δ承┕ぷ髫?fù)載進(jìn)行優(yōu)先級(jí)排序，例如人工智能工作負(fù)載，它們不能容忍任何丟包，并且即使出現(xiàn)擁塞也始終獲得網(wǎng)絡(luò)優(yōu)先級(jí)。

Silicon One

思科AI網(wǎng)絡(luò)基礎(chǔ)設(shè)施的另一個(gè)要素是其新型高端可編程Silicon One處理器，該處理器旨在為企業(yè)提供大規(guī)模 AI/ML基礎(chǔ)設(shè)施。

思科將 5 納米 51.2Tbps Silicon One G200 和 25.6Tbps G202 添加到其Silicon One 系列中。這些處理器可以針對(duì)單個(gè)芯片組的路由或交換進(jìn)行定制，從而無需為每個(gè)網(wǎng)絡(luò)功能使用不同的芯片架構(gòu)。這是通過通用操作系統(tǒng)、P4 可編程轉(zhuǎn)發(fā)代碼和 SDK 來完成的。

思科表示，這些新設(shè)備位于 Silicon One 系列的頂端，將帶來網(wǎng)絡(luò)增強(qiáng)功能，使其成為要求苛刻的 AI/ML 部署或其他高度分布式應(yīng)用的理想選擇。Silicon One 系統(tǒng)的核心是支持增強(qiáng)的以太網(wǎng)功能，例如改進(jìn)的流量控制、擁塞感知和避免。該系統(tǒng)還包括先進(jìn)的負(fù)載平衡功能和“packet-spraying”功能，可將流量分散到多個(gè) GPU 或交換機(jī)上，以避免擁塞并改善延遲。思科表示，基于硬件的鏈路故障恢復(fù)還有助于確保網(wǎng)絡(luò)以最高效率運(yùn)行。

結(jié)合這些增強(qiáng)型以太網(wǎng)技術(shù)并進(jìn)一步推進(jìn)，最終使客戶能夠建立思科所謂的Scheduled Fabric。思科表示，在Scheduled Fabric中，芯片物理組件、光學(xué)器件、交換機(jī)像一個(gè)大型模塊化機(jī)箱一樣連接在一起，并相互通信，以提供最佳的調(diào)度行為和更高的帶寬吞吐量。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴