亚洲精品欧美激情在线播放,免费观看女人与狥交的频道,免费无遮挡无码视频在线影院

AI集群訓(xùn)練過程中，參數(shù)通過高速互聯(lián)網(wǎng)絡(luò)在不同的服務(wù)器間進(jìn)行同步交互，這些通信流量具有共同的特征：流量成周期性、流數(shù)量少、流量長連接、并行任務(wù)間有強實時同步性要求，通信效率取決于最慢的節(jié)點，并且AI集群訓(xùn)練場景下，傳輸?shù)臄?shù)據(jù)量較大。上述的流量特征導(dǎo)致網(wǎng)絡(luò)較易出現(xiàn)負(fù)載分擔(dān)不均、整網(wǎng)吞吐下降的問題，從而影響AI集群訓(xùn)練的性能。

當(dāng)前網(wǎng)絡(luò)均衡的主流技術(shù)有三種，逐流（Flow-based）ECMP均衡、基于子流flowlet均衡和逐包（Packet-based）ECMP均衡。逐流ECMP均衡，是當(dāng)前最為常用的負(fù)載均衡算法，基于流量的五元組進(jìn)行HASH負(fù)載均衡，在流鏈接數(shù)量較多的場景下適用，它優(yōu)勢在于無亂序，劣勢在于流數(shù)量較少時，例如AI訓(xùn)練場景下，存在HASH沖突問題，網(wǎng)絡(luò)均衡效果不佳。基于子流flowlet均衡技術(shù)，它依賴于子流之間時間間隔GAP值的正確配置來實現(xiàn)均衡，但由于網(wǎng)路中全局路徑級時延信息不可知，因此GAP值無法準(zhǔn)確配置。同時，該技術(shù)存在接收端側(cè)亂序的問題。逐包（Packet-based）ECMP均衡，理論上均衡度最好，但實際在接收端側(cè)存在大量亂序問題，現(xiàn)實中幾乎無使用案例。

現(xiàn)有創(chuàng)新的網(wǎng)絡(luò)均衡技術(shù)NSLB是面向AI訓(xùn)練場景量身打造的，根據(jù)該場景下的流量特征，將搜集到的整網(wǎng)信息作為創(chuàng)新算路算法的輸入，從而得到最優(yōu)的流量轉(zhuǎn)發(fā)路徑，實現(xiàn)AI訓(xùn)練場景下整網(wǎng)流量100%的均衡度和AI訓(xùn)練性能的提升。

利用12臺GPU服務(wù)器（每臺服務(wù)器包含1塊型號為Tesla v100S PCIe 32GB的GPU卡），4臺華為交換機(jī)組成2級CLOS網(wǎng)絡(luò)（其中2臺交換機(jī)作為接入層交換機(jī)，每臺下掛6臺服務(wù)器，使用100GE單端口接入，2臺交換機(jī)作為匯聚交換機(jī)，每臺與接入層交換機(jī)之間使用6個100GE端口互聯(lián)）的AI訓(xùn)練集群，運行開源Tensorflow 深度學(xué)習(xí)平臺上的VGG16深度學(xué)習(xí)網(wǎng)絡(luò)模型。以下為采用NSLB技術(shù)運行單計算任務(wù)和多計算任務(wù)時，AI訓(xùn)練性能的提升結(jié)果。

Ring算法場景，運行單個計算任務(wù)下，使用NSLB技術(shù)對比典型ECMP負(fù)載分擔(dān)技術(shù)，AI訓(xùn)練集性能最高提升113.41%。

Ring算法場景，運行兩個計算任務(wù)下，使用NSLB技術(shù)對比典型ECMP負(fù)載分擔(dān)技術(shù)，AI訓(xùn)練集性能最高提升57.29%。

高性能計算、AI模型訓(xùn)練等應(yīng)用場景，以及數(shù)據(jù)中心網(wǎng)絡(luò)/云網(wǎng)絡(luò)在架構(gòu)上的發(fā)展（資源池化），均要求網(wǎng)絡(luò)傳輸排隊時延和吞吐上的進(jìn)一步性能提升。例如，為了保證性能損失在5%以內(nèi)，數(shù)據(jù)庫集群系統(tǒng)要求至少40Gbps的吞吐和3us的網(wǎng)絡(luò)RTT。為了達(dá)到極低時延的傳輸，應(yīng)當(dāng)盡力降低網(wǎng)絡(luò)設(shè)備上的排隊時延，同時維持接近瓶頸鏈路滿吞吐。

隨著業(yè)務(wù)發(fā)放速度的不斷加快，以及引入了VM、容器等虛擬化技術(shù)，網(wǎng)絡(luò)流量的不確定性增加。而當(dāng)前運維手段有限，仍然依靠傳統(tǒng)網(wǎng)管和命令行方式進(jìn)行查看、監(jiān)控，分鐘級的網(wǎng)絡(luò)監(jiān)控已經(jīng)無法滿足業(yè)務(wù)秒級體驗保障的要求，往往被動感知故障。故障發(fā)生后，定位仍主要依賴專家經(jīng)驗，利用多種輔助工具，逐段定界、逐流分析、抓包定位，效率十分低下。

為了解決上述故障收斂慢的問題，提出了一種基于網(wǎng)絡(luò)設(shè)備數(shù)據(jù)面的鏈路故障快速自愈技術(shù)，稱為DPFF（Data Plane Fast Failover）。該技術(shù)基于轉(zhuǎn)發(fā)芯片的硬件可編程能力構(gòu)建。DPFF從傳統(tǒng)的基于控制面軟件協(xié)議的收斂方式演進(jìn)到基于數(shù)據(jù)面硬件極速感知故障和快速換路的收斂方式，并且基于數(shù)據(jù)面硬件實現(xiàn)遠(yuǎn)程通告和快速換路，可達(dá)到亞毫秒級（<1ms）的收斂速度，將對業(yè)務(wù)性能的影響降至最低。該技術(shù)為高性能數(shù)據(jù)庫、存儲以及超算等關(guān)鍵應(yīng)用提供了極致的高可靠性保證和穩(wěn)定性體驗。

實驗室采用4臺華為交換機(jī)組成2級CLOS網(wǎng)絡(luò)（其中2臺交換機(jī)作為接入層交換機(jī)，每臺下掛>2臺服務(wù)器，2臺交換機(jī)作為匯聚交換機(jī)），利用vdbench 測試套件，客戶端服務(wù)器與存儲陣列建立兩個連接，每連接8個qp，并發(fā)訪問8個SSD磁盤。通過拔光纖模擬鏈路故障。256KB message size，16 threads，write IO , 觀察鏈路故障發(fā)送后的IOPS指標(biāo)。

測試結(jié)論：DPFF方案下鏈路故障對IOPS性能幾乎沒有影響，而OSPF協(xié)議收斂方案下IOPS出現(xiàn)多秒跌零情況。

利用Benchmarksql測試套件進(jìn)行在線事務(wù)處理模型的測試，又稱TPC-C測試。統(tǒng)計每百毫秒周期內(nèi)完成的在線事務(wù)的數(shù)量，通過查看該數(shù)量值的變化測試收斂性能對業(yè)務(wù)性能的影響。模擬鏈路故障，重復(fù)測試4次，觀察在線交易事務(wù)受影響情況。

測試結(jié)論：DPFF收斂方案比傳統(tǒng)的OSPF收斂方案在鏈路故障下，每100ms周期內(nèi)完成交易事務(wù)數(shù)量下降減少60%~80%。

計算集群網(wǎng)絡(luò)傳統(tǒng)采用CLOS架構(gòu)，以業(yè)界常見的64口盒式交換機(jī)為例，3級CLOS架構(gòu)，最大可支持6.5萬服務(wù)器接口，不滿足10E級計算集群規(guī)模訴求。如果增加網(wǎng)絡(luò)層數(shù)則會帶來網(wǎng)絡(luò)跳數(shù)增加，通信時延不滿足業(yè)務(wù)需求。

業(yè)界針對該問題開展了多樣的架構(gòu)研究和新拓?fù)涞脑O(shè)計。直連拓?fù)湓诔笠?guī)模組網(wǎng)場景下，因為網(wǎng)絡(luò)直徑短，具備低成本、端到端通信跳數(shù)少的特點。以64口盒式交換機(jī)構(gòu)建10萬個節(jié)點超大規(guī)模集群為例，傳統(tǒng)的CLOS架構(gòu)需要部署4層組網(wǎng)，端到端通信最大需要跨7跳交換機(jī)。使用無阻塞直連拓?fù)浣M網(wǎng)，端到端交換機(jī)轉(zhuǎn)發(fā)跳數(shù)最少只3跳，交換機(jī)臺數(shù)(整體投資)下降40%。

采用12臺GPU服務(wù)器，每臺服務(wù)器2塊GPU卡，型號Tesla v100s；2塊CX6-Dx網(wǎng)卡，網(wǎng)卡是100G單端口接入。OSU MPI Benchmark測試AllReduce集合通信操作，DF相對FT組網(wǎng)，任務(wù)完成時間最高提升39.47%，總體提升21.63%。

OSU MPI Benchmark測試Alltoall集合通信操作， DF相對FT組網(wǎng)，任務(wù)完成時間最高提升56.53%，總體提升49.71%。

隨著高性能網(wǎng)絡(luò)的全以太化發(fā)展，超融合以太網(wǎng)絡(luò)同時承載計算、存儲、管理和虛擬化等多種業(yè)務(wù)流量。為了追求更極致的性能，不同業(yè)務(wù)流量之間，極易出現(xiàn)互相干擾現(xiàn)象，競爭網(wǎng)絡(luò)側(cè)有限的端口轉(zhuǎn)發(fā)資源。

為了解決這個難題，提出超融合智能無損網(wǎng)絡(luò)方案，將業(yè)務(wù)級SLA智能保障技術(shù)引入到交換機(jī)中，用iLoss-less智能無損算法代替專家經(jīng)驗，對網(wǎng)絡(luò)流量的變化進(jìn)行基于隊列級捕獲和預(yù)測，實現(xiàn)細(xì)粒度動態(tài)差異化優(yōu)化。結(jié)合不同業(yè)務(wù)的流量變化情況以及業(yè)務(wù)特征，實現(xiàn)不同業(yè)務(wù)流量差異化動態(tài)優(yōu)化保障。

根據(jù)實驗室測試，采用3臺華為交換機(jī)組成2級Spine-Leaf組網(wǎng)，每臺接入層交換機(jī)下掛16臺100GE服務(wù)器，Spine與每個Leaf之間采用4個400G互聯(lián)(1:1收斂)。在計算和存儲benchmark流量混跑的測試環(huán)境下，智能無損算法相比于傳統(tǒng)算法配置，在保持存儲持平前提下，能夠有效降低計算任務(wù)的總體完成時間，在測試場景中實現(xiàn)最高20%以上的計算時延降低。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

負(fù)載

負(fù)載

+關(guān)注

關(guān)注
2

文章
529

瀏覽量
34132
服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
12

文章
8701

瀏覽量
84559
數(shù)據(jù)中心

數(shù)據(jù)中心

+關(guān)注

關(guān)注
16

文章
4517

瀏覽量
71637
AI

AI

+關(guān)注

關(guān)注
87

文章
28877

瀏覽量
266239
均衡技術(shù)

均衡技術(shù)

+關(guān)注

關(guān)注
0

文章
11

瀏覽量
6646

原文標(biāo)題：數(shù)據(jù)中心超融合以太技術(shù)（2023）

文章出處：【微信號：架構(gòu)師技術(shù)聯(lián)盟，微信公眾號：架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

以太網(wǎng)交換機(jī)將在數(shù)據(jù)中心領(lǐng)域加速增長

近幾年，隨著（移動）互聯(lián)網(wǎng)、云計算和大數(shù)據(jù)產(chǎn)業(yè)的加速發(fā)展，進(jìn)一步推動了數(shù)據(jù)中心的建設(shè)步伐。據(jù)Dell‘Oro集團(tuán)最新調(diào)查報告顯示，2019年，數(shù)據(jù)中心以太網(wǎng)交換機(jī)市場預(yù)計將

發(fā)表于 08-05 07:47 ?663次閱讀

以太網(wǎng)技術(shù)基本原理

Xeros公司開發(fā)的一種基帶局域網(wǎng)技術(shù)，使用同軸電纜作為網(wǎng)絡(luò)媒體，采用載波多路訪問和碰撞檢測（CSMA/CD）機(jī)制，數(shù)據(jù)傳輸速率達(dá)到10Mbps。雖然以太網(wǎng)是由Xeros公司早在70年代最先研制成功，但是如今

發(fā)表于 12-03 19:07

探討工業(yè)以太網(wǎng)技術(shù)（一）

所謂工業(yè)以太網(wǎng)就是在以太網(wǎng)技術(shù)和TCP/IP技術(shù)的基礎(chǔ)上開發(fā)出來的一種現(xiàn)場總線。作為現(xiàn)場總線的工業(yè)以太網(wǎng)與一般的商用以太網(wǎng)有很大不同。必須

發(fā)表于 12-15 14:28

探討工業(yè)以太網(wǎng)技術(shù)~（二）

發(fā)表于 12-15 14:29

網(wǎng)絡(luò)發(fā)展怎么改變企業(yè)數(shù)據(jù)中心的面貌的

云和網(wǎng)絡(luò)規(guī)模提供商已經(jīng)實施了軟件定義存儲、融合架構(gòu)和超融合架構(gòu)。以太網(wǎng)存儲結(jié)構(gòu)（ESF）技術(shù)已經(jīng)成為數(shù)據(jù)

發(fā)表于 08-16 15:08

以太網(wǎng)技術(shù)基本原理

以太網(wǎng)技術(shù)基本原理通常我們所說的以太網(wǎng)主要是指以下三種不同的局域網(wǎng)技術(shù)：

發(fā)表于 07-24 08:10 ?5277次閱讀

更好的以太網(wǎng)打造更現(xiàn)代的數(shù)據(jù)中心

以太網(wǎng)正在隨著數(shù)據(jù)中心不斷發(fā)展，有時這意味著增量改進(jìn)，而不是巨大的飛躍。在數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)設(shè)施的變革中，值得注意的是，傳統(tǒng)網(wǎng)絡(luò)技術(shù)需要應(yīng)付瞬息萬變的世界，而解決方案并不總是更多的帶寬和

發(fā)表于 01-22 14:43 ?739次閱讀

超融合數(shù)據(jù)中心網(wǎng)絡(luò)簡介

現(xiàn)如今，數(shù)據(jù)中心正成為算力中心，為千行百業(yè)提供數(shù)字化底座，并基于海量數(shù)據(jù)挖掘其中的商業(yè)價值。同時，在數(shù)據(jù)中心云化升級、全閃存化等變革之下，全以太

發(fā)表于 10-19 15:17 ?2413次閱讀

轉(zhuǎn)載｜數(shù)據(jù)中心網(wǎng)絡(luò)持續(xù)進(jìn)階，超融合以太技術(shù)正當(dāng)其時

隨著數(shù)字經(jīng)濟(jì)進(jìn)入“算力時代”，在算力蓬勃發(fā)展的同時，打造一張與時俱進(jìn)的高水平數(shù)據(jù)中心網(wǎng)絡(luò)顯得尤為重要。近日，華為聯(lián)合中國信息通信研究院共同發(fā)布的數(shù)據(jù)中心超融合

發(fā)表于 12-16 19:15 ?691次閱讀

超融合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的典型特征與價值

結(jié)合業(yè)界在超融合數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)中的實踐與探索，對超融合數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的未來發(fā)展進(jìn)行了展望。數(shù)據(jù)中心

發(fā)表于 12-19 10:53 ?1539次閱讀

企業(yè)數(shù)據(jù)中心超融合的現(xiàn)實

電子發(fā)燒友網(wǎng)站提供《企業(yè)數(shù)據(jù)中心超融合的現(xiàn)實.pdf》資料免費下載

發(fā)表于 08-28 09:34 ?0次下載

HPC和數(shù)據(jù)中心融合網(wǎng)絡(luò)面臨的技術(shù)挑戰(zhàn)

隨著大型DC采用具有更高帶寬需求的高性能加速器，數(shù)據(jù)中心網(wǎng)絡(luò)通過支持遠(yuǎn)程直接內(nèi)存訪問（RDMA）、RDMA融合以太網(wǎng)（RDMA over converged Ethernet，RoCE）、互聯(lián)網(wǎng)廣域RDMA協(xié)議（iWarp）等新

發(fā)表于 09-15 09:56 ?735次閱讀

單對以太網(wǎng)技術(shù)的介紹單對以太網(wǎng)技術(shù)的優(yōu)勢單對以太網(wǎng)技術(shù)的應(yīng)用

單對以太網(wǎng)技術(shù)的介紹單對以太網(wǎng)技術(shù)的優(yōu)勢單對以太網(wǎng)技術(shù)的應(yīng)用? 以太網(wǎng)技術(shù)是一種局域網(wǎng)傳輸協(xié)議，通常用于連接局域網(wǎng)內(nèi)的多臺計算機(jī)和網(wǎng)絡(luò)設(shè)備。它是最常用的局域

發(fā)表于 11-28 15:45 ?617次閱讀

祝賀！《超融合以太網(wǎng)絡(luò)總體技術(shù)要求》行業(yè)標(biāo)準(zhǔn)立項成功

數(shù)據(jù)中心存在通用計算、存儲、超算和AI智算多種業(yè)務(wù)場景，傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)使用不同的網(wǎng)絡(luò)技術(shù)承載不同業(yè)務(wù)，如存儲使用FC網(wǎng)絡(luò)，超算使用IB網(wǎng)絡(luò)

發(fā)表于 11-28 19:05 ?460次閱讀

數(shù)據(jù)中心市場的關(guān)鍵以太網(wǎng)解決方案

了解數(shù)據(jù)中心市場動態(tài)的關(guān)鍵在于以太網(wǎng)解決方案。Synopsys負(fù)責(zé)產(chǎn)品管理和高性能計算IP的副總裁Michael Posner說：“以太網(wǎng)在數(shù)據(jù)中心中根深蒂固……雖然它并不廣為人知，但

發(fā)表于 03-12 09:53 ?289次閱讀