【中國,江西婺源,2024年3月29日】2024 開放數(shù)據(jù)中心委員會(以下簡稱ODCC)春季全會在江西婺源順利召開,全會由ODCC副主席李潔博士主持。全會期間,華為聯(lián)合中國信通院云大所數(shù)據(jù)中心團隊發(fā)布《華為星河AI數(shù)據(jù)中心網(wǎng)絡測試報告》(以下簡稱“測試報告”)。
測試報告顯示,華為星河AI數(shù)據(jù)中心網(wǎng)絡實現(xiàn)了計算與網(wǎng)絡統(tǒng)一管控,在AI訓練時支持多任務并行,大幅提升網(wǎng)絡性能。華為星河AI數(shù)據(jù)中心網(wǎng)絡通過了“算力強基行動”測評,并榮獲“算力強基行動”測評證書。
隨著AI技術的發(fā)展,我們從ChatGPT的文本生成時代進入了Sora的視頻生成時代。這一進步不僅標志著AI大模型能力的持續(xù)提升,也意味著全球對算力的需求在不斷上升。預計到2030年,AI算力的需求將增長500倍。AI訓練的本質為分布式計算,嚴重依賴網(wǎng)絡實現(xiàn)千卡萬卡乃至十萬卡的協(xié)同,隨著AI算力需求的持續(xù)升級,對AI網(wǎng)絡也提出了更高的要求。
為此,華為推出星河AI數(shù)據(jù)中心網(wǎng)絡,基于智能遠程RDMA(直接存儲器訪問)、網(wǎng)絡級負載均衡NSLB等能力,實現(xiàn)轉發(fā)零丟包、98%超高吞吐,全面釋放AI時代高算力。
在本次測試中,華為星河AI數(shù)據(jù)中心網(wǎng)絡在網(wǎng)絡功能、網(wǎng)絡性能、網(wǎng)絡可靠性和智能運維方面均表現(xiàn)優(yōu)異:
網(wǎng)絡功能方面:
在打流、端口時延和二三層轉發(fā)測試中,華為星河AI數(shù)據(jù)中心網(wǎng)絡通過CPU保護、端口狀態(tài)震蕩防護和CRC錯包自動防護等能力,實現(xiàn)端口故障可以自動識別恢復;
網(wǎng)絡性能方面:
啟動網(wǎng)絡級負載均衡(NSLB)功能后,在hccl allreduce 集群通信測試中,算法帶寬性能顯著提升;在llama2大模型測試中,平均網(wǎng)絡吞吐量達到98%,AI訓練效率顯著提升;
網(wǎng)絡可靠性方面:
通過使用數(shù)字平面快速恢復功能(DPFR),雙向流切換時間可縮短至微秒級;
智能運維方面:
分析器可以查看無損網(wǎng)絡的丟包、時延的五元組信息,對交換機流量、PFC計數(shù)、隊列緩存和端口input和output包數(shù)進行檢測,并基于Fabric、設備和設備接口維度,查看無損隊列指標變化。
華為星河AI數(shù)據(jù)中心網(wǎng)絡已經(jīng)廣泛應用于政府、金融、制造、OTT、教育等多個行業(yè)。未來,華為將繼續(xù)攜手業(yè)界伙伴開放合作,深入探索各行各業(yè)的應用需求,持續(xù)推進數(shù)據(jù)中心網(wǎng)絡領域技術創(chuàng)新,助力AI產(chǎn)業(yè)高速發(fā)展,為產(chǎn)業(yè)發(fā)展創(chuàng)造更大價值。
審核編輯:劉清
-
存儲器
+關注
關注
38文章
7430瀏覽量
163514 -
華為
+關注
關注
215文章
34258瀏覽量
250980 -
數(shù)據(jù)通信
+關注
關注
2文章
426瀏覽量
33725 -
ChatGPT
+關注
關注
29文章
1546瀏覽量
7353 -
AI大模型
+關注
關注
0文章
307瀏覽量
276
原文標題:華為聯(lián)合中國信通院發(fā)布《華為星河AI數(shù)據(jù)中心網(wǎng)絡測試報告》助力AI產(chǎn)業(yè)高速發(fā)展
文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數(shù)據(jù)通信】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論