作為AI全棧網(wǎng)絡(luò)服務(wù)專家,銳捷網(wǎng)絡(luò)受邀出席本次大會,從架構(gòu)規(guī)劃、部署實施以及運維優(yōu)化三方面分享了AIGC智算中心網(wǎng)絡(luò)解決方案。銳捷網(wǎng)絡(luò)致力于為企業(yè)提供覆蓋IaaS到PaaS的全棧產(chǎn)品及解決方案,致力于提升通信帶寬利用率,降低動態(tài)時延以及實現(xiàn)無損的網(wǎng)絡(luò)傳輸,以提升AI集群網(wǎng)絡(luò)通信性能,幫助客戶實現(xiàn)生產(chǎn)效率的飛躍和運營成本的優(yōu)化。
近年來,ChatGPT、Sora為代表的大模型取得技術(shù)突破,掀起新一輪人工智能熱潮,數(shù)據(jù)量爆炸式增長,算力需求激增。各國積極出臺相關(guān)政策,加速推動AI產(chǎn)業(yè)的布局和發(fā)展。中國亦推出《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》等相關(guān)政策引導(dǎo)AI產(chǎn)業(yè)更健康有序發(fā)展。算力網(wǎng)絡(luò)作為算力主要載體,能夠有力支撐更為復(fù)雜、深入的AI算法和模型訓(xùn)練,進而推動AI技術(shù)的持續(xù)創(chuàng)新與應(yīng)用拓展,加速AI新時代發(fā)展。
作為行業(yè)領(lǐng)先的網(wǎng)絡(luò)基礎(chǔ)設(shè)施及解決方案提供商,銳捷網(wǎng)絡(luò)積極響應(yīng)國家“東數(shù)西算”重大戰(zhàn)略,持續(xù)優(yōu)化算網(wǎng)布局,積極推進AIGC重點方向發(fā)展,用智算網(wǎng)絡(luò)等來賦能新質(zhì)生產(chǎn)力,推動數(shù)字經(jīng)濟與實體經(jīng)濟融合發(fā)展。同時,銳捷網(wǎng)絡(luò)獲評“2024年AIGC智算網(wǎng)絡(luò)最佳解決方案”。
銳捷網(wǎng)絡(luò)解決方案經(jīng)理劉洋進行了題為《面向下一代AIGC智算中心網(wǎng)絡(luò)方案的思考》的主題演講,闡述了AIGC大模型的發(fā)展趨勢及關(guān)鍵訴求,介紹了兩種AIGC智算中心網(wǎng)絡(luò)解決方案。
解決數(shù)據(jù)中心網(wǎng)絡(luò)擁塞
AI-Fabric解決方案
銳捷網(wǎng)絡(luò)AI-Fabric解決方案通過三級組網(wǎng)的方式可以滿足3.2萬個400G端口接入需求,支撐32K塊GPU卡的集群規(guī)模。該方案從架構(gòu)規(guī)劃、部署實施以及運維優(yōu)化三個層面進行帶寬利用率的提升。從架構(gòu)規(guī)劃來看,采用多軌網(wǎng)絡(luò)的接入方式來匹配流量模型,設(shè)計各層級 1:1 的低收斂比來優(yōu)化機間通信,并通過端網(wǎng)協(xié)同、在網(wǎng)計算等技術(shù)來規(guī)劃整體的網(wǎng)絡(luò)。在部署實施階段,目前更多業(yè)務(wù)還是會部署RDMA應(yīng)用,為了確保業(yè)務(wù)的吞吐效率,網(wǎng)絡(luò)需要實現(xiàn)無損轉(zhuǎn)發(fā),類似PFC、ECN、QoS 等水線的調(diào)優(yōu)就顯得尤為重要,另外對于網(wǎng)絡(luò)中負載的均衡性也需要考慮模式和算法的優(yōu)化。最后考慮運維方面,在網(wǎng)絡(luò)部署后的運行當(dāng)中,方案實時關(guān)注網(wǎng)絡(luò)關(guān)鍵指標(biāo)的監(jiān)控,以及對丟包重傳等周期性事件的訂閱和告警上報,并且結(jié)合智能運維平臺去做流控水線的動態(tài)調(diào)優(yōu),來保證網(wǎng)絡(luò)寬用率更大化。
AIGC”任督二脈“
AI-Flexiforce解決方案
銳捷網(wǎng)絡(luò)AI-FlexiForce智算中心網(wǎng)絡(luò)解決方案采用NCP+NCF為基礎(chǔ)模塊橫向擴展的三級網(wǎng)絡(luò)架構(gòu),并基于高性能芯片技術(shù),通過將數(shù)據(jù)流切分成等長的Cell并負載到所有鏈路,提升網(wǎng)絡(luò)帶寬利用率;基于VOQ+Credit的端到端流控機制實現(xiàn)與業(yè)務(wù)無關(guān)的無損自閉環(huán)網(wǎng)絡(luò),助力業(yè)務(wù)算力提升。
銳捷AI-FlexiForce智算中心網(wǎng)絡(luò)解決方案通過創(chuàng)新性地應(yīng)用鏈路負載和擁塞控制技術(shù),根本性解決網(wǎng)絡(luò)中的擁塞沖突問題,提升GPU之間通信效率,進而提升GPU計算效率,加速企業(yè)大模型應(yīng)用的推出。
同時,在研發(fā)AI-FlexiForce智算中心網(wǎng)絡(luò)解決方案時,打造了分布式OS,意在實現(xiàn)分布式方案架構(gòu)的統(tǒng)一管理基礎(chǔ)上,最大程度降低系統(tǒng)性風(fēng)險,提升AI訓(xùn)練網(wǎng)絡(luò)的長期穩(wěn)定運行。
邁向高速光通信領(lǐng)域
400G/800G LPO光模塊
本次展會,銳捷網(wǎng)絡(luò)展示了基于LPO技術(shù)的400G和800G自研光模塊,標(biāo)志著公司在高速光通信領(lǐng)域的技術(shù)實力和創(chuàng)新能力得到了顯著提升。
本次展會,銳捷網(wǎng)絡(luò)展示了基于LPO技術(shù)的400G和800G自研光模塊,標(biāo)志著公司在高速光通信領(lǐng)域的技術(shù)實力和創(chuàng)新能力得到了顯著提升。
與傳統(tǒng)光模塊相比,LPO技術(shù)利用交換芯片Serdes的DSP能力,在光模塊中不再集成DSP芯片,只保留Drvier和TIA芯片,且TIA、Driver芯片不需要專門優(yōu)化即可實現(xiàn)優(yōu)異的傳輸性能,可以為客戶帶來顯著的收益:
? 功耗下降50%:LPO光模塊功耗相較普通光模塊下降50%。低功耗不僅節(jié)省電力開銷,而且能夠減少模塊內(nèi)組件的發(fā)熱,提升產(chǎn)品壽命。
? 客戶成本降低25%:光模塊中不使用DSP組件,從而可以將客戶光模塊采購成本下降。
? 時延降低90%:傳統(tǒng)集成DSP組件的光模塊傳輸時延約100ns,而基于LPO技術(shù)的光模塊傳輸時延小于10ns。
在全球互聯(lián)網(wǎng)流量不斷增長和數(shù)據(jù)應(yīng)用需求日益多樣化的背景下,銳捷將持續(xù)精進智算中心網(wǎng)絡(luò)解決方案,攜手阿里巴巴、騰訊、字節(jié)跳動、百度等多個互聯(lián)網(wǎng)頭部客戶,在降低時延、提高在網(wǎng)計算性能、實現(xiàn)端網(wǎng)融合等方面持續(xù)突破。未來,銳捷網(wǎng)絡(luò)還將通過持續(xù)的技術(shù)研發(fā)和產(chǎn)品創(chuàng)新,繼續(xù)為全球的數(shù)據(jù)中心提供更高效、更可靠、更智能的網(wǎng)絡(luò)解決方案,在AIGC時代助力互聯(lián)網(wǎng)及各行業(yè)實現(xiàn)快速發(fā)展,攜手探索GenAI時代的每一個機遇。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
29810瀏覽量
268109 -
光模塊
+關(guān)注
關(guān)注
75文章
1229瀏覽量
58831 -
銳捷網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
22瀏覽量
7893 -
智算中心
+關(guān)注
關(guān)注
0文章
53瀏覽量
1630
發(fā)布評論請先 登錄
相關(guān)推薦
評論