2024年7月29日,中國上?!菰?a href="http://www.ttokpm.com/v/" target="_blank">科技宣布與網(wǎng)絡(luò)廠商銳捷網(wǎng)絡(luò)簽署戰(zhàn)略合作協(xié)議,雙方將聯(lián)合研發(fā)面向人工智能數(shù)據(jù)中心的高性能網(wǎng)絡(luò)互聯(lián)解決方案,應(yīng)對超大規(guī)模集群的網(wǎng)絡(luò)挑戰(zhàn),提升大模型計算效率,確保智算中心網(wǎng)絡(luò)的可靠性,為客戶提供更好的服務(wù),推動人工智能領(lǐng)域的創(chuàng)新和發(fā)展。
技術(shù)突破與兼容性適配
燧原科技的二代訓(xùn)練產(chǎn)品已成功完成與銳捷RoCE交換機的互操作兼容性適配,并通過了銳捷RALB和AILB等負載均衡技術(shù)的嚴格測試,實現(xiàn)了網(wǎng)絡(luò)無阻塞傳輸,實測帶寬利用率高達97%。這一突破性成果,不僅滿足了超大規(guī)模集群對于大量數(shù)據(jù)傳輸和實時響應(yīng)的嚴苛需求,更為AI大模型的快速訓(xùn)練與迭代提供了強有力的網(wǎng)絡(luò)支撐。
共創(chuàng)智算中心AIGC網(wǎng)絡(luò)解決方案
基于銳捷網(wǎng)絡(luò)智算中心AI-Fabric網(wǎng)絡(luò)解決方案,該方案充分利用以太網(wǎng)RoCE技術(shù)生態(tài),實現(xiàn)基于業(yè)務(wù)流量模型的多軌道互聯(lián)架構(gòu),提供大帶寬接入能力,確保在萬卡級別場景下實現(xiàn)可擴展、更高效和靈活的集群組網(wǎng)。同時,通過創(chuàng)新性的應(yīng)用鏈路負載和擁塞控制技術(shù),有效解決網(wǎng)絡(luò)擁塞沖突問題,進一步提升計算效率和系統(tǒng)性能。
開創(chuàng)智算組網(wǎng)仿真模型
雙方還將通過建模和仿真技術(shù),收集規(guī)模級智算網(wǎng)絡(luò)參數(shù)、環(huán)境,生成組網(wǎng)仿真體系的大模型,不斷擬合和迭代,確保真實AIGC業(yè)務(wù)的網(wǎng)絡(luò)解決方案能夠發(fā)揮硬件性能,推算不同縱向擴展(Scale-Up)下的模型性能收益,為AI大模型的訓(xùn)練提供最佳的網(wǎng)絡(luò)環(huán)境部署方案。
燧原科技研發(fā)副總裁鄧輝表示:“在處理AIGC大模型預(yù)訓(xùn)練的大規(guī)模數(shù)據(jù)、高并發(fā)請求和分布式計算的場景下,高性能、低延遲的網(wǎng)絡(luò)互聯(lián)系統(tǒng)至關(guān)重要。由此,超大規(guī)模計算集群也由“算力墻”、“存儲墻”演進到了“IO墻”,如何打造一個AI加速卡間的高可用且高可靠的網(wǎng)絡(luò)系統(tǒng)已成為智算中心釋放算力的關(guān)鍵。面對AI產(chǎn)業(yè)發(fā)展的新挑戰(zhàn),燧原將與銳捷攜手合作,發(fā)揮各自產(chǎn)品的技術(shù)優(yōu)勢,提供超大規(guī)模AI集群的網(wǎng)絡(luò)互聯(lián)解決方案,提升計算效率和系統(tǒng)性能,構(gòu)建新一代AI大模型算網(wǎng)融合平臺,加速發(fā)展新質(zhì)生產(chǎn)力,賦能千行百業(yè)‘?dāng)?shù)智化’轉(zhuǎn)型?!?/p>
銳捷網(wǎng)絡(luò)企業(yè)系統(tǒng)部總經(jīng)理夏國卿進一步闡述:“銳捷網(wǎng)絡(luò)與燧原科技的深度合作,不僅根植于我們雙方堅實的合作基礎(chǔ),更是基于對未來技術(shù)發(fā)展趨勢的深刻洞察。銳捷網(wǎng)絡(luò)連續(xù)多年在中國數(shù)據(jù)中心交換機市場占據(jù)領(lǐng)先地位,特別是在200G/400G領(lǐng)域的卓越表現(xiàn),充分證明了我們在高速、高效網(wǎng)絡(luò)構(gòu)建上的強大實力。燧原科技作為AI加速卡和解決方案的佼佼者,其在AI計算領(lǐng)域的深厚積累與銳捷網(wǎng)絡(luò)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施優(yōu)勢相得益彰。銳捷的AI-Fabric解決方案與燧原的AI加速卡技術(shù)相結(jié)合,將能夠進一步優(yōu)化GPU計算集群的網(wǎng)絡(luò)架構(gòu),解決AI大模型訓(xùn)練中的數(shù)據(jù)傳輸瓶頸,提升整體計算效率與資源利用率。同時,雙方還將共同探索在業(yè)務(wù)仿真測算、智能運維等方面的深度合作,為客戶提供從硬件到軟件、從基礎(chǔ)設(shè)施到上層應(yīng)用的全方位、一體化解決方案,助力客戶在AI時代搶占先機。”
燧原科技
燧原科技專注人工智能領(lǐng)域云端和邊緣算力產(chǎn)品,致力為通用人工智能打造算力底座,提供原始創(chuàng)新、具備自主知識產(chǎn)權(quán)的AI加速卡、系統(tǒng)集群和軟硬件解決方案。憑借其高算力、 高能效比的創(chuàng)新架構(gòu)和高效易用的軟件平臺,產(chǎn)品可廣泛應(yīng)用于泛互聯(lián)網(wǎng)、智算中心、智慧城市,智慧金融、科學(xué)計算、自動駕駛等多個行業(yè)和場景。
燧原科技秉承開源開放的宗旨,攜手產(chǎn)業(yè)伙伴共創(chuàng)生態(tài),成為通用人工智能時代產(chǎn)業(yè)的驅(qū)動力。
銳捷網(wǎng)絡(luò)
成立于2003年的銳捷網(wǎng)絡(luò),目前也已經(jīng)發(fā)展成為行業(yè)領(lǐng)先的網(wǎng)絡(luò)基礎(chǔ)設(shè)施及解決方案提供商。IDC報告顯示,2022和2023年中國200G/400G數(shù)據(jù)中心交換機市場占有率第一,2024年1季度中國200G/400G數(shù)據(jù)中心交換機市場占有率第一,2019年至2023年中國以太網(wǎng)交換機市場占有率排名第三。
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4517瀏覽量
71630 -
銳捷網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
21瀏覽量
7888 -
燧原科技
+關(guān)注
關(guān)注
0文章
115瀏覽量
8233
原文標題:燧原科技與銳捷網(wǎng)絡(luò)簽署戰(zhàn)略合作協(xié)議,聯(lián)合開發(fā)面向萬卡超大規(guī)模集群的高性能網(wǎng)絡(luò)解決方案
文章出處:【微信號:gh_1222367b8780,微信公眾號:燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論