0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

星河AI網(wǎng)絡(luò),大模型紀元的運力答案

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-09-27 09:28 ? 次閱讀

隨著AI預(yù)訓(xùn)練大模型的價值不斷顯現(xiàn),且模型規(guī)模愈發(fā)龐大。產(chǎn)學(xué)各界已經(jīng)形成了這樣一個共識:AI時代,算力就是生產(chǎn)力。

這一認知雖然正確,卻并不全面。數(shù)字化系統(tǒng)有存、算、網(wǎng)三大支柱,AI技術(shù)也是如此。如果拋開存儲和網(wǎng)絡(luò)談算力,那么大模型只能獨木難支。尤其是與大模型適配的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,一直以來都沒有得到有效的重視。

面對動輒“萬卡集訓(xùn)”“萬里部署”“萬億參數(shù)”的AI大模型,網(wǎng)絡(luò)運力是整個智能化體系中不容忽視的一環(huán)。其面臨的挑戰(zhàn)非常突出,也正在等待可以破局的答案。

wKgaomUS6umAKUdfAAM6hKYbZ9g601.jpg

(華為數(shù)據(jù)通信產(chǎn)品線總裁 王雷)

9月20日,華為全聯(lián)接大會2023期間舉辦了“星河AI網(wǎng)絡(luò),加速行業(yè)智能化”為主題的數(shù)通峰會。各界代表共同探討了AI網(wǎng)絡(luò)技術(shù)的變革與發(fā)展趨勢。會上,華為數(shù)據(jù)通信產(chǎn)品線總裁王雷正式發(fā)布星河AI網(wǎng)絡(luò)解決方案。他表示,大模型讓AI更聰明,但訓(xùn)練一個大模型的成本非常高,同時還要考慮AI人才的成本。因此,在行業(yè)智能化階段,集中建設(shè)大算力集群,面向社會提供智算云服務(wù),才能真正讓人工智能深入千行萬業(yè)。華為發(fā)布新一代星河AI網(wǎng)絡(luò)解決方案,面向智能時代,打造超高吞吐、長穩(wěn)可靠、彈性高并發(fā)的新型網(wǎng)絡(luò)基礎(chǔ)設(shè)施,助力AI普惠,加速行業(yè)智能化。

借此機會,我們一起了解大模型崛起,給智算數(shù)據(jù)中心帶來的網(wǎng)絡(luò)挑戰(zhàn),以及華為星河AI網(wǎng)絡(luò)為什么是這些問題的最優(yōu)解。

如果說,一個模型、一條數(shù)據(jù)、一個計算單元,都是AI時代的一道星光。那么只有把它們高效穩(wěn)定地聯(lián)接起來,才能組成智能世界的燦爛星河。

大模型爆發(fā),隱藏的網(wǎng)絡(luò)激流

我們知道,AI模型分為訓(xùn)練和推理部署兩個階段。伴隨著預(yù)訓(xùn)練大模型的興起,這兩個階段也分別發(fā)生了巨大的AI網(wǎng)絡(luò)挑戰(zhàn)。

首先是在大模型的訓(xùn)練階段。伴隨著模型規(guī)模與數(shù)據(jù)參數(shù)愈發(fā)龐大,大模型訓(xùn)練開始需要千卡甚至萬卡規(guī)模的計算集群來完成。這也意味著大模型訓(xùn)練必然發(fā)生在具備AI算力的數(shù)據(jù)中心當中。

在目前階段,智算數(shù)據(jù)中心的成本是非常高昂的。根據(jù)行業(yè)數(shù)據(jù),每建設(shè)100P算力的集群,成本就要達到4億人民幣。以某國際知名大模型為例,其訓(xùn)練過程中每天的算力花費就要達到70萬美元。

如果數(shù)據(jù)中心網(wǎng)絡(luò)的聯(lián)接能力不暢,造成大量算力資源折損在網(wǎng)絡(luò)傳輸過程中,那么給數(shù)據(jù)中心與AI模型帶來的損失是難以估量的。相反,如果同等算力規(guī)模下,集群訓(xùn)練效率更高,那么數(shù)據(jù)中心將獲得巨大商機。而負載率等網(wǎng)絡(luò)因素,直接決定了AI模型的訓(xùn)練效率。另一方面,由于AI算力集群的規(guī)模不斷擴大,其復(fù)雜度也在相應(yīng)增長,于是其故障發(fā)生概率也在提升。打造長穩(wěn)可靠的集群網(wǎng)絡(luò),是數(shù)據(jù)中心提升投入產(chǎn)出比的重要支點。

在數(shù)據(jù)中心之外,AI模型的推理部署場景中,同樣也可以看到AI網(wǎng)絡(luò)的價值體現(xiàn)。大模型的推理部署主要依靠云服務(wù),而云服務(wù)商必須在算力資源有限的情況下,盡量服務(wù)更大的客戶,以此實現(xiàn)大模型的商業(yè)價值最大化。如此一來,用戶越多整個云網(wǎng)結(jié)構(gòu)就會越復(fù)雜。如何能夠提供長期穩(wěn)定的網(wǎng)絡(luò)服務(wù),成為了云計算服務(wù)商新的挑戰(zhàn)。

除此之外,在AI推理部署的最后一公里,政企用戶面臨著網(wǎng)絡(luò)質(zhì)量提升的需求。在真實場景下,1%的鏈路丟包會導(dǎo)致TCP性能下降50倍,也就是100Mbps的寬帶,實際能力不足2Mbps。因此,提升應(yīng)用場景本身的網(wǎng)絡(luò)能力,才可以保證AI算力順暢流動,實現(xiàn)真正的普惠AI。

由此不難看出,在AI大模型的誕生、傳輸、應(yīng)用全流程中,每個環(huán)節(jié)都面臨著網(wǎng)絡(luò)升級的挑戰(zhàn)與需求。大模型時代的運力難題,亟待破局解題。

從星光到星河,智能時代的網(wǎng)絡(luò)破局思路

大模型崛起帶來的網(wǎng)絡(luò)難題是一個多環(huán)節(jié)、全流程的挑戰(zhàn)。因此,對應(yīng)的破局思路也必須是一個系統(tǒng)性工程。

華為提出,面向智算云服務(wù)的新型網(wǎng)絡(luò)基礎(chǔ)設(shè)施,需要支持 “訓(xùn)練高效能”“算力不停歇”“普惠AI服務(wù)”。這三項能力,對應(yīng)了AI大模型從訓(xùn)練到推理部署的全場景。不僅著眼于單一需求滿足,單一技術(shù)的升級,而是全面推進AI網(wǎng)絡(luò)迭代,正是華為數(shù)據(jù)通信帶給行業(yè)獨特的破局思路。

具體而言,AI時代的網(wǎng)絡(luò)基礎(chǔ)設(shè)施需要包含如下能力:

首先,在訓(xùn)練場景網(wǎng)絡(luò)需要最大化發(fā)揮出AI計算集群的價值。通過打造具備超大規(guī)模聯(lián)接能力的網(wǎng)絡(luò),實現(xiàn)AI大模型的訓(xùn)練高效能。

其次,為了保障AI任務(wù)的穩(wěn)定可持續(xù),需要打造長穩(wěn)可靠的網(wǎng)絡(luò)能力,保障月級訓(xùn)練不中斷,同時要有秒級的穩(wěn)定定界、定位和回復(fù),盡可能降低訓(xùn)練中斷時常。這就是算力不停歇的能力建設(shè)。

再次,AI推理部署過程中,要求網(wǎng)絡(luò)具有彈性高并發(fā)的特質(zhì),可以智能編排海量用戶流,提供最佳的AI落地體驗,同時可以對抗網(wǎng)絡(luò)劣化沖擊,保障不同區(qū)域間AI算力順暢流動,這也就實現(xiàn)了“普惠AI服務(wù)”的能力建設(shè)。

秉承這樣的破局思路,華為最終帶來了星河AI網(wǎng)絡(luò)解決方案。它把散落的AI星光,基于強大運力聯(lián)成一片星河。

星河AI網(wǎng)絡(luò),給大模型紀元一個運力答案

華為全聯(lián)接大會2023的期間,華為分享了對以大算力、大存力、大運力加速AI大模型打造的發(fā)展愿景。新一代華為星河AI網(wǎng)絡(luò)解決方案,就可以說是面向智能時代,華為為大模型帶來的運力答案。

對于智能數(shù)據(jù)中心來說,華為星河AI網(wǎng)絡(luò)是以網(wǎng)強算的最優(yōu)解。

wKgZomUS6uqAYin_AATx46GR500258.jpg

其所具備的超高吞吐網(wǎng)絡(luò)特質(zhì),可以面向智算中心的AI集群提供提升網(wǎng)絡(luò)負載率,強化訓(xùn)練效率的重要價值。具體來說,星河AI網(wǎng)絡(luò)智算交換機具有業(yè)界最高密400GE和800GE端口能力,僅2層交換網(wǎng)絡(luò)就可以實現(xiàn)1萬8000卡的無收斂集群組網(wǎng),從而支持超萬億參數(shù)的大模型訓(xùn)練。組網(wǎng)層次一旦減少,就意味著數(shù)據(jù)中心能夠節(jié)省了大量的光模塊成本,同時提高對網(wǎng)絡(luò)風險的可預(yù)測性,獲得更加穩(wěn)定的大模型訓(xùn)練能力。

星河AI網(wǎng)絡(luò)可以支持網(wǎng)絡(luò)級負載均衡NSLB,能夠?qū)⒇撦d率從50%提升到98%,相當于實現(xiàn)AI集群超頻運行,繼而將訓(xùn)練效率提升20%,達成高效能訓(xùn)練的預(yù)期。

wKgaomUS6uqACNBAAAVownNLQGk939.jpg

對于云服務(wù)廠商來說,星河AI網(wǎng)絡(luò)可以提供穩(wěn)定可靠的算力保障。

其能夠在DCI算間互聯(lián)場景,提供多路徑智能調(diào)度等技術(shù),自動識別、主動適應(yīng)業(yè)務(wù)高峰流量的沖擊,可以從百萬數(shù)據(jù)流中識別大小流,合理分配到10萬路徑,從而實現(xiàn)網(wǎng)絡(luò)0擁塞,彈性保障高并發(fā)的智算云服務(wù)。

對于政企用戶來說,星河AI網(wǎng)絡(luò)可以應(yīng)對網(wǎng)絡(luò)劣化問題,保障普惠化的AI算力。

其能夠在DCA入算場景支持彈性抗劣化能力,采用Fillp技術(shù)優(yōu)化TCP協(xié)議,可以在1%丟包率的情況下將帶寬負載率從10%提升至60%,從而保障從都市圈到偏遠地區(qū)的算力順暢流動,加速AI服務(wù)的普惠應(yīng)用。

如此一來,大模型從訓(xùn)練到部署各個環(huán)節(jié)的網(wǎng)絡(luò)需求都被打通。從智算中心到千行萬業(yè),都有了以網(wǎng)強算的發(fā)展支點。

一個屬于智能化的時代,一個由大模型開啟的科技新紀元剛剛開始。星河AI網(wǎng)絡(luò),給智能時代寫下了一個關(guān)于運力的答案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28860

    瀏覽量

    266176
  • 運力計算
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1675
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1243

    瀏覽量

    23997
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    833

    瀏覽量

    14567
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2132

    瀏覽量

    1970
收藏 人收藏

    評論

    相關(guān)推薦

    星河AI電力網(wǎng)絡(luò),電力智能化的飛躍起點

    網(wǎng)絡(luò)為基,星河為路,我們將抵達怎樣的智電未來?
    的頭像 發(fā)表于 08-28 09:43 ?2323次閱讀
    <b class='flag-5'>星河</b><b class='flag-5'>AI</b>電力<b class='flag-5'>網(wǎng)絡(luò)</b>,電力智能化的飛躍起點

    行業(yè)智能化的“火車頭效應(yīng)”,由星河AI金融網(wǎng)絡(luò)啟動

    星河AI金融網(wǎng)絡(luò)“通車時刻”,聽見行業(yè)智能化的“火車頭”轟鳴
    的頭像 發(fā)表于 08-23 09:15 ?2302次閱讀
    行業(yè)智能化的“火車頭效應(yīng)”,由<b class='flag-5'>星河</b><b class='flag-5'>AI</b>金融<b class='flag-5'>網(wǎng)絡(luò)</b>啟動

    面向AI之海,行業(yè)智能化需要一座“運力燈塔”

    星河AI網(wǎng)絡(luò),照亮智能時代的航線
    的頭像 發(fā)表于 08-16 18:15 ?2929次閱讀
    面向<b class='flag-5'>AI</b>之海,行業(yè)智能化需要一座“<b class='flag-5'>運力</b>燈塔”

    星河智聯(lián)發(fā)布FLOW.源大模型座艙系統(tǒng),引領(lǐng)智能出行新紀元

    在智能網(wǎng)聯(lián)汽車技術(shù)日新月異的今天,星河智聯(lián)正式推出了其智能座艙操作系統(tǒng)的最新代際產(chǎn)品——FLOW.源大模型座艙系統(tǒng)。這一創(chuàng)新成果不僅標志著星河智聯(lián)在智能座艙領(lǐng)域的技術(shù)突破,也預(yù)示著汽車人機交互體驗將邁入一個全新的時代。
    的頭像 發(fā)表于 07-19 17:07 ?744次閱讀

    一圖看懂星河AI園區(qū)網(wǎng)絡(luò),以體驗為中心,企業(yè)數(shù)智升級首選

    一圖看懂星河AI園區(qū)網(wǎng)絡(luò),以體驗為中心,企業(yè)數(shù)智升級首選
    的頭像 發(fā)表于 05-19 11:10 ?372次閱讀
    一圖看懂<b class='flag-5'>星河</b><b class='flag-5'>AI</b>園區(qū)<b class='flag-5'>網(wǎng)絡(luò)</b>,以體驗為中心,企業(yè)數(shù)智升級首選

    華為面向中東中亞地區(qū)發(fā)布星河AI園區(qū)網(wǎng)絡(luò),以體驗為中心,企業(yè)數(shù)智升級首選

    華為數(shù)據(jù)通信創(chuàng)新峰會2024中東中亞站期間,在“高品質(zhì)萬兆園區(qū)網(wǎng)絡(luò),以體驗為中心,企業(yè)數(shù)智升級首選”專題分論壇上,華為發(fā)布星河AI園區(qū)網(wǎng)絡(luò)解決方案,旨在為企業(yè)提供卓越的
    的頭像 發(fā)表于 05-15 09:17 ?369次閱讀

    HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時代新動能

    華為數(shù)據(jù)通信創(chuàng)新峰會2024在巴庫隆重舉辦,在“星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時代新動能”主題論壇中,華為面向中東中亞地區(qū)發(fā)布星河
    的頭像 發(fā)表于 05-15 09:15 ?431次閱讀
    HNS 2024:<b class='flag-5'>星河</b><b class='flag-5'>AI</b>數(shù)據(jù)中心<b class='flag-5'>網(wǎng)絡(luò)</b>,賦<b class='flag-5'>AI</b>時代新動能

    華為聯(lián)合中國信通院發(fā)布《華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)測試報告》

    2024 開放數(shù)據(jù)中心委員會(以下簡稱ODCC)春季全會在江西婺源順利召開,全會由ODCC副主席李潔博士主持。全會期間,華為聯(lián)合中國信通院云大所數(shù)據(jù)中心團隊發(fā)布《華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)測試報告》(以下簡稱“測試報告”)。
    的頭像 發(fā)表于 04-02 09:25 ?1280次閱讀

    一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放AI時代算力

    華為中國合作伙伴大會 | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),以網(wǎng)強算,全面釋放AI時代算力
    的頭像 發(fā)表于 03-22 10:28 ?584次閱讀
    一圖看懂<b class='flag-5'>星河</b><b class='flag-5'>AI</b>數(shù)據(jù)中心<b class='flag-5'>網(wǎng)絡(luò)</b>,全面釋放<b class='flag-5'>AI</b>時代算力

    學(xué)習鴻蒙背后的價值?星河版開放如何學(xué)習?

    鴻蒙原生內(nèi)核。 實現(xiàn)了AI框架、大模型、設(shè)計系統(tǒng)、編程框架、編程語言、編譯器等全棧自研,有核心技術(shù)、全棧能力、底座和生態(tài),是真正的操作系統(tǒng),而非安卓套皮。關(guān)鍵是有了鴻蒙星河版本也就意味著國內(nèi)市場有了
    發(fā)表于 02-22 20:55

    AI模型怎么解決芯片過剩?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:42:05

    AI模型可以設(shè)計電路嗎?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:09:29

    華為星河AI網(wǎng)絡(luò)亮相2023AI創(chuàng)新網(wǎng)絡(luò)大會,斬獲“璀璨技術(shù)獎”大獎

    副總裁李建高受邀參加,并發(fā)表主題為《華為星河AI網(wǎng)絡(luò),高運力釋放AI時代高算力》的演講。華為星河
    的頭像 發(fā)表于 10-21 16:20 ?1124次閱讀
    華為<b class='flag-5'>星河</b><b class='flag-5'>AI</b><b class='flag-5'>網(wǎng)絡(luò)</b>亮相2023<b class='flag-5'>AI</b>創(chuàng)新<b class='flag-5'>網(wǎng)絡(luò)</b>大會,斬獲“璀璨技術(shù)獎”大獎

    華為星河AI網(wǎng)絡(luò)解決方案榮獲AI訓(xùn)練場景最佳實踐沙利文“全球技術(shù)領(lǐng)導(dǎo)獎”

    [中國,2023年9月27日]華為星河AI網(wǎng)絡(luò)解決方案榮獲全球著名增長咨詢公司 Frost Sullivan 弗若斯特沙利文(以下簡稱“沙利文”)AI訓(xùn)練場景最佳實踐 “2023全球技
    的頭像 發(fā)表于 09-28 21:35 ?592次閱讀
    華為<b class='flag-5'>星河</b><b class='flag-5'>AI</b><b class='flag-5'>網(wǎng)絡(luò)</b>解決方案榮獲<b class='flag-5'>AI</b>訓(xùn)練場景最佳實踐沙利文“全球技術(shù)領(lǐng)導(dǎo)獎”

    華為全聯(lián)接大會2023|華為發(fā)布業(yè)界首個網(wǎng)絡(luò)模型,加速行業(yè)智能化

    華為全聯(lián)接大會2023期間,華為重磅發(fā)布業(yè)界首個網(wǎng)絡(luò)模型——星河AI網(wǎng)絡(luò)模型,深度賦能iMa
    的頭像 發(fā)表于 09-25 19:00 ?719次閱讀
    華為全聯(lián)接大會2023|華為發(fā)布業(yè)界首個<b class='flag-5'>網(wǎng)絡(luò)</b>大<b class='flag-5'>模型</b>,加速行業(yè)智能化