0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神州鯤泰推出全新智算架構(gòu)及硅光+液冷整機柜,破解多云異構(gòu)綠色智算難題

科技數(shù)碼 ? 來源:科技數(shù)碼 ? 作者:科技數(shù)碼 ? 2024-05-15 16:37 ? 次閱讀

在數(shù)字經(jīng)濟時代,算力資源已經(jīng)成為新的“能源”,為人工智能云計算等等科技界前沿領(lǐng)域持續(xù)供能。5月9日,數(shù)云原力大會2024在神州數(shù)碼國際創(chuàng)新中心(IIC)盛大召開。在開幕式上,神州數(shù)碼副總裁、神州數(shù)碼信創(chuàng)控股董事長韓智敏重磅發(fā)布新一代神州鯤泰綠色異構(gòu)智算中心全液冷整機柜新品,在異構(gòu)智算的時代,通過軟硬件協(xié)同創(chuàng)新,為客戶提供性能強、能效高、節(jié)能環(huán)保的新選擇。

異構(gòu)智算時代,企業(yè)智算落地如何兼顧效率與成本?

我們迎來了一個全新的異構(gòu)智算時代。在當(dāng)前的算力環(huán)境下,多云異構(gòu)智算基礎(chǔ)設(shè)施已成為必然。異構(gòu)算力資源如何得到充分利用?在混合云部署下,如何應(yīng)對算力構(gòu)建選型、部署、運維復(fù)雜度和難度的挑戰(zhàn)?這個獨特的“智算攢機時代”,正在呼喚全新的智算架構(gòu)。

與此同時,隨著大模型和生成式AI加速落地,大量的模型訓(xùn)練和推理任務(wù),在喚醒底層算力海量需求的同時,也對資源利用率提出了巨大挑戰(zhàn)。有關(guān)資料顯示,OpenAI訓(xùn)練GPT-4的MFU(Model Flops Utility)在32%到36%之間。而目前行業(yè)MFU利用率的平均水平僅為30%~40%,智算資源利用率尚有很大的提升空間,利用率提升也將為企業(yè)節(jié)省大量成本。

能耗是另一個大的挑戰(zhàn),算力本身會成為主要的能耗和二氧化碳排放來源。明顯可預(yù)見的就是,GPU的能耗本身是CPU能耗的2倍以上。根據(jù)MIT研究表明,未來人類需要為人工智能相關(guān)應(yīng)用新增10%的能源需求。也就是說,“煉”大模型會比煉鋼還費電。對于一個企業(yè)來說,每新增一個用于智算的機架,其運行一年約等于增加15w度電,約等于100個家庭的年用電量,約等于1.5噸二氧化碳排放,能耗和碳排放十分巨大。

盡精微,神州鯤泰異“雙管齊下”提升算力資源利用率

神州鯤泰推出HISO異構(gòu)智算調(diào)度運營平臺、HICA異構(gòu)智算加速平臺,有效解決智算集群間以及集群內(nèi)面臨的復(fù)雜異構(gòu)兼容問題,并顯著提升算力資源的利用率。

HISO異構(gòu)智算調(diào)度運營平臺,基于云原生技術(shù),整合GPU硬分片和虛擬分片技術(shù),能實現(xiàn)GPU資源虛擬化或池化,完成跨集群之間的算力調(diào)度。根據(jù)用戶業(yè)務(wù)需求,該平臺可以在整個異構(gòu)智算資源池中匹配優(yōu)選算力組合,提升GPU服務(wù)器集群的資源使用率。HISO異構(gòu)智算調(diào)度運營平臺擁有將國內(nèi)外GPU資源混合組網(wǎng)、混搭調(diào)度,算力精細(xì)隔離等關(guān)鍵能力,可以“像管理一臺GPU主機一樣,管理和調(diào)度多個集群的GPU資源”。通過GPU容器直通、IaaS卸載,該平臺加速了模型加載時間,相比傳統(tǒng)方式,模型加載速度提升3倍。同時還能實時收集智算中心全棧、全鏈路指標(biāo),發(fā)現(xiàn)和定位軟硬件故障,實現(xiàn)算力可觀測性。

HICA異構(gòu)智算加速平臺則著重解決集群內(nèi)部的算力調(diào)度優(yōu)化問題,通過屏蔽集群內(nèi)底層算力生態(tài)差異,突破關(guān)鍵計算效率瓶頸,有效提升算力利用率與可用性。HICA異構(gòu)智算加速平臺通過自研的服務(wù)層、中間適配層以及調(diào)度編排算法,采用數(shù)據(jù)并行、模型并行等方式,把并行計算任務(wù)進行有效分解,匹配相應(yīng)的軟件棧和算力資源來承接。當(dāng)GPU資源變化,該平臺可以實時動態(tài)調(diào)度計算子任務(wù)并調(diào)整模型拓?fù)浜图軜?gòu),以充分聚合各種算力資源。

HICA異構(gòu)智算加速平臺具有一云多芯特性,支持國內(nèi)外主流AI芯片,可實現(xiàn)訓(xùn)練推理任務(wù)在不同品牌、不同型號芯片組成的智算集群中的混合訓(xùn)練推理,預(yù)計可降低20%閑置算力。

此外,根據(jù)不同模型、不同算子之間集合通信流特點,該平臺還可自適應(yīng)選擇最合適的通信參數(shù),達到更高的通信效率。同時,在不同模型運行過程中,充分考慮存算比要求的不同,HICA異構(gòu)智算加速平臺還可從宏觀到微觀多個尺度選擇最合適的存算比資源加載模型,加速吞吐,降低時延,使MFU提升10~20%,MBU提升5%。

硅光+液冷,一體化交付冷卻跳動的電表

隨著生成式AI落地對算力需求的暴漲、帶寬的狂飆提速,智算中心節(jié)點的高能耗痛點日益加劇。而以一個萬卡智算中心為例,采用200G接口互聯(lián),需要約80000個光模塊,其互聯(lián)所需的能耗則占到總體的5%。節(jié)點間互聯(lián)的高能耗問題也日益凸顯。

針對節(jié)點間互聯(lián)的能耗問題,神州鯤泰采用硅光技術(shù),通過單光源多調(diào)制器,降低調(diào)制器電壓,同時采用分布式反饋激光器等一系列技術(shù),有效降低25%的互聯(lián)能耗。

同時,針對節(jié)點的能耗問題,神州鯤泰推出液冷服務(wù)器,通過一體化冷板,智能流量調(diào)節(jié)來提升系統(tǒng)的散熱效率,采用負(fù)壓管線系統(tǒng),漏液近端探測技術(shù),并聯(lián)動服務(wù)管控系統(tǒng)提升冷卻系統(tǒng)的可靠性,有效降低30%的節(jié)點能耗。

而為了幫助客戶規(guī)避接口多、接頭復(fù)雜、現(xiàn)場實施部署難度大、實施周期長等難題,數(shù)云原力大會2024開幕式上,神州鯤泰正式發(fā)布“KunTai Pod2000全液冷整機柜”方案產(chǎn)品。采用一體化交付方式,有效降低部署和運維的復(fù)雜度的同時,整機柜還能實現(xiàn)100%全液冷及高性價比液冷方案,助力數(shù)據(jù)中心PUE邁向1.15,并且憑借60KW+的最大單柜功率,實現(xiàn)1.5倍于行業(yè)平均水平的能效比,在為客戶提供強打算力的同時有效控制能耗成本。

隨著2022年底ChatGPT的問世,AI正成為推動創(chuàng)新的核心引擎?,F(xiàn)在的IT基礎(chǔ)架構(gòu)已經(jīng)到了一個由模型和算力相互促進,螺旋上升的新發(fā)展階段。面對新的發(fā)展機遇,神州鯤泰從智算中心系統(tǒng)整體性能提升出發(fā),提出了走新智算架構(gòu)之路的策略,建立了高通量、高并行、高效率,低能耗的多樣化智算架構(gòu)。新的智算架構(gòu)能夠快部署、低投入地突破算力瓶頸,構(gòu)建出性能更優(yōu)、成本更低、能效更高的智算中心。未來每個智算中心,每臺計算機都將是這樣一種新的智算架構(gòu),從而實現(xiàn)算力的普惠。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硅光
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    8920
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266199
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    501

    瀏覽量

    25374
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    836

    瀏覽量

    14569
收藏 人收藏

    評論

    相關(guān)推薦

    異構(gòu),打贏智時代「牧野之戰(zhàn)」

    商周大戰(zhàn)?周武王用「異構(gòu)」拿下戰(zhàn)場!
    的頭像 發(fā)表于 07-24 14:13 ?1655次閱讀
    <b class='flag-5'>異構(gòu)</b>智<b class='flag-5'>算</b>,打贏智<b class='flag-5'>算</b>時代「牧野之戰(zhàn)」

    神州亮相北京數(shù)字安全大會,以智能力構(gòu)筑數(shù)據(jù)安全的堅實底座

    力正成為賦能各行各業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)技術(shù)要素,神州面對智時代多云、
    的頭像 發(fā)表于 07-18 16:06 ?325次閱讀
    <b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>亮相北京數(shù)字安全大會,以智能<b class='flag-5'>算</b>力構(gòu)筑數(shù)據(jù)安全的堅實底座

    異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高力利用率

    的解決方案。通過混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢,提高力利用率,降低力成本,并推動AI技術(shù)的廣泛應(yīng)用。 ? 異構(gòu)混訓(xùn)能夠整合不同
    的頭像 發(fā)表于 07-18 00:11 ?3118次閱讀

    神州亮相WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024,以智能力搭配大模型推動產(chǎn)業(yè)數(shù)智化變革

    ? 6月28日,由深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主辦,百度飛槳、文心大模型聯(lián)合承辦的WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024在北京成功舉辦,神州亮相活動并帶來全新的AI
    的頭像 發(fā)表于 07-01 16:48 ?4.1w次閱讀
    <b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>亮相WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024,以智能<b class='flag-5'>算</b>力搭配大模型推動產(chǎn)業(yè)數(shù)智化變革

    神州亮相WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024,以智能力搭配大模型推動產(chǎn)業(yè)數(shù)智化變革

    在人工智能蓬勃發(fā)展的當(dāng)下,神州持續(xù)深化與互聯(lián)網(wǎng)企業(yè)的合作,聯(lián)合為客戶打造更多力更強大、部署更便捷、業(yè)務(wù)應(yīng)對更敏捷的大模型一體機解決方案,以智能
    的頭像 發(fā)表于 07-01 16:22 ?246次閱讀
    <b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>亮相WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2024,以智能<b class='flag-5'>算</b>力搭配大模型推動產(chǎn)業(yè)數(shù)智化變革

    助力全國一體化力網(wǎng)建設(shè),神州力構(gòu)建新質(zhì)生產(chǎn)力

    力助推新質(zhì)生產(chǎn)力發(fā)展的道路。“成為領(lǐng)先的創(chuàng)新智基礎(chǔ)設(shè)施提供商”一直是神州的愿景,在本次活動上,神州
    的頭像 發(fā)表于 06-24 16:57 ?476次閱讀
    助力全國一體化<b class='flag-5'>算</b>力網(wǎng)建設(shè),<b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>以<b class='flag-5'>算</b>力構(gòu)建新質(zhì)生產(chǎn)力

    新聞丨第七屆數(shù)字中國建設(shè)峰會正式啟幕,神州攜手天翼云共筑智云生態(tài)

    是展示數(shù)字中國建設(shè)成就的盛會,本次峰會以“釋放數(shù)據(jù)要素價值,發(fā)展新質(zhì)生產(chǎn)力”為主題,神州作為中國電信天翼云重要合作伙伴受邀參展“智云生態(tài)大會”。同時,
    的頭像 發(fā)表于 05-24 15:15 ?407次閱讀
    <b class='flag-5'>鯤</b><b class='flag-5'>泰</b>新聞丨第七屆數(shù)字中國建設(shè)峰會正式啟幕,<b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>攜手天翼云共筑智<b class='flag-5'>算</b>云生態(tài)

    新聞|神州創(chuàng)新智之旅北京站開幕,發(fā)布全新架構(gòu)液冷整機柜產(chǎn)品應(yīng)對 “多云、異構(gòu)綠色

    加速平臺HICA以及一體化交付的神州液冷整機柜產(chǎn)品。幫助企業(yè)客戶在整個
    的頭像 發(fā)表于 05-22 10:56 ?291次閱讀
    <b class='flag-5'>鯤</b><b class='flag-5'>泰</b>新聞|<b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>創(chuàng)新智<b class='flag-5'>算</b>之旅北京站開幕,發(fā)布<b class='flag-5'>全新</b>智<b class='flag-5'>算</b><b class='flag-5'>架構(gòu)</b>和<b class='flag-5'>液冷</b><b class='flag-5'>整機柜</b>產(chǎn)品應(yīng)對 “<b class='flag-5'>多云</b>、<b class='flag-5'>異構(gòu)</b>、<b class='flag-5'>綠色</b>

    打造新型智中心,神州中標(biāo)中移動智中心采購

    5月16日,中國移動采購與招標(biāo)網(wǎng)發(fā)布了《中國移動2024年至2025年新型智中心采購中標(biāo)候選人公示》,神州數(shù)碼集團股份有限公司下屬控股子公司神州
    的頭像 發(fā)表于 05-17 15:54 ?245次閱讀
    打造新型智<b class='flag-5'>算</b>中心,<b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>中標(biāo)中移動智<b class='flag-5'>算</b>中心采購

    神州與中電標(biāo)聯(lián)合成立云計算應(yīng)用軟件適配研究中心

    研究中心成立暨專題組2024年第二季度工作會議在廈門隆重舉行,這也是神州2024創(chuàng)新智之旅的開端。廈門市政協(xié)副主席李欽輝,中國工程院院士沈昌祥,中國電子技術(shù)標(biāo)準(zhǔn)化研究院副院長范科
    的頭像 發(fā)表于 05-09 14:04 ?238次閱讀
    <b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>與中電標(biāo)聯(lián)合成立云計算應(yīng)用軟件適配研究中心

    神州攜智系列產(chǎn)品亮相2024華為北京政企合作伙伴大會

    政企合作伙伴大會在京隆重舉辦,在人工智能蓬勃發(fā)展的當(dāng)下,向合作伙伴分享市場發(fā)展趨勢、前進方向以及華為在智和產(chǎn)業(yè)端的全新舉措,與合作伙伴一起踔厲奮發(fā)、攜手共進。近千位合作伙伴受邀到場參會,共譜北京數(shù)字產(chǎn)業(yè)新篇章,神州
    的頭像 發(fā)表于 04-22 16:27 ?385次閱讀
    <b class='flag-5'>神州</b><b class='flag-5'>鯤</b><b class='flag-5'>泰</b>攜智<b class='flag-5'>算</b>系列產(chǎn)品亮相2024華為北京政企合作伙伴大會

    權(quán)威認(rèn)證,神州數(shù)碼旗下神州14款服務(wù)器通過政府采購需求標(biāo)準(zhǔn)測試!

    版)》,充分展現(xiàn)了神州系列產(chǎn)品的技術(shù)領(lǐng)先性、高標(biāo)準(zhǔn)的產(chǎn)品質(zhì)量、完整的生態(tài)適配能力。此次批量通過的14款神州
    的頭像 發(fā)表于 03-25 22:12 ?394次閱讀

    中國電信規(guī)劃在上海建設(shè)首個國產(chǎn)超大規(guī)模液冷集群

    中國電信規(guī)劃建設(shè)首個國產(chǎn)超大規(guī)模液冷集群 人工智能技術(shù)的快速發(fā)展催生了巨大的力需求;中國電信規(guī)劃在上海規(guī)劃建設(shè)可支持萬億參數(shù)大模型訓(xùn)練的智集群中心。其中會搭載
    的頭像 發(fā)表于 02-22 18:48 ?1223次閱讀

    燧原科技與青云科技達成戰(zhàn)略合作,創(chuàng)新異構(gòu)力調(diào)度

    NEWS 燧原科技與青云科技日前達成戰(zhàn)略合作,攜手創(chuàng)新異構(gòu)資源池的靈活調(diào)度,共建支持場景落地的AI力生態(tài),為AI應(yīng)用快速落地、AI力普惠提供驅(qū)動力。 人工智能技術(shù)的發(fā)展正在步入
    的頭像 發(fā)表于 12-11 12:20 ?495次閱讀

    英特爾攜手京東云構(gòu)建綠色數(shù)據(jù)中心高密度力方案,降低TCO和碳排放

    54V,有效降低了電源全鏈路損耗,改善了數(shù)據(jù)中心能效。結(jié)合在氣流優(yōu)化、液冷散熱等方面的技術(shù)改進,以及第四代英特爾 至強 可擴展處理器帶來的更高能耗比,我們推出綠色的高密度
    的頭像 發(fā)表于 12-01 20:40 ?969次閱讀
    英特爾攜手京東云構(gòu)建<b class='flag-5'>綠色</b>數(shù)據(jù)中心高密度<b class='flag-5'>算</b>力方案,降低TCO和碳排放