0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái)提升大模型算力平臺(tái)使用效率

浪潮AIHPC ? 來源:浪潮AIHPC ? 2023-07-03 11:15 ? 次閱讀

日前,2023全球人工智能產(chǎn)品應(yīng)用博覽會(huì)在蘇州開幕。浪潮信息智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái)AIStation憑借領(lǐng)先的資源調(diào)度與平臺(tái)管理能力,有效提升大模型算力平臺(tái)使用效率,榮獲智博會(huì)核心獎(jiǎng)項(xiàng)“產(chǎn)品金獎(jiǎng)”。此次獲獎(jiǎng),不僅體現(xiàn)了AIStation在大模型算力與業(yè)務(wù)支撐方面的領(lǐng)先性,也體現(xiàn)了產(chǎn)業(yè)對(duì)大模型算力平臺(tái)效率的高度關(guān)注。

提升大模型算力平臺(tái)使用效率

當(dāng)前,以大模型為代表的生成式AI技術(shù)正在加速發(fā)展并革新各行業(yè)智能轉(zhuǎn)型路徑。生成式AI創(chuàng)新需要基于海量數(shù)據(jù)集,在擁有成百上千加速卡的AI服務(wù)器集群上對(duì)千億級(jí)參數(shù)的AI大模型進(jìn)行分布式訓(xùn)練。如何發(fā)揮大模型算力平臺(tái)效能、抑制性能損耗,以高效完成AI大模型的訓(xùn)練部署,已成為AIGC時(shí)代的新挑戰(zhàn)。

作為專為人工智能開發(fā)和部署提供全流程支持的端到端平臺(tái),AIStation能夠以強(qiáng)大的資源調(diào)度和管理能力助力客戶加速AI大模型開發(fā)與部署,通過對(duì)計(jì)算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源進(jìn)行統(tǒng)一管理,有效提升大模型AI算力集群的使用效率。

一站式管理、毫秒級(jí)調(diào)度,集群利用率達(dá)70%

大模型訓(xùn)練需要構(gòu)建包含計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、框架等在內(nèi)的系統(tǒng)性分布式訓(xùn)練環(huán)境,傳統(tǒng)的分散化管理不僅門檻高、效率低,且缺少針對(duì)性優(yōu)化的整體調(diào)度系統(tǒng),導(dǎo)致大模型計(jì)算平臺(tái)的整體協(xié)同性較差,訓(xùn)練算力效率低。

針對(duì)分布式訓(xùn)練計(jì)算規(guī)模大、系統(tǒng)性強(qiáng)的特點(diǎn),AIStation實(shí)現(xiàn)了異構(gòu)算力集群的統(tǒng)一池化管理,通過自研分布式任務(wù)自適應(yīng)系統(tǒng)將訓(xùn)練底層的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)環(huán)境自動(dòng)化配置,并提供自定義修改基本超參數(shù)功能。通過多種資源高效管理和調(diào)度策略,AIStation能實(shí)現(xiàn)萬卡集群的毫秒級(jí)調(diào)度,提升整體資源利用率到70%以上。

同時(shí),AIStation集成主流的大模型訓(xùn)練框架,依托容器化技術(shù),能夠?qū)⑦\(yùn)行環(huán)境、框架適配過程標(biāo)準(zhǔn)化、模塊化,支持秒級(jí)構(gòu)建運(yùn)行環(huán)境,保障AI開發(fā)和AI業(yè)務(wù)的高效運(yùn)行。

瓶頸優(yōu)化、穩(wěn)健容錯(cuò),全流程加速大模型訓(xùn)練

針對(duì)大規(guī)模分布式訓(xùn)練過程中遇到的算力網(wǎng)絡(luò)搭建、數(shù)據(jù)加速、網(wǎng)絡(luò)通信優(yōu)化等瓶頸,AIStation通過鏡像分發(fā)加速、數(shù)據(jù)緩存加速、網(wǎng)絡(luò)拓?fù)湔{(diào)度、資源動(dòng)態(tài)彈性伸縮等特性,在提高計(jì)算資源利用率的同時(shí)加速整個(gè)訓(xùn)練過程。其中,AIStation通過數(shù)據(jù)緩存機(jī)制可讓模型訓(xùn)練效率獲得200%-300%的提升,并能夠根據(jù)節(jié)點(diǎn)的數(shù)據(jù)緩存情況自動(dòng)調(diào)度訓(xùn)練任務(wù),避免訓(xùn)練數(shù)據(jù)重復(fù)下載,節(jié)省數(shù)據(jù)加載時(shí)間,與自研調(diào)度系統(tǒng)配合后,分布式訓(xùn)練線性加速比能夠高達(dá)0.9,有效抑制多節(jié)點(diǎn)協(xié)同的性能損耗。

健壯性與穩(wěn)定性是目前高效完成大模型訓(xùn)練的強(qiáng)要求。對(duì)此,AIStation通過提供全生命周期管理、故障容錯(cuò)、集群監(jiān)控運(yùn)維等一體化能力,能夠?qū)崿F(xiàn)訓(xùn)練異常和故障的全面檢測和自動(dòng)處理,有效縮短斷點(diǎn)續(xù)訓(xùn)時(shí)間,降低復(fù)雜度,以持續(xù)穩(wěn)定的訓(xùn)練降低大模型訓(xùn)練成本和周期。

高效調(diào)用,釋放大模型應(yīng)用價(jià)值

針對(duì)大模型訓(xùn)練完成后的應(yīng)用部署,AIStation實(shí)現(xiàn)訓(xùn)練和推理的全打通,加快模型應(yīng)用落地。針對(duì)大模型實(shí)際應(yīng)用中的調(diào)用突發(fā)性,AIStation可根據(jù)推理服務(wù)資源需求的變化及時(shí)調(diào)整資源配給,根據(jù)實(shí)時(shí)業(yè)務(wù)的請(qǐng)求量實(shí)現(xiàn)秒級(jí)服務(wù)擴(kuò)縮容,可支持百萬級(jí)高并發(fā)的大模型AI推理服務(wù)場景,服務(wù)響應(yīng)平均延遲低于1ms,突發(fā)的訪問高峰的響應(yīng)效率提升50%。

目前,AIStation已經(jīng)在2457億參數(shù)的“源”大模型訓(xùn)練實(shí)踐中得到有效驗(yàn)證,支撐 “源”大模型的訓(xùn)練算力效率達(dá)44.8%,高于GPT-3的21.3%。同時(shí),某大型商業(yè)銀行基于AIStation打造的并行運(yùn)算集群,憑借領(lǐng)先的大規(guī)模分布式訓(xùn)練支撐能力,榮獲2022IDC“未來數(shù)字基礎(chǔ)架構(gòu)領(lǐng)軍者”獎(jiǎng)項(xiàng)。未來, AIStation平臺(tái)將持續(xù)為各行業(yè)的大模型開發(fā)與部署提供高效的算力平臺(tái)管理能力,加速AIGC技術(shù)迭代革新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    442

    瀏覽量

    23711
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3032

    瀏覽量

    48346
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24532

原文標(biāo)題:【開放試用】AIStation,有效提升大模型算力平臺(tái)使用效率

文章出處:【微信號(hào):浪潮AIHPC,微信公眾號(hào):浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    近日,2024金融科技應(yīng)用創(chuàng)新發(fā)展大會(huì)暨農(nóng)村金融機(jī)構(gòu)信息化發(fā)展創(chuàng)新座談會(huì)在上海舉辦。浪潮信息推出元腦企智EPAI企業(yè)大模型開發(fā)
    的頭像 發(fā)表于 09-20 16:07 ?26次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

    浪潮信息攜手天府云數(shù)據(jù)科技推出了42kW智風(fēng)冷

    在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,力作為推動(dòng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的核心引擎,正以前所未有的速度進(jìn)化。近日,浪潮信息與四川省天府云數(shù)據(jù)科技有限責(zé)任公司攜手,在國內(nèi)率先推出了42kW智風(fēng)冷
    的頭像 發(fā)表于 07-15 16:18 ?478次閱讀

    浪潮信息發(fā)布AIStation V5,全面支持大模型開發(fā)流程與高效調(diào)度

    北京2024年7月11日?/美通社/ -- 7月9日,在"元腦中國行"全國巡展?jié)险旧希?b class='flag-5'>浪潮信息發(fā)布AIStation 人工智能開發(fā)平臺(tái)V5升級(jí)版,具備全面的大模型流程支持能力,幫助企
    的頭像 發(fā)表于 07-12 09:37 ?303次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布AIStation V5,全面支持大<b class='flag-5'>模型</b>開發(fā)流程與高效<b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度

    畢昇大模型應(yīng)用開發(fā)平臺(tái)+浪潮信息AIStation,讓大模型定制更簡單

    北京2024年6月5日?/美通社/ -- 近日,畢昇大模型應(yīng)用開發(fā)平臺(tái)浪潮信息AIStation智能業(yè)務(wù)
    的頭像 發(fā)表于 06-05 11:58 ?301次閱讀
    畢昇大<b class='flag-5'>模型</b>應(yīng)用開發(fā)<b class='flag-5'>平臺(tái)</b>+<b class='flag-5'>浪潮信息</b>AIStation,讓大<b class='flag-5'>模型</b>定制更簡單

    浪潮信息發(fā)布源2.0-M32開源大模型,模效率大幅提升

    5月28日,浪潮信息發(fā)布“源2.0-M32”開源大模型?!霸?.0-M32”在基于”源2.0”系列大模型已有工作基礎(chǔ)上,創(chuàng)新性地提出和采用了“基于注意
    的頭像 發(fā)表于 05-29 09:34 ?316次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布源2.0-M32開源大<b class='flag-5'>模型</b>,模<b class='flag-5'>算</b><b class='flag-5'>效率</b>大幅<b class='flag-5'>提升</b>

    浪潮信息發(fā)布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎(chǔ)上,引入了“基于注意機(jī)制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建了一個(gè)包含32個(gè)專家的混合專家
    的頭像 發(fā)表于 05-29 09:08 ?520次閱讀

    浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺(tái)&quot;元腦企智&quot;EPAI,加速AI創(chuàng)新落地

    of AI),為企業(yè)AI大模型落地應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺(tái),提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識(shí)檢索、應(yīng)用框架等系列工具,支持調(diào)度多元
    的頭像 發(fā)表于 04-18 21:21 ?346次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布企業(yè)大<b class='flag-5'>模型</b>開發(fā)<b class='flag-5'>平臺(tái)</b>&quot;元腦企智&quot;EPAI,加速AI<b class='flag-5'>創(chuàng)新</b>落地

    浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺(tái)“元腦企智”EPAI

    應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺(tái),提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識(shí)檢索、應(yīng)用框架等系列工具,支持調(diào)度多元和多模算法,幫助企業(yè)高效開發(fā)部署生成式AI應(yīng)用、打造
    的頭像 發(fā)表于 04-18 10:12 ?284次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布企業(yè)大<b class='flag-5'>模型</b>開發(fā)<b class='flag-5'>平臺(tái)</b>“元腦企智”EPAI

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特爾最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息與英特爾正式宣布,浪潮信息"源2.0系列基礎(chǔ)大模型"已和最新的英特爾? 酷睿? Ultra處理器平臺(tái)完成適配,本地推理
    的頭像 發(fā)表于 03-27 22:52 ?373次閱讀
    <b class='flag-5'>浪潮信息</b>&quot;源2.0&quot;大<b class='flag-5'>模型</b>YuanChat支持英特爾最新商用AI PC

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息“源2.0系列基礎(chǔ)大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺(tái)完成適配,本地推理速度提升
    的頭像 發(fā)表于 03-27 13:50 ?468次閱讀
    <b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b><b class='flag-5'>效率</b>工具“YuanChat”

    潞晨科技Colossal-AI與浪潮信息AIStation完成兼容性互認(rèn)證

    近日,潞晨科技的Colossal-AI大模型開發(fā)工具和浪潮信息的AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺(tái)
    的頭像 發(fā)表于 03-06 10:18 ?589次閱讀

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型開發(fā)工具與浪潮信息AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)
    的頭像 發(fā)表于 03-01 09:43 ?379次閱讀
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>開發(fā)<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍

    2024 信心滿滿!19家元腦生態(tài)伙伴與浪潮信息簽署億元分銷協(xié)議

    協(xié)議。 擁抱大模型AIGC風(fēng)口,分銷業(yè)務(wù)變中求進(jìn) 當(dāng)前,生成式人工智能和大模型推動(dòng)需求高速增
    的頭像 發(fā)表于 12-08 18:18 ?503次閱讀

    浪潮信息劉軍:智力系統(tǒng)創(chuàng)新 加速生成式AI產(chǎn)業(yè)發(fā)展

    北京2023年12月6日?/美通社/ --?11月29日,在北京舉行的2023人工智能計(jì)算大會(huì)(AICC)上,浪潮信息高級(jí)副總裁劉軍在主題演講《智力系統(tǒng)創(chuàng)新 加速生成式AI產(chǎn)業(yè)發(fā)展》
    的頭像 發(fā)表于 12-06 14:08 ?821次閱讀
    <b class='flag-5'>浪潮信息</b>劉軍:智<b class='flag-5'>算</b>力系統(tǒng)<b class='flag-5'>創(chuàng)新</b> 加速生成式AI產(chǎn)業(yè)發(fā)展

    PODsys:大模型AI平臺(tái)部署的開源“神器”

    的大模型研發(fā)工具和框架。在平臺(tái)的部署過程中,大模型研發(fā)機(jī)構(gòu)常常需要面對(duì)一系列的問題:大模型
    的頭像 發(fā)表于 11-08 09:17 ?703次閱讀
    PODsys:大<b class='flag-5'>模型</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>平臺(tái)</b>部署的開源“神器”