0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布大模型智算軟件棧OGAI,為大模型創(chuàng)新打造高效生產(chǎn)力

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-08-28 08:08 ? 次閱讀

浪潮信息正式發(fā)布大模型智算軟件棧 OGAI。OGAI (Open GenAI Infra)"元腦生智",是為大模型業(yè)務(wù)提供AI算力系統(tǒng)環(huán)境部署、算力調(diào)度保障及模型開發(fā)管理能力的全棧全流程的智算軟件棧。OGAI由浪潮信息基于大模型自身實踐與服務(wù)客戶的專業(yè)經(jīng)驗而開發(fā),旨在為大模型研發(fā)與應(yīng)用創(chuàng)新全力打造高效生產(chǎn)力,加速生成式AI產(chǎn)業(yè)創(chuàng)新步伐。

大模型是當(dāng)前通用人工智能產(chǎn)業(yè)發(fā)展創(chuàng)新的核心技術(shù)。目前國內(nèi)已發(fā)布的生成式AI模型超過了100個,"百模爭秀"的格局初現(xiàn)。但大模型從研發(fā)到應(yīng)用的各環(huán)節(jié)中,依然面臨諸多挑戰(zhàn),如大模型算力的系統(tǒng)全棧問題、兼容適配問題、性能優(yōu)化問題等。

OGAI是浪潮信息從當(dāng)前大模型算力建設(shè)、模型開發(fā)和應(yīng)用落地的實際需求出發(fā),秉承全棧全流程、算力充分釋放、實戰(zhàn)驗證提煉的設(shè)計原則打造而成。OGAI由5層架構(gòu)組成,從L0到L4分別對應(yīng)基礎(chǔ)設(shè)施層的智算中心OS、系統(tǒng)環(huán)境層的PODsys、調(diào)度平臺層的AIStation、模型工具層的YLink和多模納管層的MModel。

L0層智算中心OS:面向大模型算力服務(wù)的智能算力運管平臺,滿足多租戶以裸金屬為主的彈性AI算力運管需求。其中,高效的裸金屬服務(wù)支持分鐘級部署上千規(guī)模裸金屬節(jié)點并按需進行彈性擴展,實現(xiàn)異構(gòu)計算芯片、IB、RoCE高速網(wǎng)絡(luò)、高性能存儲等環(huán)境一鍵獲取,并實現(xiàn)計算、網(wǎng)絡(luò)、數(shù)據(jù)隔離以保障業(yè)務(wù)安全。

L1層PODsys:開源、高效、兼容、易用的智算集群系統(tǒng)環(huán)境部署方案。聚焦智算集群部署場景,從OS、驅(qū)動到系統(tǒng)監(jiān)控可視化、資源調(diào)度等集群系統(tǒng)環(huán)境要素全面覆蓋,選用最穩(wěn)定和廣泛兼容的軟件版本,通過一系列腳本工具簡化部署過程,縮短算力上線周期,并可向企業(yè)用戶提供實施安裝服務(wù)和集群性能校準(zhǔn)的專家服務(wù)。

L2層AIStation:面向大模型開發(fā)的商業(yè)化人工智能算力調(diào)度平臺。針對大模型訓(xùn)練中常見的訓(xùn)練中斷難題,可實現(xiàn)訓(xùn)練異??焖俣ㄎ唬瑪帱c自動續(xù)訓(xùn):通過快速定位芯片、網(wǎng)卡、通訊設(shè)備異?;蚬收?,實現(xiàn)全局訓(xùn)練暫停保持,熱備算力自動彈性替換,健康節(jié)點快速CheckPoint讀取,實現(xiàn)斷點自動續(xù)訓(xùn)。

L3層YLink:面向大模型數(shù)據(jù)治理、預(yù)訓(xùn)練、微調(diào)的高效工具鏈。聚焦于大模型的數(shù)據(jù)治理、預(yù)訓(xùn)練、微調(diào)等開發(fā)過程,集成了浪潮信息在大模型研發(fā)中的自研工具和開源工具,如數(shù)據(jù)處理工具包(Y-DataKit)、大模型訓(xùn)練工具包(Y-TrainKit)和大模型微調(diào)工具包(Y-FTKit)等等,通過這些多樣且完善的工程化、自動化工具,加速大模型的訓(xùn)練和開發(fā)效率。

L4層MModel:提供多模型接入、服務(wù)、評測等功能的納管平臺。核心組件包括數(shù)據(jù)集管理、模型納管和評測,可以方便開發(fā)者和研究人員更好地管理多版本、多類型的基礎(chǔ)大模型與任務(wù)模型,并通過多樣化的評測數(shù)據(jù)集與評測任務(wù),對多個模型進行生成準(zhǔn)確率、推理延遲、推理穩(wěn)定性等指標(biāo)進行全面評估。

浪潮信息高級副總裁、AI&HPC總經(jīng)理劉軍表示:"OGAI提供完善的工程化、自動化工具軟件堆棧,將幫助更多企業(yè)順利跨越大模型研發(fā)應(yīng)用門檻,充分釋放大模型創(chuàng)新生產(chǎn)力。浪潮信息將通過智算系統(tǒng)軟硬件高度協(xié)同進行持續(xù)創(chuàng)新,持續(xù)培育繁榮元腦生態(tài),推動實現(xiàn)‘助百模,智千行',加速生成式AI產(chǎn)業(yè)創(chuàng)新。"

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    450

    瀏覽量

    23784
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2274

    瀏覽量

    2357
收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息源2.0大模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開源大模型源2.0已全面適配百度PaddleNLP。這一舉措標(biāo)志著大模型開發(fā)生態(tài)正加速進化,用戶提供了更加便捷、高效
    的頭像 發(fā)表于 10-17 18:15 ?438次閱讀

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    浪潮信息在AI底座建設(shè)、大模型開發(fā)領(lǐng)域積累的成熟、成功經(jīng)驗工具化,助力金融機構(gòu)又快、又穩(wěn)地部署生成式AI應(yīng)用,助力金融數(shù)智化跨越式發(fā)展。
    的頭像 發(fā)表于 09-20 16:07 ?284次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

    浪潮信息發(fā)布AIStation V5,全面支持大模型開發(fā)流程與高效調(diào)度

    北京2024年7月11日?/美通社/ -- 7月9日,在"元腦中國行"全國巡展?jié)险旧希?b class='flag-5'>浪潮信息發(fā)布AIStation 人工智能開發(fā)平臺V5升級版,具備全面的大模型流程支持能力,幫助企業(yè)用戶降低構(gòu)建
    的頭像 發(fā)表于 07-12 09:37 ?354次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>AIStation V5,全面支持大<b class='flag-5'>模型</b>開發(fā)流程與<b class='flag-5'>高效</b><b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度

    浪潮信息重磅發(fā)布“源2.0-M32”開源大模型

    浪潮信息近日發(fā)布了一款全新的開源大模型——“源2.0-M32”。這款大模型在“源2.0”系列大模型的基礎(chǔ)上,進行了深度的技術(shù)
    的頭像 發(fā)表于 06-05 14:50 ?717次閱讀

    畢昇大模型應(yīng)用開發(fā)平臺+浪潮信息AIStation,讓大模型定制更簡單

    北京2024年6月5日?/美通社/ -- 近日,畢昇大模型應(yīng)用開發(fā)平臺與浪潮信息AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺完成兼容性互認(rèn)證。基于畢昇和
    的頭像 發(fā)表于 06-05 11:58 ?375次閱讀
    畢昇大<b class='flag-5'>模型</b>應(yīng)用開發(fā)平臺+<b class='flag-5'>浪潮信息</b>AIStation,讓大<b class='flag-5'>模型</b>定制更簡單

    浪潮信息發(fā)布源2.0-M32開源大模型,模效率大幅提升

    5月28日,浪潮信息發(fā)布“源2.0-M32”開源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基礎(chǔ)上,創(chuàng)新性地提出和采用了
    的頭像 發(fā)表于 05-29 09:34 ?373次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>源2.0-M32開源大<b class='flag-5'>模型</b>,模<b class='flag-5'>算</b>效率大幅提升

    浪潮信息發(fā)布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎(chǔ)上,引入了“基于注意機制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建了一個包含32個專家的混合專家
    的頭像 發(fā)表于 05-29 09:08 ?589次閱讀

    模型專門優(yōu)化 浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發(fā)布模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息
    的頭像 發(fā)表于 05-10 16:37 ?399次閱讀
    <b class='flag-5'>為</b>大<b class='flag-5'>模型</b>專門優(yōu)化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>分布式全閃存儲AS13000G7-N系列

    浪潮信息發(fā)布模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

    近日,浪潮信息發(fā)布模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎D
    的頭像 發(fā)表于 05-08 09:38 ?492次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b><b class='flag-5'>為</b>大<b class='flag-5'>模型</b>專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

    浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺&quot;元腦企智&quot;EPAI,加速AI創(chuàng)新落地

    of AI),企業(yè)AI大模型落地應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺,提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識檢索、應(yīng)用框架等系列工具,支持調(diào)度多元
    的頭像 發(fā)表于 04-18 21:21 ?415次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>企業(yè)大<b class='flag-5'>模型</b>開發(fā)平臺&quot;元腦企智&quot;EPAI,加速AI<b class='flag-5'>創(chuàng)新</b>落地

    浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺“元腦企智”EPAI

    應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺,提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識檢索、應(yīng)用框架等系列工具,支持調(diào)度多元和多模算法,幫助企業(yè)高效開發(fā)
    的頭像 發(fā)表于 04-18 10:12 ?350次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>企業(yè)大<b class='flag-5'>模型</b>開發(fā)平臺“元腦企智”EPAI

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特爾最新商用AI PC

    % 。企業(yè)可以在全新的英特爾商用客戶端AI PC上,使用AI PC大模型效率工具"YuanChat"快速本地化部署和運行"源2.0"大模型, 以更快的訪問速度、更高的性能和更好的數(shù)據(jù)安全控制,輕松完成自動編程、商業(yè)數(shù)據(jù)計算、公文寫作等任務(wù),釋放大
    的頭像 發(fā)表于 03-27 22:52 ?440次閱讀
    <b class='flag-5'>浪潮信息</b>&quot;源2.0&quot;大<b class='flag-5'>模型</b>YuanChat支持英特爾最新商用AI PC

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型開發(fā)工具與浪潮信息AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺完成兼容性互認(rèn)證?;贏IStation平臺部署與調(diào)度
    的頭像 發(fā)表于 03-01 09:43 ?441次閱讀
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>開發(fā)效率提升10倍

    浪潮信息劉軍:智力系統(tǒng)創(chuàng)新 加速生成式AI產(chǎn)業(yè)發(fā)展

    北京2023年12月6日?/美通社/ --?11月29日,在北京舉行的2023人工智能計算大會(AICC)上,浪潮信息高級副總裁劉軍在主題演講《智力系統(tǒng)創(chuàng)新 加速生成式AI產(chǎn)業(yè)發(fā)展》中分享了
    的頭像 發(fā)表于 12-06 14:08 ?905次閱讀
    <b class='flag-5'>浪潮信息</b>劉軍:智<b class='flag-5'>算</b>力系統(tǒng)<b class='flag-5'>創(chuàng)新</b> 加速生成式AI產(chǎn)業(yè)發(fā)展

    數(shù)聚AI ? 智慧未來 | 浪潮信息存儲助力企業(yè)基于大模型實現(xiàn)數(shù)字化創(chuàng)新

    2023年生成式AI和大模型的爆發(fā),讓我們面對一個變化更加快速也更加激動人心的時代,隨著新質(zhì)生產(chǎn)力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展的提出,
    的頭像 發(fā)表于 11-30 16:25 ?410次閱讀
    數(shù)聚AI ? 智慧未來 | <b class='flag-5'>浪潮信息</b>存儲助力企業(yè)基于大<b class='flag-5'>模型</b>實現(xiàn)數(shù)字化<b class='flag-5'>創(chuàng)新</b>