0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

鄭緯民院士:內(nèi)存型長記憶存儲(chǔ)以存換算是AI推理新趨勢

要長高 ? 2024-11-01 16:03 ? 次閱讀

在10月29日由中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)舉辦的數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)(簡稱“數(shù)據(jù)存儲(chǔ)專委會(huì)”)成立大會(huì)上,匯聚了產(chǎn)業(yè)界代表、專委會(huì)成員及多位院士專家,共逾百人,共同探討了數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)的發(fā)展,并見證了數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)的正式成立。會(huì)上,中國工程院院士、數(shù)據(jù)存儲(chǔ)專委會(huì)名譽(yù)會(huì)長鄭緯民發(fā)表了題為“AI存儲(chǔ):人工智能大模型的基石”的主旨演講。

鄭緯民院士指出,人工智能進(jìn)入大模型時(shí)代展現(xiàn)出兩大特征:一是基礎(chǔ)大模型邁入多模態(tài)時(shí)代,實(shí)現(xiàn)了從單一文本到圖片、視頻等多模態(tài)信息的綜合應(yīng)用;二是大模型已在金融、醫(yī)療、智能制造等多個(gè)領(lǐng)域得到實(shí)際應(yīng)用。

針對(duì)大模型的四個(gè)關(guān)鍵環(huán)節(jié),鄭緯民院士詳細(xì)闡述了存儲(chǔ)在大模型訓(xùn)練和推理應(yīng)用中所面臨的挑戰(zhàn)及相關(guān)技術(shù):

首先,數(shù)據(jù)獲取階段,大模型訓(xùn)練需要海量的原始數(shù)據(jù),這些數(shù)據(jù)需被存儲(chǔ)設(shè)備妥善保存。隨著大模型從單模態(tài)向多模態(tài)發(fā)展,產(chǎn)生了數(shù)以百億計(jì)的小文件,這對(duì)文件系統(tǒng)的目錄擴(kuò)展性、讀寫速度以及存儲(chǔ)的低延遲和高可擴(kuò)展性提出了更高要求。

其次,數(shù)據(jù)預(yù)處理階段,由于原始數(shù)據(jù)質(zhì)量參差不齊,存在大量重復(fù)和低質(zhì)量數(shù)據(jù),因此需要進(jìn)行預(yù)處理以提升數(shù)據(jù)質(zhì)量。以ChatGPT4級(jí)別的大模型為例,其訓(xùn)練過程可能需要1萬塊A100顯卡耗時(shí)11個(gè)月,其中數(shù)據(jù)預(yù)處理可能占據(jù)一半以上的時(shí)間,這與數(shù)據(jù)存儲(chǔ)的性能密切相關(guān)。

再次,模型訓(xùn)練階段,大規(guī)模訓(xùn)練系統(tǒng)(如10萬塊顯卡組成的系統(tǒng))的可靠性難以保證,頻繁出現(xiàn)故障,導(dǎo)致集群可用度低下。為了快速恢復(fù)訓(xùn)練,需要依賴高性能的存儲(chǔ)系統(tǒng)來快速讀取CheckPoint數(shù)據(jù)。華為與清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合開發(fā)的高性能AI存儲(chǔ)系統(tǒng)在此方面表現(xiàn)出色,曾在國際權(quán)威機(jī)構(gòu)MLPerf Storage基準(zhǔn)評(píng)測中獲得第一名,性能密度是第二名的兩倍。

最后,模型推理階段,這是與AI應(yīng)用最直接相關(guān)的環(huán)節(jié)。更高效的人工智能需要處理更多數(shù)據(jù)、使用更大模型以及更長的上下文窗口,但這同時(shí)也帶來了極重的推理負(fù)載。模型參數(shù)以及推理過程中產(chǎn)生的KV-Cache需要巨大的存儲(chǔ)空間。為此,國內(nèi)優(yōu)秀的大模型應(yīng)用Kimi與清華大學(xué)MADSys實(shí)驗(yàn)室共同推出了Mooncake分離式推理架構(gòu),通過保存共享的KV-Cache,采用以存換算的策略大幅提升系統(tǒng)吞吐。

鄭緯民院士強(qiáng)調(diào),模型推理過程是一個(gè)復(fù)雜的存儲(chǔ)系統(tǒng)工程,關(guān)鍵在于存儲(chǔ)容量大、傳輸速度快以及性價(jià)比高。清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合華為數(shù)據(jù)存儲(chǔ)、9#AISoft、阿里云、面壁、趨境等公司共同開發(fā)的高性能內(nèi)存型長記憶存儲(chǔ)系統(tǒng)即將開源發(fā)布,該系統(tǒng)能夠?qū)崿F(xiàn)大范圍全局共享與持久化KV-Cache,以存換算,共同構(gòu)建大模型時(shí)代下的高性能內(nèi)存型長記憶存儲(chǔ)系統(tǒng)生態(tài)。

最后,鄭緯民院士總結(jié)指出,AI存儲(chǔ)是人工智能大模型的基石,貫穿于大模型生命周期的每一個(gè)環(huán)節(jié)。通過以存強(qiáng)算、以存換算,先進(jìn)的AI存儲(chǔ)能夠提升訓(xùn)練集群的可用度,降低推理成本,提升用戶體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4231

    瀏覽量

    85591
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29846

    瀏覽量

    268147
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46686

    瀏覽量

    237176
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI驅(qū)動(dòng)新型存儲(chǔ)器技術(shù),國內(nèi)新興存儲(chǔ)企業(yè)進(jìn)階

    生成式AI對(duì)于算力、運(yùn)力和力的需求與日俱增,如何打破“存儲(chǔ)墻”成為存儲(chǔ)行業(yè)面臨的挑戰(zhàn)與機(jī)會(huì)。從因AI訓(xùn)練而爆紅的HBM,再到DDR5、PC
    發(fā)表于 10-16 08:10 ?828次閱讀
    <b class='flag-5'>AI</b>驅(qū)動(dòng)新型<b class='flag-5'>存儲(chǔ)</b>器技術(shù),國內(nèi)新興<b class='flag-5'>存儲(chǔ)</b>企業(yè)進(jìn)階

    王耀南院士AI大模型賦能人形機(jī)器人及未來趨勢

    研究現(xiàn)狀,關(guān)鍵技術(shù)賦能具身智能人形機(jī)器人,以及未來的發(fā)展趨勢與展望四個(gè)方面進(jìn)行匯報(bào)。 王院士認(rèn)為人工智能大模型推動(dòng)人形機(jī)器人在感知、認(rèn)知、思考、分析、判斷、推理、交互的智能自主作業(yè)方向發(fā)展。隨后
    的頭像 發(fā)表于 11-08 11:03 ?379次閱讀
    王耀南<b class='flag-5'>院士</b>:<b class='flag-5'>AI</b>大模型賦能人形機(jī)器人及未來<b class='flag-5'>趨勢</b>

    面向未來數(shù)據(jù)中心的存儲(chǔ)平臺(tái)技術(shù)挑戰(zhàn)與探索

    近日,中國計(jì)算機(jī)學(xué)會(huì)第十三期CCF秀湖會(huì)議在蘇州CCF業(yè)務(wù)總部&學(xué)術(shù)交流中心正式拉開帷幕。本次會(huì)議就“新應(yīng)用與硬件驅(qū)動(dòng)下的存儲(chǔ)技術(shù)創(chuàng)新”主題進(jìn)行深入交流和探討。中國工程院院士、清華大學(xué)
    的頭像 發(fā)表于 11-06 10:43 ?141次閱讀

    AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

    HyperAccel 是一家成立于 2023 年 1 月的韓國初創(chuàng)企業(yè),致力于開發(fā) AI 推理專用半導(dǎo)體器件和硬件,最大限度提升推理工作負(fù)載的存儲(chǔ)
    的頭像 發(fā)表于 09-18 09:37 ?311次閱讀
    AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務(wù)器

    智馭未來,AI拼才會(huì)贏—弘孟董事寄語工業(yè)富聯(lián),拼搏共贏新篇章

    奧運(yùn)會(huì)馬上就要開始,F(xiàn)ii工業(yè)富聯(lián)發(fā)布《弘孟董事致工業(yè)富聯(lián)全體同仁的一封信》,在全球AI競賽浪潮中,AI已經(jīng)成為公司未來發(fā)展的核心驅(qū)動(dòng)力,如何讓
    的頭像 發(fā)表于 07-14 08:33 ?372次閱讀
    智馭未來,<b class='flag-5'>AI</b>拼才會(huì)贏—<b class='flag-5'>鄭</b>弘孟董事<b class='flag-5'>長</b>寄語工業(yè)富聯(lián),拼搏共贏新篇章

    AI浪潮下的十大消費(fèi)者新趨勢

    人工智能已經(jīng)風(fēng)靡全球,當(dāng)我們沉浸在AI技術(shù)為辦公與生活帶來的各種便利時(shí),一些人也會(huì)質(zhì)疑:AI 真的能為我們描繪出更美好的未來畫卷嗎? AI 賦能的十大消費(fèi)者趨勢 愛立信消費(fèi)者實(shí)驗(yàn)室的最
    發(fā)表于 06-05 10:30 ?302次閱讀

    第十三期CCF秀湖會(huì)議:共話未來數(shù)據(jù)中心的存儲(chǔ)平臺(tái)技術(shù)挑戰(zhàn)與探索

    、清華大學(xué)教授,華中科技大學(xué)金海教授,清華大學(xué)舒繼武教授,浪潮存儲(chǔ)產(chǎn)品線總經(jīng)理李輝等20余位專家出席會(huì)議。秀湖會(huì)議AC主席、CCF副理事
    的頭像 發(fā)表于 06-04 16:33 ?307次閱讀
    第十三期CCF秀湖會(huì)議:共話未來數(shù)據(jù)中心的<b class='flag-5'>存儲(chǔ)</b>平臺(tái)技術(shù)挑戰(zhàn)與探索

    英特爾助力京東云用CPU加速AI推理,大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?479次閱讀
    英特爾助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,<b class='flag-5'>以</b>大模型構(gòu)建數(shù)智化供應(yīng)鏈

    科技助力AI應(yīng)用落地:WTMDK2101-ZT1評(píng)估板實(shí)地評(píng)測與性能揭秘

    計(jì)算: 近計(jì)算:在近計(jì)算中,計(jì)算單元與高速存儲(chǔ)單元(如高速緩存)緊密集成。這意味著處理器和高速存儲(chǔ)單元之間的距離很近,可以快速訪問數(shù)據(jù)并進(jìn)行計(jì)算,減少了數(shù)據(jù)從
    發(fā)表于 05-16 16:38

    內(nèi)計(jì)算WTM2101編譯工具鏈 資料

    內(nèi)計(jì)算是突破物理極限的下一代算力技術(shù)- AIGC等人工智能新興產(chǎn)業(yè)的快速發(fā)展離不開算力,算力的基礎(chǔ)是人工智能芯片。 當(dāng)前CPU/GPU在執(zhí)行計(jì)算密集任務(wù)時(shí)需要將海量參數(shù)(ωij)從內(nèi)存
    發(fā)表于 05-16 16:33

    如何看待半導(dǎo)體行業(yè)未來的新趨勢

    如何看待半導(dǎo)體行業(yè)未來的新趨勢
    的頭像 發(fā)表于 04-25 11:38 ?675次閱讀
    如何看待半導(dǎo)體行業(yè)未來的<b class='flag-5'>新趨勢</b>

    AI時(shí)代,強(qiáng)則強(qiáng)

    強(qiáng)算,強(qiáng)訓(xùn),強(qiáng)安
    的頭像 發(fā)表于 03-22 09:17 ?2092次閱讀
    <b class='flag-5'>AI</b>時(shí)代,<b class='flag-5'>存</b>強(qiáng)則強(qiáng)

    2024 開年CES,存儲(chǔ)芯片/模組應(yīng)用新趨勢

    (電子發(fā)燒友網(wǎng)報(bào)道 文/黃晶晶)作為開年的消費(fèi)電子產(chǎn)品風(fēng)向標(biāo),2024年CES展如期而至。在此次展會(huì)上,不少存儲(chǔ)廠商帶來了新產(chǎn)品,電子發(fā)燒友網(wǎng)整理部分廠商的展示訊息,可以看到這些廠商已積極布局在AI
    的頭像 發(fā)表于 01-12 09:33 ?2293次閱讀
    2024 開年CES,<b class='flag-5'>存儲(chǔ)</b>芯片/模組應(yīng)用<b class='flag-5'>新趨勢</b>

    HarmonyOS:使用MindSpore Lite引擎進(jìn)行模型推理

    場景介紹 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件設(shè)備 AI 模型推理的功能,目前已經(jīng)在圖像分類、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。 本文介紹
    發(fā)表于 12-14 11:41

    器的工作原理

    器的工作原理? 鎖器(latch)是一種用于存儲(chǔ)記憶數(shù)字信號(hào)的電路。它被廣泛用于計(jì)算機(jī)和數(shù)字電子電路中,用于實(shí)現(xiàn)內(nèi)存
    的頭像 發(fā)表于 12-08 11:18 ?5791次閱讀