0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTC 2023|Colossal-AI系統(tǒng)的數(shù)據(jù)并行優(yōu)化方案

西西 ? 來源:GTC 2023 ? 作者:GTC 2023 ? 2023-03-23 17:00 ? 次閱讀

Colossal-AI的改變:

從Colossal-AI的GitHub star數(shù)量中看出,這是衡量其開源社區(qū)的指標(biāo)。與其它非常流行的開源系統(tǒng)(如Spark、 MongoDB等)相比,在相同時間內(nèi)Colossal-AI使用增長速度是最快的。

世界上37個國家的用戶正在使用Colossal-AI,還有各種其他人工智能生態(tài)系統(tǒng)使用Colsssal-AI。

Colsssal-AI的重要功能——N-Dim并行系統(tǒng)

這可以將你的復(fù)雜模型可用硬件上,以便最大化使用并行同時最小化通信。

Colsssal-AI提供了完整的并行方法,包括數(shù)據(jù)并行、張量并行、流水線并行和序列并行,同時還有團隊提出的2維、2.5維和3維張量并行以及序列并行。

其中優(yōu)化了數(shù)據(jù)并行,可以讓你以最小的損失在相當(dāng)大的規(guī)換下訓(xùn)練模型。

大規(guī)模優(yōu)化器如何優(yōu)化數(shù)據(jù)并行

與單個GPU訓(xùn)練相比數(shù)據(jù)并行訓(xùn)練將整個數(shù)據(jù)集分為幾個分區(qū)。

每個GPU擁有1個數(shù)據(jù)集分區(qū),模型在每個GPU上復(fù)制,開在其本地數(shù)據(jù)集分區(qū)進行訓(xùn)練,在反向傳播期間計算的梯度,被平均并用于更新模型副本,可以確保在不同GPU之間同步模型。

然而,簡單的增加批次大小,通常會導(dǎo)致泛化性能下降并降低計算精度。為了解決這些問題,研究出一種新的方法,可擴展的大規(guī)模優(yōu)化器LARS和LAMB,適合大批量設(shè)置。

在ViT模型和ImageNet數(shù)據(jù)集上對可擴展的大規(guī)模優(yōu)化器LARS和LAMB進行理論分析。他們可最大程度使用GPU資源,將ViT-B/32的訓(xùn)練時間從一個GPU的73小時減少到200個GPU的0.68小時,并實現(xiàn)幾乎線性增加的加速度,并保證收斂。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128594
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3721

    瀏覽量

    90694
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5466

    瀏覽量

    120891
  • gtc
    gtc
    +關(guān)注

    關(guān)注

    0

    文章

    73

    瀏覽量

    4408
收藏 人收藏

    評論

    相關(guān)推薦

    Ai與設(shè)備資產(chǎn)管理系統(tǒng)系統(tǒng)融合應(yīng)用方案

    AI與設(shè)備資產(chǎn)管理系統(tǒng)的融合應(yīng)用方案可以顯著提升設(shè)備管理的效率和準(zhǔn)確性,降低運營成本,提高設(shè)備的使用壽命。具體實施步驟包括需求分析、系統(tǒng)設(shè)計、技術(shù)選型、開發(fā)與集成、測試與
    的頭像 發(fā)表于 05-30 13:44 ?334次閱讀
    <b class='flag-5'>Ai</b>與設(shè)備資產(chǎn)管理<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>系統(tǒng)</b>融合應(yīng)用<b class='flag-5'>方案</b>

    寧暢服務(wù)器亮相GTC 2024,開啟AI新紀(jì)元

    在舉世矚目的NVIDIA GTC 2024盛會上,寧暢以贊助商身份再度登上舞臺,為全球AI生態(tài)帶來一場視覺與技術(shù)的盛宴。大會線上線下同步進行,匯聚了眾多AI領(lǐng)域的創(chuàng)新力量,共同展望AI
    的頭像 發(fā)表于 03-27 11:16 ?606次閱讀

    與NVIDIA深度參與GTC,向量數(shù)據(jù)庫大廠Zilliz與全球頂尖開發(fā)者共迎AI變革時刻

    近日,備受關(guān)注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發(fā)者齊聚美國加州圣何塞會議中心,共同探索行業(yè)未來,全球領(lǐng)先的向量數(shù)據(jù)庫公司 Zilliz 也不例外。作為去年被
    的頭像 發(fā)表于 03-26 11:01 ?382次閱讀

    AI高光時刻:汽車技術(shù)全方位亮相GTC 2024大會

    汽車行業(yè)的所有目光正聚焦于 GTC 大會,這場全球 AI 盛會正在加州圣何塞線上線下同時舉行,將持續(xù)至 3 月 21 日結(jié)束。
    的頭像 發(fā)表于 03-21 09:52 ?1700次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò),打造性能最強大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò),數(shù)據(jù)中心必備的優(yōu)化 AI
    發(fā)表于 03-19 10:05 ?309次閱讀
    NVIDIA 發(fā)布全新交換機,全面<b class='flag-5'>優(yōu)化</b>萬億參數(shù)級 GPU 計算和 <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施

    英偉達(dá)GTC大會將開幕 黃仁勛將帶你《見證AI的變革時刻》

    英偉達(dá)GTC大會將開幕 黃仁勛將帶你《見證AI的變革時刻》 全球都在關(guān)注的英偉達(dá)GTC大會將開幕,作為“AI風(fēng)向標(biāo)”大家都在期待英偉達(dá)在GTC
    的頭像 發(fā)表于 03-18 18:25 ?1297次閱讀

    英偉達(dá)GTC大會即將召開,聚焦AI與機器人技術(shù)前沿

    備受矚目的英偉達(dá)GTC大會將于3月18日至21日盛大舉行。作為英偉達(dá)每年最重要的技術(shù)發(fā)布平臺,GTC大會不僅展示了英偉達(dá)在圖形處理、人工智能等領(lǐng)域的最新進展,更被業(yè)界公認(rèn)為引領(lǐng)AI發(fā)展潮流的“風(fēng)向標(biāo)”。
    的頭像 發(fā)表于 03-18 11:31 ?959次閱讀

    潞晨科技Colossal-AI與浪潮信息AIStation完成兼容性互認(rèn)證

    近日,潞晨科技的Colossal-AI大模型開發(fā)工具和浪潮信息的AIStation智能業(yè)務(wù)創(chuàng)新生產(chǎn)平臺成功完成了兼容性互認(rèn)證。這一合作意味著用戶可以在AIStation平臺上便捷地部署與調(diào)度Colossal-AI系統(tǒng),從而極大提
    的頭像 發(fā)表于 03-06 10:18 ?724次閱讀

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    的潞晨科技Colossal-AI系統(tǒng),用戶可實現(xiàn)在本地算力平臺一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開發(fā)效率提升10倍以上,并將算力效率提升2-3倍,在最大化提升大模型開發(fā)效率的同時,降低大模型開發(fā)及應(yīng)用的門檻和成本。 Coloss
    的頭像 發(fā)表于 03-01 09:43 ?442次閱讀
    潞晨科技<b class='flag-5'>Colossal-AI</b> + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    是德科技推出AI數(shù)據(jù)中心測試平臺旨在加速AI/ML網(wǎng)絡(luò)驗證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對人工智能(AI)和機器學(xué)習(xí)(ML)基礎(chǔ)設(shè)施生態(tài)系統(tǒng),推出了 AI數(shù)據(jù)中心測試平臺,旨在加
    的頭像 發(fā)表于 02-29 09:32 ?570次閱讀
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)</b>中心測試平臺旨在加速<b class='flag-5'>AI</b>/ML網(wǎng)絡(luò)驗證和<b class='flag-5'>優(yōu)化</b>的創(chuàng)新

    高通推出首個支持AI優(yōu)化的Wi-Fi 7系統(tǒng)FastConnect 7900

    今日,高通技術(shù)公司推出高通FastConnect 7900移動連接系統(tǒng),是行業(yè)首個支持AI優(yōu)化性能并在單個芯片中集成Wi-Fi 7、藍(lán)牙和超寬帶技術(shù)的解決方案。
    的頭像 發(fā)表于 02-26 16:41 ?504次閱讀

    KITA2GTC3325VTRBSTOBO1開發(fā)板運行的是什么系統(tǒng)?

    請告知KITA2GTC3325VTRBSTOBO1 開發(fā)板運行的是什么系統(tǒng)(RTOS 或·····)?開發(fā)板的整個Demo code從哪里可以得到?
    發(fā)表于 02-01 06:10

    Nullmax揭秘BEV-AI技術(shù)架構(gòu)加速量產(chǎn)方案演進

    12月19日,Nullmax首席科學(xué)家成二康博士應(yīng)邀出席2023全球自動駕駛峰會(GADS 2023),在自動駕駛BEV感知技術(shù)論壇上發(fā)表《BEV-AI技術(shù)架構(gòu) – 量產(chǎn)方案演進》主題
    的頭像 發(fā)表于 12-22 14:46 ?1095次閱讀

    中科曙光推出AI大模型存儲解決方案

    11月29日,“數(shù)智創(chuàng)新 AI未來”2023中國數(shù)據(jù)與存儲峰會在北京舉辦。曙光存儲受邀發(fā)表主題演講,詳述面向AI大模型的數(shù)據(jù)存儲解決
    的頭像 發(fā)表于 11-30 10:58 ?742次閱讀

    國產(chǎn)FPAI芯片的AI系統(tǒng)方案

    今天,小弟和大家談一談某國產(chǎn)FPAI芯片的AI系統(tǒng)方案以及參考設(shè)計實例。
    的頭像 發(fā)表于 11-28 11:32 ?1001次閱讀
    國產(chǎn)FPAI芯片的<b class='flag-5'>AI</b><b class='flag-5'>系統(tǒng)</b><b class='flag-5'>方案</b>