0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

AMD中國 ? 來源:AMD中國 ? 2023-07-25 15:40 ? 次閱讀

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

人工智能是塑造下一代計算的決定性技術(shù)。近幾個月來,我們都看到了生成式人工智能和大語言模型的爆炸式增長正在徹底改變我們與技術(shù)交互的方式,并推動以GPU為中心的數(shù)據(jù)中心對高性能計算的需求顯著增加。

ROCm是一個開放軟件平臺,允許研究人員利用AMD Instinct加速器的強(qiáng)大功能,促進(jìn)HPC和AI創(chuàng)新跨平臺的可移植性。ROCm 5具有針對AI和HPC工作負(fù)載的全面優(yōu)化套件。其中包括針對大型語言模型精細(xì)調(diào)整的內(nèi)核、對新數(shù)據(jù)類型的支持以及對像OpenAI Triton類編程語言等新技術(shù)的支持。

ROCm驗(yàn)證現(xiàn)在包括每晚進(jìn)行數(shù)十萬次框架測試,以及跨數(shù)千個模型和運(yùn)算符的驗(yàn)證。這包括對PyTorch、TensorFlow、ONNX和JAX等領(lǐng)先框架的支持,為基于這些框架構(gòu)建的所有AI模型提供更佳的開箱即用的開發(fā)者體驗(yàn)。

我很高興地宣布ROCm 5.6的最新版本。

ROCm 5.6通過針對大語言(和其他)模型的新型AI軟件附加組件增強(qiáng)了功能,包括跨ROCm 庫組合的許多性能優(yōu)化。它還反映了支持人工智能社區(qū)的持續(xù)改進(jìn),包括:

- 將Hugging Face單元測試套件集成到ROCm QA中

- 在PyTorch 2.0感應(yīng)器模式下對OpenAI Triton的增量支持

- 通過ROCm對PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區(qū)

ROCm 5.6還引入了對FFT、BLAS和求解器等多個數(shù)學(xué)庫的改進(jìn),這些數(shù)學(xué)庫構(gòu)成了HPC應(yīng)用程序的基礎(chǔ),并增強(qiáng)了ROCm開發(fā)和部署工具,包括安裝、ROCgdb(CPU-GPU集成調(diào)試器)、ROCm分析器和文檔。

隨著行業(yè)朝著支持廣泛加速器的開放生態(tài)系統(tǒng)發(fā)展,我們將繼續(xù)努力進(jìn)一步優(yōu)化框架和后端編譯器,以實(shí)現(xiàn)更佳性能,包括MLIR基礎(chǔ)設(shè)施改進(jìn),鞏固AMD對OpenAI Triton和OpenXLA編譯器的支持。我們還將繼續(xù)在Hugging Face的AMD hub中添加針對AMD解決方案優(yōu)化的其他開源AI模型。

對于HPC用戶,我們最近在AMD Infinity Hub上發(fā)布了許多發(fā)布方法,使客戶能夠構(gòu)建HPC應(yīng)用程序容器,未來的ROCm版本將增加AMD Instinct解決方案支持的HPC應(yīng)用程序數(shù)量。

我們還看到開發(fā)人員對在Radeon消費(fèi)級和 Radeon Pro工作站級GPU上運(yùn)行用于AI和ML的ROCm開放軟件平臺表現(xiàn)出了極大的興趣,并聽到了社區(qū)對不受支持的GPU上的特定驅(qū)動程序問題提出的挑戰(zhàn)。我可以很高興地說,我們已經(jīng)修復(fù)了ROCm 5.6中報告的問題,并且我們致力于今后擴(kuò)大我們的支持。

我們計劃將ROCm支持從當(dāng)前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 擴(kuò)展到特定的AMD RDNA 3工作站和消費(fèi)級GPU。Linux上對基于RDNA 3的GPU的正式支持計劃于今年秋季開始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時間的推移,還會發(fā)布更多卡和擴(kuò)展功能。

責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5376

    瀏覽量

    133384
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235033
  • RDNA
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    1890

原文標(biāo)題:新的ROCm? 5.6版本為AI和HPC工作負(fù)載帶來增強(qiáng)和優(yōu)化

文章出處:【微信號:AMD中國,微信公眾號:AMD中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英國公司實(shí)現(xiàn)英偉達(dá)CUDA軟件AMD GPU的無縫運(yùn)行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件AMD GPU的無縫遷
    的頭像 發(fā)表于 07-18 14:40 ?456次閱讀

    三星將于今年內(nèi)推出3D HBM芯片封裝服務(wù)

    近日,據(jù)韓國媒體報道,全球領(lǐng)先的半導(dǎo)體制造商三星即將在今年推出其高帶寬內(nèi)存(HBM)的3D封裝服務(wù)。這一重大舉措是三星2024年三星代工論壇正式宣布的,同時也得到了業(yè)內(nèi)消息人士的證
    的頭像 發(fā)表于 06-19 14:35 ?754次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場展望

    COMPUTEX 2024主題演講中,英偉達(dá)(NVIDIA)公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)英偉達(dá)透露,B100、B200和GB200系列GPU將于今年第四季度正式推出,這不僅體現(xiàn)了
    的頭像 發(fā)表于 06-13 09:44 ?601次閱讀

    AMD將棄用700系命名,下代桌面主板升級至800系?

    AMD 800系主板將為Zen5架構(gòu)的銳龍9000系列處理器提供支持,預(yù)計將于今年6月初的2024臺北國際電腦展(COMPUTEX 2024)亮相。
    的頭像 發(fā)表于 05-28 11:14 ?529次閱讀

    AMD發(fā)布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名現(xiàn)身,而Navi 44則以Gfx1200之名亮相。這兩款GPU的出現(xiàn),至少暗示了AMD正在逐步完善RDNA 4 GPU的研發(fā)工作。
    的頭像 發(fā)表于 05-24 16:11 ?409次閱讀

    AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個計算單元?

    因受限 RDNA 3 世代尷尬處境,AMD 下一代 RDNA4 游戲顯卡似乎選擇避開與英偉達(dá)旗艦級別產(chǎn)品
    的頭像 發(fā)表于 04-28 14:29 ?594次閱讀

    AMD RDNA4顯卡全部搭載18Gbps顯存,帶寬略遜于部分RDNA3產(chǎn)品

    現(xiàn)行的零售版RadeonRX7900XT、7900XT搭載的是20Gbps的GDDR6顯存,而RX7800XT則采用了19.5Gbps的顯存。因此,RDNA4顯卡的顯存速度可能不及部分RDNA3產(chǎn)品,與RX7900GRE、RX7
    的頭像 發(fā)表于 04-23 16:37 ?601次閱讀

    英偉達(dá)GPU壟斷局面下,開源能否成為顛覆市場的關(guān)鍵力量?

    開源是AMD AI軟硬件生態(tài)系統(tǒng)的一大賣點(diǎn),雖然ROCm軟件自 2016 年推出以來一直是開源的,但是固件的開源也很重要,AMD GPU
    發(fā)表于 04-18 14:25 ?347次閱讀
    英偉達(dá)<b class='flag-5'>GPU</b>壟斷局面下,開源能否成為顛覆市場的關(guān)鍵力量?

    AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數(shù)預(yù)測模型

    在此期間,AMD 頻繁向GitHub公共倉庫推送有關(guān) ROCm 6.1 的最新開發(fā)進(jìn)展,透露出不久后有可能正式上線新版本的意圖。
    的頭像 發(fā)表于 02-29 14:33 ?570次閱讀

    AMD GPU如何安裝和配置triton?

    最近在整理python-based的benchmark代碼,反過來NV的GPU又把Triton裝了一遍,發(fā)現(xiàn)Triton的github repo已經(jīng)給出了對應(yīng)的llvm的commit id以及對應(yīng)的編譯細(xì)節(jié),然后跟著走了一遍
    的頭像 發(fā)表于 02-22 17:04 ?1984次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b><b class='flag-5'>上</b>如何安裝和配置triton?

    AMD Zen6架構(gòu)繼續(xù)飛躍!核顯跨越下下代RDNA5

    AMD的下一代Zen5 CPU架構(gòu)還沒來,Zen6的消息就已經(jīng)多次傳出,現(xiàn)在又提到了所集成的GPU核顯,居然將會搭配同樣下下一代的RDNA5。
    的頭像 發(fā)表于 02-22 09:53 ?675次閱讀
    <b class='flag-5'>AMD</b> Zen6架構(gòu)繼續(xù)飛躍!核顯跨越下下代<b class='flag-5'>RDNA</b>5

    GPU技術(shù)、生態(tài)及算力分析

    對比AMD從2013年開始建設(shè)GPU生態(tài),近10年時間后用于通用計算的ROCm開放式軟件平臺才逐步有影響力,且還是兼容CUDA的基礎(chǔ)。因
    的頭像 發(fā)表于 01-14 10:06 ?1017次閱讀
    <b class='flag-5'>GPU</b>技術(shù)、生態(tài)及算力分析

    深入解讀AMD最新GPU架構(gòu)

    GCN 取代了 Terascale,并強(qiáng)調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后,AMD 將其 GPU 架構(gòu)開發(fā)分為單獨(dú)的 CDNA 和 RDNA 線路,分別專門用于計算和圖形。
    發(fā)表于 01-08 10:12 ?967次閱讀
    深入解讀<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b>架構(gòu)

    日本東芝公司被收購 股票將于今年12月20日退市

    日本東芝公司被收購 股票將于今年12月20日退市 日企聯(lián)盟已經(jīng)完成了對東芝的要約收購。日本東芝公司10月12日公布,東芝公司股票將于今年12月20日退市,結(jié)束長達(dá)74年的上市歷史。要知道東芝公司成立
    的頭像 發(fā)表于 10-14 18:15 ?1107次閱讀

    重磅!AMD GPU頭號負(fù)責(zé)人宣布離職

    Scott Herkelman表示,AMD工作了七年并推出了三代競爭力日益增強(qiáng)的RDNA圖形架構(gòu)后,他決定在今年年底離開AMD。Scott
    的頭像 發(fā)表于 09-27 16:44 ?576次閱讀
    重磅!<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>頭號負(fù)責(zé)人宣布離職