0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8正式官宣發(fā)布還支持AMD GPU!

新機(jī)器視覺 ? 來源:量子位(QbitAI) ? 作者:夢(mèng)晨 ? 2021-03-12 11:06 ? 次閱讀

導(dǎo)讀

Pytorch1.8來啦!1.8版本中,官方終于加入了對(duì)AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。 1.8版本中,官方終于加入了對(duì)AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。

AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。此外,本次更新還有諸多亮點(diǎn):

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強(qiáng)分布式訓(xùn)練

新的移動(dòng)端教程與演示

新的性能檢測(cè)工具

相關(guān)的庫(kù)TorchCSPRNG, TorchVision, TorchText和TorchAudio也會(huì)隨之更新。要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會(huì)包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實(shí)現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。新的API,向NumPy學(xué)習(xí)!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實(shí)現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動(dòng)求導(dǎo),以更好的支持科學(xué)計(jì)算。還增加了Beta版NumPy風(fēng)格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強(qiáng)分布式訓(xùn)練

增加了穩(wěn)定的異步錯(cuò)誤與超時(shí)處理,增加NCCL的可靠性。增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計(jì)算效率。

Pipeline Parallelism使用4個(gè)GPU時(shí)的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。

另外還有一些Prototype版的分布式訓(xùn)練新特性。

ZeroRedundancyOptimizer:用于減少所有參與進(jìn)程的內(nèi)存占用。

Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進(jìn)行集合運(yùn)算。

CUDA-support in RPC using TensorPipe:增加對(duì)N卡多卡運(yùn)算的效率。

Remote Module:讓用戶像操作本地模塊一樣操作遠(yuǎn)程模塊。

移動(dòng)端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細(xì)教程。以及圖像分割、目標(biāo)檢測(cè)、神經(jīng)機(jī)器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。 另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運(yùn)行時(shí)文件的大小。

性能檢測(cè)工具

增加Beta版的Benchmark utils,用戶可以進(jìn)行精確的性能測(cè)試。以及Prototype版的FX Graph Mode Quantization,實(shí)現(xiàn)了量化過程的自動(dòng)化。更多新版本詳情,見下方鏈接。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • NVIDIA技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    6246
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84077
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    794

    瀏覽量

    13010

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫遷移與運(yùn)行,標(biāo)志著在
    的頭像 發(fā)表于 07-18 14:40 ?455次閱讀

    pytorch如何訓(xùn)練自己的數(shù)據(jù)

    本文將詳細(xì)介紹如何使用PyTorch框架來訓(xùn)練自己的數(shù)據(jù)。我們將從數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、訓(xùn)練過程、評(píng)估和測(cè)試等方面進(jìn)行講解。 環(huán)境搭建 首先,我們需要安裝PyTorch??梢酝ㄟ^訪問PyTorch
    的頭像 發(fā)表于 07-11 10:04 ?271次閱讀

    tensorflow和pytorch哪個(gè)更簡(jiǎn)單?

    PyTorch更簡(jiǎn)單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個(gè)易于使用、靈活且具有強(qiáng)大社區(qū)支持的框架,PyTorch可能是一個(gè)更好的選擇。如果
    的頭像 發(fā)表于 07-05 09:45 ?380次閱讀

    tensorflow和pytorch哪個(gè)好

    tensorflow和pytorch都是非常不錯(cuò)的強(qiáng)大的框架,TensorFlow還是PyTorch哪個(gè)更好取決于您的具體需求,以下是關(guān)于這兩個(gè)框架的一些關(guān)鍵點(diǎn): TensorFlow : 發(fā)布時(shí)間
    的頭像 發(fā)表于 07-05 09:42 ?440次閱讀

    PyTorch的特性和使用方法

    使用Python重新寫了很多內(nèi)容,使其更加靈活易用。它不僅是一個(gè)擁有自動(dòng)求導(dǎo)功能的深度神經(jīng)網(wǎng)絡(luò)框架,還可以看作是一個(gè)加入了GPU支持的NumPy。PyTorch支持動(dòng)態(tài)圖,允許在運(yùn)行時(shí)
    的頭像 發(fā)表于 07-02 14:27 ?343次閱讀

    新手小白怎么學(xué)GPU云服務(wù)器跑深度學(xué)習(xí)?

    新手小白想用GPU云服務(wù)器跑深度學(xué)習(xí)應(yīng)該怎么做? 用個(gè)人主機(jī)通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動(dòng),如何實(shí)現(xiàn)更經(jīng)濟(jì)便捷的實(shí)現(xiàn)GPU云服務(wù)器深度學(xué)習(xí)?
    發(fā)表于 06-11 17:09

    AMD發(fā)布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名現(xiàn)身,而Navi 44則以Gfx1200之名亮相。這兩款GPU的出現(xiàn),至少暗示了AMD正在逐步完善RDNA 4 GPU的研發(fā)工作。
    的頭像 發(fā)表于 05-24 16:11 ?408次閱讀

    英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場(chǎng)規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場(chǎng)主要由英偉達(dá)、AMD和英特爾等幾家大公司主導(dǎo)。其中,英偉達(dá)在AI GPU
    的頭像 發(fā)表于 05-10 00:59 ?3832次閱讀

    Fedora 40發(fā)布,全方位升級(jí)并新增PyTorch支持

    在人工智能領(lǐng)域,F(xiàn)edora 40首次引入了PyTorch軟件包。盡管PyTorch是一款廣受歡迎的深度學(xué)習(xí)框架,但其驅(qū)動(dòng)程序及庫(kù)的正確安裝往往較為困難。
    的頭像 發(fā)表于 04-24 10:45 ?816次閱讀

    微星宣:AGESA 1.1.7.0 BIOS 支持 AMD 下一代銳龍?zhí)幚砥?/a>

    在此之前,華碩已經(jīng)對(duì)部分X670E主板推送了AGESA 1.1.7.0更新,但并未明確提及對(duì)新款AMD銳龍?zhí)幚砥鞯?b class='flag-5'>支持。此次微星的宣,是對(duì)此類信息的首次確認(rèn)。
    的頭像 發(fā)表于 04-15 10:29 ?1020次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    提供商外,英偉達(dá)成立了專業(yè)的人工智能研究實(shí)驗(yàn)室。 不過,機(jī)器學(xué)習(xí)軟件公司 Mipsology 的首席執(zhí)行兼聯(lián)合創(chuàng)始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示,GPU
    發(fā)表于 03-21 15:19

    AMD將推新GPU,效能媲美英偉達(dá)RTX 4080

    據(jù)悉,AMD正努力研制新品級(jí)GPU,性能堪比英偉達(dá)的RTX 4080,而售價(jià)卻只有后者的一半。據(jù)多個(gè)在線社區(qū)反映,AMD即將發(fā)布的Radeon RX 8000系列
    的頭像 發(fā)表于 01-31 10:00 ?1991次閱讀

    深入解讀AMD最新GPU架構(gòu)

    GCN 取代了 Terascale,并強(qiáng)調(diào) GPGPU 和圖形應(yīng)用程序的一致性能。然后,AMD 將其 GPU 架構(gòu)開發(fā)分為單獨(dú)的 CDNA 和 RDNA 線路,分別專門用于計(jì)算和圖形。
    發(fā)表于 01-08 10:12 ?960次閱讀
    深入解讀<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b>架構(gòu)

    AMD游戲GPU架構(gòu)的優(yōu)勢(shì)分析

    目前AMDGPU 分為兩個(gè)截然不同的產(chǎn)品領(lǐng)域,一個(gè)是針對(duì)游戲的,另一個(gè)是用于超級(jí)計(jì)算機(jī)、大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)系統(tǒng)的。
    發(fā)表于 11-19 12:21 ?560次閱讀
    <b class='flag-5'>AMD</b>游戲<b class='flag-5'>GPU</b>架構(gòu)的優(yōu)勢(shì)分析

    基于Anaconda安裝pytorch深度學(xué)習(xí)環(huán)境+pycharm安裝---免額外安裝CUDA和cudnn

    前言最近由于項(xiàng)目需要,之前我們?cè)诶?b class='flag-5'>GPU進(jìn)行深度學(xué)習(xí)的時(shí)候,都要去NVIDIA的網(wǎng)下載CUDA的安裝程序和cudnn的壓縮包,然后再進(jìn)行很繁瑣的系統(tǒng)環(huán)境配置。不僅環(huán)境配置麻煩,而且特別容易配置
    的頭像 發(fā)表于 10-10 10:16 ?1062次閱讀
    基于Anaconda安裝<b class='flag-5'>pytorch</b>深度學(xué)習(xí)環(huán)境+pycharm安裝---免額外安裝CUDA和cudnn