0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RTX 30系列架構(gòu)的詳細(xì)講解

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-24 15:15 ? 次閱讀

在當(dāng)前的顯卡市場上,占據(jù)80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡,同時(shí)也讓高端游戲卡的價(jià)格高企,發(fā)燒顯卡至少五位數(shù)起。

在RTX 30系列顯卡發(fā)布之后,玩家的不滿似乎釋然了,相比當(dāng)前的圖靈顯卡,安培架構(gòu)的RTX 3090/3080/3070顯卡一下子變得真香了,因?yàn)樗鼈冃阅芊恫徽f,國內(nèi)價(jià)格反而下降了。

·GeForce RTX 3090:取代RTX Titan,相比于Titan RTX快了50%,性能是RTX 2080 Ti顯卡的2倍,配備24GB GDDR6X顯存,售價(jià)11999元,9月24日上市。

·GeForce RTX 3080:取代RTX 2080 Ti,相比于RTX 2080性能快2倍,搭配10GB GDDR6X顯存,海外699美元沒變,國內(nèi)從上代6499降至5499元,9月17日上市。

·GeForce RTX 3070:價(jià)格不到RTX 2080 Ti的一半,但是平均性能更高,同時(shí)比RTX 2070快足足60%,配備8GB GDDR6顯存,售價(jià)3899元,10月份上市。

RTX 30系列顯卡售價(jià)及上市時(shí)間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規(guī)格

從這個(gè)規(guī)格表中可以看出,與RTX 2080 Ti顯卡相比,RTX 3090的標(biāo)志性FP32性能從13.4T提升到了35.7T,翻倍還多,光追及AI加速提升也同樣明顯。

與圖靈顯卡相比,安培GPU的變化之大讓人驚訝,在過去十多年的顯卡升級換代中,性能翻倍的提升很少見到了,NVIDA是怎么做到的?

今天我們就來從詳細(xì)解讀一下安培GPU的架構(gòu),探究它到底帶來了哪些技術(shù)升級以致于讓NVIDIA創(chuàng)始人黃仁勛稱之為有史以來性能提升最大的一次。

先從工藝說起:12nm干掉7nm之后 8nm如何再進(jìn)一步

對于半導(dǎo)體芯片來說,很關(guān)鍵的一部分是制程工藝,先進(jìn)的架構(gòu)也要通過工藝來實(shí)現(xiàn),這是影響芯片能效、性能甚至成本的一大因素。

對NVIDIA來說,他們的Volta伏特、Turing圖靈兩代架構(gòu)都是臺積電12nm FFN工藝了,這是臺積電16nm工藝的改進(jìn)版,如果再算上16nm的Pascal架構(gòu),實(shí)際上過去三代GPU都沒有重大工藝上的升級了。

在Ampere安培架構(gòu)上,NVIDIA終于升級工藝了,只不過這次有兩個(gè)意外——首先沒有選擇臺積電,其次沒有上7nm,而是三星定制的8nm工藝,雖然跟7nm看起來只差了1nm,但實(shí)際上是兩代工藝。

考慮到NVIDIA之前對工藝的表態(tài),沒用7nm工藝而是三星8nm工藝又在意料之中,最關(guān)鍵的問題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的,至少有LPP和LPU兩個(gè)版本,前者適合移動SoC,后者適合高性能芯片,NVIDIA的定制大概是基于后者。

與臺積電的7nm工藝晶體管密度大約1億/mm2相比,8nm工藝大概是6000萬晶體管/mm2,但這是單一的SRAM芯片的對比,實(shí)際上GPU芯片比較復(fù)雜,差距會縮小很多。

根據(jù)是NVIDIA公布的信息,臺積電7nm工藝制造的安培A100核心是540億晶體管,核心面積826mm2,而三星8nm工藝制造的GA102核心是280億晶體管,核心面積官方?jīng)]公布,據(jù)悉是628mm2,也是大核心了。

這么算下來,7nm A100核心的晶體管密度6560萬晶體管/mm2,而三星8nm的GA102核心也有4460萬晶體管/mm2——差距仍在,但似乎可以接受了。

三星8nm工藝的晶圓代工價(jià)格還是秘密,但是不論技術(shù)還是商業(yè)策略上,三星都會比臺積電便宜很多,預(yù)計(jì)代工價(jià)格能差30%或者更高,所以這也是RTX 30系列顯卡能夠不漲價(jià)甚至降價(jià)的關(guān)鍵。

那三星8nm工藝帶來了多大的性能及能效提升呢?首先大家可以看到RTX 30系列顯卡的頻率提升了,從RTX 20系列的1.5GHz+提升到了1.7GHz+,升級工藝還是有性能提升的。

不過RTX 20系列的加速頻率實(shí)際可以達(dá)到1.9GHz甚至接近2GHz,RTX 30系列預(yù)計(jì)也就這個(gè)水平。

但是能效還是有提升的,NVIDIA官方稱在60fps性能下,圖靈顯卡的功耗大約有240W,安培顯卡則是120W多點(diǎn),算下來是1.9倍能效,提升了90%,同時(shí)溫度還低了3度,噪音減少2分貝。

總的來說,在工藝這方面大家對安培GPU有驚喜有失望,失望的是沒有上預(yù)期中的7nm工藝(不管臺積電還是三星),工藝依然升級到了8nm。

但是NVIDIA工藝雖然并不算激進(jìn),但性能、能效進(jìn)步還是挺大的,安培顯卡各方面指標(biāo)都是大幅勝過現(xiàn)在的圖靈卡,而且價(jià)格做到了不升反降,這也是不追求激進(jìn)工藝的好處,反正之前12nm都能贏,現(xiàn)在上8nm更加穩(wěn)妥了。

安培GPU架構(gòu)詳解之:FP32單元翻倍 CUDA核心改了什么?

發(fā)布安培的時(shí)候,NVIDIA CEO黃仁勛表示這是GPU有史以來最大的性能飛躍,而2018年推出圖靈GPU時(shí),老黃也是類似的說詞——GPU有史以來最大的變革,這兩個(gè)評價(jià)其實(shí)也沒錯(cuò)。

圖靈GPU架構(gòu)有很多第一次,首次支持RTX Core(光追加速單元),首次支持Tensor Core,同時(shí)還改進(jìn)了CUDA內(nèi)核,不過前兩個(gè)是重點(diǎn)。

在安培GPU上,RT Core、Tensor Core當(dāng)然繼續(xù)加強(qiáng),不過最主要的亮點(diǎn)是CUDA架構(gòu)的改進(jìn),性能翻倍的根源就在這里,我們先來看看這方面的變化。

GA102核心架構(gòu)示意圖

GA102核心總計(jì)7組GPC單元,每組有12組SM單元,總計(jì)84組,RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同,RTX 3090是82組,RTX 3080是68組,RTX 3070是46組。

在之前的GA100大核心中,每組SM是64個(gè)INT32單元、64個(gè)FP32單元及32個(gè)FP64單元組成的,但在GA102核心中,F(xiàn)P64單元大幅減少,增加了RT Core,Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走,安培GPU的SM單元增加的并不多,但實(shí)際上FP32性能翻倍了還多,算上頻率,RTX 3080的理論性能差不多是RTX 2080的三倍了,這是怎么做到的?

答案就是CUDA核心的FP32翻倍,但翻倍的方式有點(diǎn)特殊,每個(gè)SM單元中有4個(gè)分區(qū),每個(gè)分區(qū)除了第三代Tensor Core核心之外,還有一組是16個(gè)FP32單元及16個(gè)FP32、16個(gè)IN32組成的單元,后者可以同時(shí)執(zhí)行FP32或者INT32運(yùn)算。

16個(gè)FP32單元每周期可執(zhí)行16個(gè)FP32運(yùn)算,混合的那個(gè)單元可以執(zhí)行32個(gè)FP32或者16個(gè)FP32+16個(gè)INT32。

如此一來,每個(gè)SM單元可以同時(shí)執(zhí)行4x(16FP32+16FP32)=128個(gè)FP32運(yùn)算,或者4x(16FP32+16INT32)=64個(gè)FP32+64個(gè)INT32運(yùn)算。

只算FP32浮點(diǎn)的話,那么就是浮點(diǎn)翻倍了,因?yàn)閳D靈以及GA100都是每周期64個(gè)FP32浮點(diǎn)而已,現(xiàn)在可以做128個(gè)FP32運(yùn)算了。

提升FP32性能不論對游戲還是運(yùn)算都大有裨益,但也需要配套的提升,GA102的L1容量提升了33%,L1帶寬從116GB/s翻倍到219GB/s,共享內(nèi)存的性能也從每周期64B翻倍到128B。

審核編輯:符乾江


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • IC設(shè)計(jì)
    +關(guān)注

    關(guān)注

    37

    文章

    1290

    瀏覽量

    103699
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4862

    瀏覽量

    102722
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4678

    瀏覽量

    128612
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

    NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件免費(fèi)提供,不要求使用者具備 AI 框架和開發(fā)
    的頭像 發(fā)表于 09-06 14:45 ?375次閱讀

    《黑神話:悟空》潮流來了!Nvidia GPU 合作伙伴推出八款全新 RTX 40 Super 顯卡

    ABSTRACT摘要Nvidia合作伙伴推出了八款采用“黑神話:悟空”品牌的全新RTX40Super顯卡。包括技嘉、MSI和Zotac在內(nèi)的AIB正在慶祝這款受中國神話影響的動作角色扮演游戲的發(fā)布
    的頭像 發(fā)表于 08-30 12:50 ?268次閱讀
    《黑神話:悟空》潮流來了!<b class='flag-5'>Nvidia</b> GPU 合作伙伴推出八款全新 <b class='flag-5'>RTX</b> 40 Super 顯卡

    新款Nvidia Titan GPU正在開發(fā)中?或?qū)魯∥窗l(fā)布的RTX 5090

    ABSTRACT摘要最近有消息透露,NVIDIA正在開發(fā)一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列
    的頭像 發(fā)表于 07-26 08:26 ?407次閱讀
    新款<b class='flag-5'>Nvidia</b> Titan GPU正在開發(fā)中?或?qū)魯∥窗l(fā)布的<b class='flag-5'>RTX</b> 5090

    Nvidia 再推出特供版顯卡 GeForce RTX 5090D

    ABSTRACT摘要NVIDIA正在準(zhǔn)備另一款“D”版本RTX5090D,這將成為國內(nèi)市場的旗艦GeForceRTX50系列顯卡。JAEALOT2024年7月4日NVIDIA正在準(zhǔn)備另
    的頭像 發(fā)表于 07-19 08:26 ?473次閱讀
    <b class='flag-5'>Nvidia</b> 再推出特供版顯卡 GeForce <b class='flag-5'>RTX</b> 5090D

    NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

    NVIDIA 宣布推出全新 NVIDIA RTX?技術(shù),用于支持在全新 GeForce RTX AI 筆記本電腦上運(yùn)行的 AI 助手及數(shù)字人。 ?
    的頭像 發(fā)表于 06-04 10:19 ?674次閱讀

    RTX 5880 Ada Generation GPU與RTX? A6000 GPU對比

    NVIDIA RTX? 5880 Ada Generation GPU 是目前國內(nèi)重量級 GPU,基于全新 NVIDIA Ada Lovelace 架構(gòu)構(gòu)建,采用 4nm 制成工藝,擁
    的頭像 發(fā)表于 04-19 10:20 ?1543次閱讀
    <b class='flag-5'>RTX</b> 5880 Ada Generation GPU與<b class='flag-5'>RTX</b>? A6000 GPU對比

    NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

    NVIDIA今天發(fā)布了兩款新的專業(yè)顯卡RTX A1000、RTX A400,從編號就能看出來定位入門級,而且架構(gòu)并非最新的Ada Lovelace,還是上一代的Ampere。
    的頭像 發(fā)表于 04-18 11:35 ?1899次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布兩款新的專業(yè)顯卡<b class='flag-5'>RTX</b> A1000、<b class='flag-5'>RTX</b> A400

    英偉達(dá)發(fā)布兩款A(yù)mpere架構(gòu)專業(yè)可視化GPU:RTX A400與RTX A10

    RTX A400和RTX A1000旨在替代2021年發(fā)布的T1000和T400,以及T600,成為英偉達(dá)最后三款未納入NVIDIA RTX命名體系的專業(yè)可視化GPU產(chǎn)品。
    的頭像 發(fā)表于 04-17 16:27 ?881次閱讀

    NVIDIA RTX 5090痛失512位顯存!

    NVIDIA有望在今年底或明年初發(fā)布下一代RTX 50系列顯卡,大概率首發(fā)配備新一代GDDR7顯存,但是顯存位寬和之前的說法不太一樣。
    的頭像 發(fā)表于 03-11 16:02 ?758次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> 5090痛失512位顯存!

    英偉達(dá)RTX 50系列顯卡將采用PCIe Gen 6 16-Pin供電技術(shù)

    據(jù)報(bào)道,在Moore‘s Law is Dead播客節(jié)目最新的一期中,主持人Tom透露了NVIDIA GeForce RTX 50系列顯卡將會配置為原生PCIe Gen 6 16 Pin電源接口。
    的頭像 發(fā)表于 02-19 14:16 ?1228次閱讀

    RTX 4070 Ti SUPER詳細(xì)評測

    2024年1月9日,NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070
    發(fā)表于 01-29 10:31 ?3577次閱讀
    <b class='flag-5'>RTX</b> 4070 Ti SUPER<b class='flag-5'>詳細(xì)</b>評測

    英偉達(dá)發(fā)布RTX 40 SUPER系列顯卡

    在剛剛結(jié)束的CES 2024上,GPU巨頭英偉達(dá)正式推出了全新的RTX 40 SUPER系列顯卡,包括RTX 4080 SUPER、RTX 4070 Ti SUPER和
    的頭像 發(fā)表于 01-22 16:09 ?847次閱讀

    NVIDIA發(fā)布中國定制版RTX 4090D

    剛剛,NVIDIA官網(wǎng)發(fā)布了針對中國市場定制的RTX 4090D——D就是傳說中的Dragon,對應(yīng)即將到來的中國龍年。
    的頭像 發(fā)表于 12-29 10:42 ?975次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布中國定制版<b class='flag-5'>RTX</b> 4090D

    NVIDIA GPU的核心架構(gòu)架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來了解一些相關(guān)的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時(shí)首先提出,從此 NVI
    發(fā)表于 11-21 09:40 ?1426次閱讀
    <b class='flag-5'>NVIDIA</b> GPU的核心<b class='flag-5'>架構(gòu)</b>及<b class='flag-5'>架構(gòu)</b>演進(jìn)

    英偉達(dá)RTX 4090顯卡下架!中文官網(wǎng)已移除產(chǎn)品信息

    在提交原稿之前,nvidia官方網(wǎng)站只展示了5款rtx 40系列,但英文官方網(wǎng)站仍保留了rtx 4090。目前,在國內(nèi)電子商務(wù)交易平臺上,rtx
    的頭像 發(fā)表于 11-20 10:24 ?875次閱讀