欧美成人在线视频,久久国产综合视频,亚洲天堂2019女人天堂

在當(dāng)前的顯卡市場上，占據(jù)80％的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡，同時(shí)也讓高端游戲卡的價(jià)格高企，發(fā)燒顯卡至少五位數(shù)起。

在RTX 30系列顯卡發(fā)布之后，玩家的不滿似乎釋然了，相比當(dāng)前的圖靈顯卡，安培架構(gòu)的RTX 3090／3080／3070顯卡一下子變得真香了，因?yàn)樗鼈冃阅芊恫徽f，國內(nèi)價(jià)格反而下降了。

·GeForce RTX 3090：取代RTX Titan，相比于Titan RTX快了50％，性能是RTX 2080 Ti顯卡的2倍，配備24GB GDDR6X顯存，售價(jià)11999元，9月24日上市。

·GeForce RTX 3080：取代RTX 2080 Ti，相比于RTX 2080性能快2倍，搭配10GB GDDR6X顯存，海外699美元沒變，國內(nèi)從上代6499降至5499元，9月17日上市。

·GeForce RTX 3070：價(jià)格不到RTX 2080 Ti的一半，但是平均性能更高，同時(shí)比RTX 2070快足足60％，配備8GB GDDR6顯存，售價(jià)3899元，10月份上市。

RTX 30系列顯卡售價(jià)及上市時(shí)間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規(guī)格

從這個(gè)規(guī)格表中可以看出，與RTX 2080 Ti顯卡相比，RTX 3090的標(biāo)志性FP32性能從13．4T提升到了35．7T，翻倍還多，光追及AI加速提升也同樣明顯。

與圖靈顯卡相比，安培GPU的變化之大讓人驚訝，在過去十多年的顯卡升級換代中，性能翻倍的提升很少見到了，NVIDA是怎么做到的？

今天我們就來從詳細(xì)解讀一下安培GPU的架構(gòu)，探究它到底帶來了哪些技術(shù)升級以致于讓NVIDIA創(chuàng)始人黃仁勛稱之為有史以來性能提升最大的一次。

先從工藝說起：12nm干掉7nm之后 8nm如何再進(jìn)一步

對于半導(dǎo)體芯片來說，很關(guān)鍵的一部分是制程工藝，先進(jìn)的架構(gòu)也要通過工藝來實(shí)現(xiàn)，這是影響芯片能效、性能甚至成本的一大因素。

對NVIDIA來說，他們的Volta伏特、Turing圖靈兩代架構(gòu)都是臺積電12nm FFN工藝了，這是臺積電16nm工藝的改進(jìn)版，如果再算上16nm的Pascal架構(gòu)，實(shí)際上過去三代GPU都沒有重大工藝上的升級了。

在Ampere安培架構(gòu)上，NVIDIA終于升級工藝了，只不過這次有兩個(gè)意外——首先沒有選擇臺積電，其次沒有上7nm，而是三星定制的8nm工藝，雖然跟7nm看起來只差了1nm，但實(shí)際上是兩代工藝。

考慮到NVIDIA之前對工藝的表態(tài)，沒用7nm工藝而是三星8nm工藝又在意料之中，最關(guān)鍵的問題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的，至少有LPP和LPU兩個(gè)版本，前者適合移動SoC，后者適合高性能芯片，NVIDIA的定制大概是基于后者。

與臺積電的7nm工藝晶體管密度大約1億／mm2相比，8nm工藝大概是6000萬晶體管／mm2，但這是單一的SRAM芯片的對比，實(shí)際上GPU芯片比較復(fù)雜，差距會縮小很多。

根據(jù)是NVIDIA公布的信息，臺積電7nm工藝制造的安培A100核心是540億晶體管，核心面積826mm2，而三星8nm工藝制造的GA102核心是280億晶體管，核心面積官方?jīng)]公布，據(jù)悉是628mm2，也是大核心了。

這么算下來，7nm A100核心的晶體管密度6560萬晶體管／mm2，而三星8nm的GA102核心也有4460萬晶體管／mm2——差距仍在，但似乎可以接受了。

三星8nm工藝的晶圓代工價(jià)格還是秘密，但是不論技術(shù)還是商業(yè)策略上，三星都會比臺積電便宜很多，預(yù)計(jì)代工價(jià)格能差30％或者更高，所以這也是RTX 30系列顯卡能夠不漲價(jià)甚至降價(jià)的關(guān)鍵。

那三星8nm工藝帶來了多大的性能及能效提升呢？首先大家可以看到RTX 30系列顯卡的頻率提升了，從RTX 20系列的1．5GHz＋提升到了1．7GHz＋，升級工藝還是有性能提升的。

不過RTX 20系列的加速頻率實(shí)際可以達(dá)到1．9GHz甚至接近2GHz，RTX 30系列預(yù)計(jì)也就這個(gè)水平。

但是能效還是有提升的，NVIDIA官方稱在60fps性能下，圖靈顯卡的功耗大約有240W，安培顯卡則是120W多點(diǎn)，算下來是1．9倍能效，提升了90％，同時(shí)溫度還低了3度，噪音減少2分貝。

總的來說，在工藝這方面大家對安培GPU有驚喜有失望，失望的是沒有上預(yù)期中的7nm工藝（不管臺積電還是三星），工藝依然升級到了8nm。

但是NVIDIA工藝雖然并不算激進(jìn)，但性能、能效進(jìn)步還是挺大的，安培顯卡各方面指標(biāo)都是大幅勝過現(xiàn)在的圖靈卡，而且價(jià)格做到了不升反降，這也是不追求激進(jìn)工藝的好處，反正之前12nm都能贏，現(xiàn)在上8nm更加穩(wěn)妥了。

安培GPU架構(gòu)詳解之：FP32單元翻倍 CUDA核心改了什么？

發(fā)布安培的時(shí)候，NVIDIA CEO黃仁勛表示這是GPU有史以來最大的性能飛躍，而2018年推出圖靈GPU時(shí)，老黃也是類似的說詞——GPU有史以來最大的變革，這兩個(gè)評價(jià)其實(shí)也沒錯(cuò)。

圖靈GPU架構(gòu)有很多第一次，首次支持RTX Core（光追加速單元），首次支持Tensor Core，同時(shí)還改進(jìn)了CUDA內(nèi)核，不過前兩個(gè)是重點(diǎn)。

在安培GPU上，RT Core、Tensor Core當(dāng)然繼續(xù)加強(qiáng)，不過最主要的亮點(diǎn)是CUDA架構(gòu)的改進(jìn)，性能翻倍的根源就在這里，我們先來看看這方面的變化。

GA102核心架構(gòu)示意圖

GA102核心總計(jì)7組GPC單元，每組有12組SM單元，總計(jì)84組，RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同，RTX 3090是82組，RTX 3080是68組，RTX 3070是46組。

在之前的GA100大核心中，每組SM是64個(gè)INT32單元、64個(gè)FP32單元及32個(gè)FP64單元組成的，但在GA102核心中，F(xiàn)P64單元大幅減少，增加了RT Core，Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走，安培GPU的SM單元增加的并不多，但實(shí)際上FP32性能翻倍了還多，算上頻率，RTX 3080的理論性能差不多是RTX 2080的三倍了，這是怎么做到的？

答案就是CUDA核心的FP32翻倍，但翻倍的方式有點(diǎn)特殊，每個(gè)SM單元中有4個(gè)分區(qū)，每個(gè)分區(qū)除了第三代Tensor Core核心之外，還有一組是16個(gè)FP32單元及16個(gè)FP32、16個(gè)IN32組成的單元，后者可以同時(shí)執(zhí)行FP32或者INT32運(yùn)算。

16個(gè)FP32單元每周期可執(zhí)行16個(gè)FP32運(yùn)算，混合的那個(gè)單元可以執(zhí)行32個(gè)FP32或者16個(gè)FP32＋16個(gè)INT32。

如此一來，每個(gè)SM單元可以同時(shí)執(zhí)行4x（16FP32＋16FP32）＝128個(gè)FP32運(yùn)算，或者4x（16FP32＋16INT32）＝64個(gè)FP32＋64個(gè)INT32運(yùn)算。

只算FP32浮點(diǎn)的話，那么就是浮點(diǎn)翻倍了，因?yàn)閳D靈以及GA100都是每周期64個(gè)FP32浮點(diǎn)而已，現(xiàn)在可以做128個(gè)FP32運(yùn)算了。

提升FP32性能不論對游戲還是運(yùn)算都大有裨益，但也需要配套的提升，GA102的L1容量提升了33％，L1帶寬從116GB／s翻倍到219GB／s，共享內(nèi)存的性能也從每周期64B翻倍到128B。

審核編輯：符乾江

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

IC設(shè)計(jì)

IC設(shè)計(jì)

+關(guān)注

關(guān)注
37

文章
1290

瀏覽量
103699
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4862

瀏覽量
102722
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4678

瀏覽量
128612

NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件，這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件免費(fèi)提供，不要求使用者具備 AI 框架和開發(fā)

發(fā)表于 09-06 14:45 ?375次閱讀

《黑神話：悟空》潮流來了！Nvidia GPU 合作伙伴推出八款全新 RTX 40 Super 顯卡

ABSTRACT摘要Nvidia合作伙伴推出了八款采用“黑神話：悟空”品牌的全新RTX40Super顯卡。包括技嘉、MSI和Zotac在內(nèi)的AIB正在慶祝這款受中國神話影響的動作角色扮演游戲的發(fā)布

發(fā)表于 08-30 12:50 ?268次閱讀

《黑神話：悟空》潮流來了！<b class='flag-5'>Nvidia</b> GPU 合作伙伴推出八款全新 <b class='flag-5'>RTX</b> 40 Super 顯卡

新款Nvidia Titan GPU正在開發(fā)中？或?qū)魯∥窗l(fā)布的RTX 5090

ABSTRACT摘要最近有消息透露，NVIDIA正在開發(fā)一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列

發(fā)表于 07-26 08:26 ?407次閱讀

新款<b class='flag-5'>Nvidia</b> Titan GPU正在開發(fā)中？或?qū)魯∥窗l(fā)布的<b class='flag-5'>RTX</b> 5090

Nvidia 再推出特供版顯卡 GeForce RTX 5090D

ABSTRACT摘要NVIDIA正在準(zhǔn)備另一款“D”版本RTX5090D，這將成為國內(nèi)市場的旗艦GeForceRTX50系列顯卡。JAEALOT2024年7月4日NVIDIA正在準(zhǔn)備另

發(fā)表于 07-19 08:26 ?473次閱讀

<b class='flag-5'>Nvidia</b> 再推出特供版顯卡 GeForce <b class='flag-5'>RTX</b> 5090D

NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

NVIDIA 宣布推出全新 NVIDIA RTX?技術(shù)，用于支持在全新 GeForce RTX AI 筆記本電腦上運(yùn)行的 AI 助手及數(shù)字人。 ?

發(fā)表于 06-04 10:19 ?674次閱讀

RTX 5880 Ada Generation GPU與RTX? A6000 GPU對比

NVIDIA RTX? 5880 Ada Generation GPU 是目前國內(nèi)重量級 GPU，基于全新 NVIDIA Ada Lovelace 架構(gòu)構(gòu)建，采用 4nm 制成工藝，擁

發(fā)表于 04-19 10:20 ?1543次閱讀

NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

NVIDIA今天發(fā)布了兩款新的專業(yè)顯卡RTX A1000、RTX A400，從編號就能看出來定位入門級，而且架構(gòu)并非最新的Ada Lovelace，還是上一代的Ampere。

發(fā)表于 04-18 11:35 ?1899次閱讀

英偉達(dá)發(fā)布兩款A(yù)mpere架構(gòu)專業(yè)可視化GPU：RTX A400與RTX A10

RTX A400和RTX A1000旨在替代2021年發(fā)布的T1000和T400，以及T600，成為英偉達(dá)最后三款未納入NVIDIA RTX命名體系的專業(yè)可視化GPU產(chǎn)品。

發(fā)表于 04-17 16:27 ?881次閱讀

NVIDIA RTX 5090痛失512位顯存！

NVIDIA有望在今年底或明年初發(fā)布下一代RTX 50系列顯卡，大概率首發(fā)配備新一代GDDR7顯存，但是顯存位寬和之前的說法不太一樣。

發(fā)表于 03-11 16:02 ?758次閱讀

英偉達(dá)RTX 50系列顯卡將采用PCIe Gen 6 16-Pin供電技術(shù)

據(jù)報(bào)道，在Moore‘s Law is Dead播客節(jié)目最新的一期中，主持人Tom透露了NVIDIA GeForce RTX 50系列顯卡將會配置為原生PCIe Gen 6 16 Pin電源接口。

發(fā)表于 02-19 14:16 ?1228次閱讀

RTX 4070 Ti SUPER詳細(xì)評測

2024年1月9日，NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡，包括RTX 4070 SUPER、RTX 4070

發(fā)表于 01-29 10:31 ?3577次閱讀

英偉達(dá)發(fā)布RTX 40 SUPER系列顯卡

在剛剛結(jié)束的CES 2024上，GPU巨頭英偉達(dá)正式推出了全新的RTX 40 SUPER系列顯卡，包括RTX 4080 SUPER、RTX 4070 Ti SUPER和

發(fā)表于 01-22 16:09 ?847次閱讀

NVIDIA發(fā)布中國定制版RTX 4090D

剛剛，NVIDIA官網(wǎng)發(fā)布了針對中國市場定制的RTX 4090D——D就是傳說中的Dragon，對應(yīng)即將到來的中國龍年。

發(fā)表于 12-29 10:42 ?975次閱讀

NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

在探討 NVIDIA GPU 架構(gòu)之前，我們先來了解一些相關(guān)的基本知識。GPU 的概念，是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時(shí)首先提出，從此 NVI

發(fā)表于 11-21 09:40 ?1426次閱讀

英偉達(dá)RTX 4090顯卡下架！中文官網(wǎng)已移除產(chǎn)品信息

在提交原稿之前，nvidia官方網(wǎng)站只展示了5款rtx 40系列，但英文官方網(wǎng)站仍保留了rtx 4090。目前，在國內(nèi)電子商務(wù)交易平臺上，rtx

發(fā)表于 11-20 10:24 ?875次閱讀