電子發(fā)燒友網(wǎng)>新科技>數(shù)碼科技> > 正文

NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

yingujun? 2017年05月11日 20:39 ? 次閱讀

  NVIDIA這幾年壟斷了高端顯卡市場,從他們的Q1季度財報中雖然也能看到Tegra、數(shù)據(jù)中心等業(yè)務有了明顯增長,不過營收的主力還是游戲PC市場,Q1季度游戲PC市場營收就增長了50%,高端玩家現(xiàn)在買游戲顯卡往往是從GTX 1080 Ti/1080/1070中選一款了。如今Pascal還未顯出頹勢,今天凌晨的GTC 2017主題演講上,NVIDIA CEO黃仁勛發(fā)布了Volta架構顯卡,新一輪升級又要來了。

  

  NVIDIA能夠獲得現(xiàn)在的表現(xiàn)很大程度是因為他們的產(chǎn)品路線圖比較連貫,從Kepler到Maxwell,再到現(xiàn)在的Pascal架構,NVIDIA每一代GPU升級都很穩(wěn)定,短時間內(nèi)就能完成高端到低端的布局。以Pascal這一代為例,首發(fā)的是GTX 1080、GTX 1070,接著是Titan X,陸陸續(xù)續(xù)又有GTX 1060 6GB及GTX 1060 3GB,還有GTX 1050 Ti、GTX 1050,今年3月份又有GTX 1080 Ti、Titan Xp,馬上還會有GT 1030主打入門級市場——不算不知道,NVIDIA在Pascal這一代的GPU產(chǎn)品組合還真是挺多的。

  Pascal顯卡發(fā)布一年整了,產(chǎn)品線布局還在完善,不過大家的興趣點現(xiàn)在已經(jīng)開始向新一代GPU轉移了,特別是今天發(fā)布了Volta架構顯卡——Telsa V100,這跟去年Pascal架構首發(fā)GP100核心的Telsa P100一樣,也在去年這個時候,我們撰文詳細介紹了GP100核心的改進情況,今天我們也會針對GV100核心及Tesla V100顯卡做更深入的探討。

  早上已經(jīng)有Tesla P100的新聞發(fā)布了,大家也了解過基本情況了,我們先來看看Tesla V100加速卡的真身,這次同時展示的是兩個版本的。

  Tesla V100顯卡真身:NVLink與PCI-E版大不同

  

  NVLink 2接口的Tesla V100顯卡

  老黃手里曝光最多的就是這個短小強悍的Tesla V100,它實際上NVLink版的,跟去年的Tesla P100看著很像,畢竟這二者都使用了HBM 2顯存,功耗也沒有明顯增加,應該是直接沿用相同的PCB電路。

  

  PCI-E接口的Tesla V100顯卡

  PCI-E版的Tesla V100顯卡不太引人注意,找到了上面這張照片,如果跟去年PCI-E版的Tesla P100顯卡對比,可以看出PCI-E版Tesla V100顯卡跟PCI-E版P100有很多不同,散熱器明顯小多了,體積跟NVLink版差不多。

  

  這是去年的PCI-E版Tesla P100加速卡

  Telsa V100加速卡規(guī)格:Volta架構終于來了

  Tesla V100是針對HPC市場設計的,跟普通消費者沒啥關系(屬于吃瓜群眾買不到買不起系列),之所以引人關注是因為它使用的是新一代Volta架構,首發(fā)的依然是GV100這種大核心。早上的新聞中大家也看到了它各方面規(guī)格都很驚人——815mm2核心面積、211億晶體管、5120個CUDA核心、15TFLOPS浮點性能等等,放在當前的顯卡中簡直是鶴立雞群,拿來跑游戲不知道多爽,可惜老黃不賣給消費級玩家。

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  NVIDIA Volta/Pascal與AMD Vega顯卡的規(guī)格對比

  為此我做了一個詳細的規(guī)格表,對比的產(chǎn)品除了目前的Tesla P100和Titan Xp之外,還加入了AMD的Vega 10核心的Radeon Instinct MI25顯卡,盡管還沒上市,但AMD早前公布過這款顯卡的一些信息,比如帶寬、浮點性能,不過Vega核心的晶體管、核心面積等關鍵參數(shù)還是個謎。

  對比GP100核心與GV100核心,可以看出后者規(guī)模進一步擴大,SM單元數(shù)量從之前的56組提升到了80組,CUDA核心數(shù)從3584個提升到5120個,計算單元數(shù)量增幅為43%。顯存位寬及容量都沒變化,還是16GB HBM2顯存,不過頻率有所提升,帶寬從前代的720GB/s提升到了900GB/s,非常接近HBM 2顯存理論上1024GB/s的帶寬了(搭配4顆HBM顯存的情況下)。

  計算單元的增加也使GV100核心的規(guī)模進一步擴大——晶體管數(shù)量從目前的153億增加到了211億,核心面積從610mm2提升到815mm2,一舉創(chuàng)造了NVIDIA GPU同時也是現(xiàn)代GPU的核心面積新紀錄。NVIDIA這幾代大核心雖然核心面積有漲有降,不過之前最多是在600mm2級別徘徊,這一次直接做了815mm2的大核心。

  與Pascal架構GP100核心相比,Volta的GV100核心在架構上更多地是量變而非質(zhì)變,不過它在架構也不是說沒升級,這次GV100核心主要的變化就是針對AI人工智能、DL深度學習等新興領域?qū)iT做了運算單元,我們下面再說這個。

  Volta架構改進:Pascal翻新,新增Tensor單元

  在之前解析GTX 1080與Tesla P100時,我們說過主流的GP104核心跟GP100核心是不同的,前者跟Maxwell架構沒多大變化,每組SM單元是128個CUDA核心,GP100上每組SM單元是64個CUDA核心,而后面的GP102核心跟GP100也不同,更像是GP104核心的擴大版,也是每組SM單元128個CUDA核心。

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  GP100核心架構示意圖

  回到GP100與GV100大核心上,他們的架構也是漸進式變化,也是6組GPC計算單元,不過GP100核心每個GPC單元中是10組SM單元,每個SM單元有64個CUDA核心,而GV100大核心中每組GPC單元是14個SM單元,總數(shù)應該是84組SM單元,但是現(xiàn)在Tesla V100跟Tesla V100一樣都不是完全體,前者啟用了56組SM單元,后者啟用了80組SM單元,總計80x64=5120個CUDA核心。

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  GV100核心架構示意圖

  以上算的是典型的FP32單精度運算單元,除此之外還有FP64單元,GV100依然延續(xù)了GP100中FP32:FP64=2:1的比例,每個SM單元中有32個FP64單元,理論上有2688個FP64單元,實際啟用的是2560個。

  NVIDIA這兩年在深度計算、人工智能等領域投入很多精力,GPU架構也在傳統(tǒng)HPC應用之外開始適應這些新興領域,他們對運算精度要求沒這么高,但對性能要求很高,Pascal顯卡中就開始支持FP16、FP8精度運算,執(zhí)行這些運算的性能也是翻倍增長。

  因此在GV100大核心,NVIDIA還加入了專門的Tensor(張量)運算單元,大部分人估計不熟悉這個詞,不過還記得前不久Google搞的那個TPU在AI性能上吊打GPU的新聞嗎?Google的TPU處理器中的T也是Tensor這個詞,大家可以把它當作專用的AI運算單元來看。

  

  GV100核心中增加了專門的Tensor運算單元

  在GV100大核心中,每組SM單元中還有8個Tensor單元,這樣整個SM單元中就是FP32:FP64:Tensor=64:32:8的比例存在,GV100也因此有了Tensor計算能力這個指標,Tesla P100的Tensor計算能力高達120TFLOPS,NVIDIA宣稱它的Tensor性能是Pascal架構的12倍。

  Volta支持第二代NVLink技術:300GB/s帶寬

  除了針對AI等新興領域改進了Tensor單元之外,GV100核心在總線技術上也有升級,這次使用的是NVLink 2,如果你注意看了上面的架構示意圖,應該可以發(fā)現(xiàn)GV100核心是6組NVLink通道,雙向總帶寬可達300GB/s。

  相比之下,GP100核心上是4組NVLink通道,每個通道帶寬是40GB/s,總帶寬是160GB/s。

  不論NVLink還是NVLink 2總線,相比PCI-E 3.0 x16雙向32GB/s的帶寬都有明顯提升,不過NVLkink并不是通用技術,主要用于IBM和NVIDIA開發(fā)的超算平臺,這次GV100核心就會用在雙方合作的Summit超算上,預計今年下半年正式啟用。

  Volta工藝升級:這個12nm有點特別

  NVIDIA在主題演講中還提到了Volta顯卡的制造工藝,使用的是TSMC的12nm FFN工藝,聽上去要比目前TSMC 16nm工藝更先進,那這種新工藝對Volta顯卡到底有什么改善嗎?我們依照上次的計算簡單評估下不同工藝下的晶體管密度及效能。

  由于AMD Vega顯卡的核心面積、晶體管數(shù)量都是未知數(shù),所以這里只對比了NVIDIA幾代顯卡的。

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  GV100核心是12nm工藝,211億晶體管,核心面積815mm2,算下來晶體管密度是每平方毫米25.9百萬晶體管,與16nm工藝的晶體管密度差不多。實際上,TSMC的12nm工藝也是16nm工藝的改良版。根據(jù)TSMC此前公布的資料,它實際是基于16nm FFC工藝改進的,性能是后者的1.1倍,功耗只有后者的70%,核心面積則可以縮小20%。

  按照TSMC的說法,16nm FinFET Plus依然是他們性能最好的16nm工藝,現(xiàn)在GV100用的12nm工藝在性能上還真不一定能超過16nm FinFET Plus工藝,Tesla V100的加速頻率就比P100要低一些,但從核心面積來看,計算單元規(guī)模增加了43%,核心面積只增加了33%,說明這個12nm工藝對縮小面積還是挺管用的。

  至于未來的消費級顯卡,GV102、GV104核心上12nm工藝也沒跑了,但顯卡的核心頻率不會再像Pascal對比Maxwell時代那樣大幅提升了,性能提升只能靠計算單元數(shù)量增加了。

  Volta架構性能:比Pascal提升50%

  說到性能,我們再簡單看下NVIDIA官方資料中介紹的GV100性能提升情況:

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  DL深度計算性能三倍快,這個因為有Tensor單元加持,性能暴漲很正常

  NVIDIA這暴脾氣!全新顯卡架構Volta解析 性能暴增50%

  HPC性能提升情況

  與Tesla P100加速卡相比,Tesla V100在不同HPC應用中性能提升有所不同,多的能超過70%,少的也有40%以上,官方給出的平均性能提升大約是50%——考慮到計算單元增幅也有43%,性能提升基本上與計算單元數(shù)量增幅呈正比,這跟Tesla P100時代頻率大幅提升帶來性能大提升的情況也有所不同。

  總結:

  GV100核心是為HPC運算市場而生的,跟Tesla P100的GP100核心一樣也不會用于消費級市場,所以這篇文章對我們的意義更多地是分析未來的GV102、GV104核心的GeForce 20系列顯卡的性能及表現(xiàn)。

  與GV100一樣,GV102/104核心的CUDA核心數(shù)量也會進一步提升,NVIDIA還可以通過閹割對消費級市場沒什么用的FP64、Tensor單元來降低核心面積及成本,一如GP100到GP102那樣。

  Volta架構使用的12nm工藝在降低核心面積上很有用,但是從GV100上的頻率來看,12nm下消費級Volta顯卡的核心頻率恐怕也很難有明顯提升了,現(xiàn)在的GTX 10系中高端非公版顯卡核心頻率都能達到2GHz左右,未來的12nm Volta顯卡估計也就是這個水平,甚至還有可能更低一些。

  如果是這種情況,NVIDIA要想提高新一代顯卡的性能,那么就只能從CUDA核心數(shù)量上著手了,Pascal這一代在頻率上占了很多紅利,Volta又要回到GPU運算單元提升的道路上了。

  目前消費級的Volta顯卡還沒有明確的發(fā)布時間,今年底有希望推出部分高端產(chǎn)品,不過更有可能的還是2018年Q1季度,所以現(xiàn)在的Pascal顯卡并不會受到什么沖擊,大家現(xiàn)在該買什么卡就買什么卡,不著急的也可以等等AMD發(fā)了Vega顯卡之后再看。不過NVIDIA看起來并不擔心AMD的競爭,黃仁勛在之前的財報會議上表態(tài)2017年的市場競爭態(tài)勢不會有什么變化,換言之就是AMD發(fā)布的Polaris 20及Vega 10顯卡對他對不會有什么影響。

下載發(fā)燒友APP

打造屬于您的人脈電子圈

關注電子發(fā)燒友微信

有趣有料的資訊及技術干貨

關注發(fā)燒友課堂

鎖定最新課程活動及技術直播

電子發(fā)燒友觀察

一線報道 · 深度觀察 · 最新資訊
收藏 人收藏
分享:

評論

相關推薦

Blackwell GB100能否在超級計算機和...

NVIDIA 下一代 Blackwell GB100 傳將采用芯片堆棧設計提升效能和效率,但也面臨工....
發(fā)表于 2023-10-24 17:43? 219次閱讀
Blackwell GB100能否在超級計算機和...

奧比中光3D相機矩陣助力更強機器人開發(fā)

近日,奧比中光將視覺生態(tài)產(chǎn)品矩陣集成到新版本NVIDIA Isaac Sim平臺,助力全球超過百萬名....
發(fā)表于 2023-10-24 11:38? 196次閱讀
奧比中光3D相機矩陣助力更強機器人開發(fā)

2023 NVIDIA 初創(chuàng)企業(yè)展示 · 半程展...

10 月 19 日 – 10 月 20 日,由 NVIDIA 主辦的 NVIDIA 初創(chuàng)企業(yè)展示 ·....
發(fā)表于 2023-10-24 11:26? 42次閱讀
2023 NVIDIA 初創(chuàng)企業(yè)展示 · 半程展...

Nvidia 通過開源庫提升 LLM 推理性能

加利福尼亞州圣克拉拉——Nvidia通過一個名為TensorRT LLM的新開源軟件庫,將其H100....
發(fā)表于 2023-10-23 16:10? 64次閱讀
Nvidia 通過開源庫提升 LLM 推理性能

GPU是否有替代方案?

通常,HPC 位于其自己的孤島中,然后您可以在另一個正在開發(fā)的孤島中使用快速增長的 GenAI 和類....
發(fā)表于 2023-10-23 15:37? 163次閱讀
GPU是否有替代方案?

基于PyTorch的模型并行分布式訓練Megat...

NVIDIA Megatron 是一個基于 PyTorch 的分布式訓練框架,用來訓練超大Trans....
發(fā)表于 2023-10-23 11:01? 70次閱讀
基于PyTorch的模型并行分布式訓練Megat...

大型科技公司CEO支持率排名:英偉達最高,西部數(shù)...

人力管理是決定最高經(jīng)營者人氣的核心要素。doug mcmillon和tim cook這樣的領導避免了....
發(fā)表于 2023-10-23 10:01? 201次閱讀
大型科技公司CEO支持率排名:英偉達最高,西部數(shù)...

澎湃算力驅(qū)動智能機器人研發(fā)創(chuàng)新 機器人應用場景走...

本屆亞運會上,中國機器人“遍地開花”,廣泛應用于各個領域。這其中,清潔行業(yè)的機器人應用是一個不容忽視....
發(fā)表于 2023-10-22 10:17? 48次閱讀
澎湃算力驅(qū)動智能機器人研發(fā)創(chuàng)新 機器人應用場景走...

NVIDIA發(fā)布首部DPU和DOCA編程入門書籍

NVIDIA DOCA 是一個為 NVIDIA BlueField 系列 DPU 量身定做的軟件開發(fā)....
發(fā)表于 2023-10-20 15:45? 108次閱讀
NVIDIA發(fā)布首部DPU和DOCA編程入門書籍

4090顯卡全面下架 AI芯片出口管制趨嚴

4090顯卡全面下架 AI芯片出口管制趨嚴 英偉達民用消費級的高端顯卡4090在各個網(wǎng)上店鋪都顯示無....
發(fā)表于 2023-10-19 17:24? 879次閱讀
4090顯卡全面下架 AI芯片出口管制趨嚴

FSR3性能畫質(zhì)雙超DLSS3!AMD RX 6...

RX 6750 GRE 12GB原生擁有40組計算單元(2560個流處理器)、40個光追單元,加速頻....
發(fā)表于 2023-10-18 15:27? 425次閱讀
FSR3性能畫質(zhì)雙超DLSS3!AMD RX 6...

國產(chǎn)主板中顯卡的關鍵作用與不同類型電腦主板全面解...

電腦顯卡是計算機中用于處理圖形和圖像的重要組件,也被稱為圖形處理器(Graphics Process....
發(fā)表于 2023-10-18 14:05? 55次閱讀
國產(chǎn)主板中顯卡的關鍵作用與不同類型電腦主板全面解...

NVIDIA 發(fā)布首部 DPU 和 DOCA 編...

為使用NVIDIA? BlueField? 系列? DPU 和 NVIDIA DOCA? 開發(fā)環(huán)境的....
發(fā)表于 2023-10-18 11:34? 63次閱讀
NVIDIA 發(fā)布首部 DPU 和 DOCA 編...

酷睿i7-14700K處理器性能測試分析

綜合以上測試,我們認為酷睿i7-14700K顯然是近兩年來性能提升幅度最大的酷睿i7處理器,它不僅是....
發(fā)表于 2023-10-18 11:07? 115次閱讀
酷睿i7-14700K處理器性能測試分析

AMD Radeon RX 6750 GRE顯卡...

AMD Infinity Cache無限緩存—?GPU芯片上集成了高達96 MB的末級數(shù)據(jù)緩存,可減....
發(fā)表于 2023-10-18 10:36? 65次閱讀
AMD Radeon RX 6750 GRE顯卡...

RTX 3080公版高溫超100℃:一看散熱器破...

最近,韓國媒體QuasarZon發(fā)現(xiàn),RTX 3080公版卡、RTX A6000工作站顯卡也存在異常....
發(fā)表于 2023-10-17 16:09? 115次閱讀
RTX 3080公版高溫超100℃:一看散熱器破...

Cadence推出新版Cadence Alleg...

新版Allegro與OrCAD使用多階段預發(fā)布的方式確保內(nèi)容與質(zhì)量能夠符合客戶的需要。來自北美、歐洲....
發(fā)表于 2023-10-17 14:55? 59次閱讀
Cadence推出新版Cadence Alleg...

2023年GPU顯卡詞條報告

顯卡的下游應用市場包括游戲、專業(yè)可視化、數(shù)據(jù)中心、汽車四大類,隨著游戲設備、消費電子、人工智能、邊緣....
發(fā)表于 2023-10-16 15:38? 493次閱讀
2023年GPU顯卡詞條報告

大模型AI芯片 群雄逐鹿,誰主沉浮?英偉達NVI...

隨著人工智能、大數(shù)據(jù)、高性能計算、生成式AI和大語言模型的快速發(fā)展,芯片技術和服務器市場變得越來越重....
發(fā)表于 2023-10-13 16:26? 179次閱讀
大模型AI芯片 群雄逐鹿,誰主沉?。坑ミ_NVI...

英特爾銳炫Arc A580 8GB顯卡發(fā)售:24...

英特爾表示:“這個產(chǎn)品次數(shù)的高畫質(zhì),最近受歡迎的游戲提供出色的性能、游戲游戲上的高幀率,提供經(jīng)驗,全....
發(fā)表于 2023-10-12 09:42? 173次閱讀
英特爾銳炫Arc A580 8GB顯卡發(fā)售:24...

英特爾銳炫A580顯卡發(fā)布,全面媒體功能助力創(chuàng)作...

英特爾銳炫 A580 GPU將于10月10日起通過生態(tài)合作伙伴面市。 全新發(fā)布:英特爾今日宣布英特爾....
發(fā)表于 2023-10-11 11:23? 148次閱讀
英特爾銳炫A580顯卡發(fā)布,全面媒體功能助力創(chuàng)作...

集特智能推出國產(chǎn)GPU顯卡JH920,性能堪比G...

該顯卡與nvista gtx 1050兼容,支持opengl 4.0、bulkan 1.1、open....
發(fā)表于 2023-10-10 09:46? 415次閱讀
集特智能推出國產(chǎn)GPU顯卡JH920,性能堪比G...

聯(lián)合創(chuàng)新,芯瞳攜手旌宇打造國產(chǎn)化首個多屏顯卡產(chǎn)品...

9月28日,國產(chǎn)自主研發(fā)GPU芯片設計翹楚芯瞳(Sietium)與知名的顯卡老廠牌-旌宇共同宣布,雙....
發(fā)表于 2023-09-28 15:35? 371次閱讀
聯(lián)合創(chuàng)新,芯瞳攜手旌宇打造國產(chǎn)化首個多屏顯卡產(chǎn)品...

CUDA核心是什么?CUDA核心的工作原理

CUDA核心(Compute Unified Device Architecture Core)是N....
發(fā)表于 2023-09-27 09:38? 303次閱讀
CUDA核心是什么?CUDA核心的工作原理

中微電科技“自強攻堅戰(zhàn)-高性能自主安全顯卡”項目...

9月18日-19日,2023馬欄山集成電路應用創(chuàng)新論壇暨第五屆中國芯應用創(chuàng)新設計大賽在長沙舉行。深圳....
發(fā)表于 2023-09-26 17:50? 1596次閱讀
中微電科技“自強攻堅戰(zhàn)-高性能自主安全顯卡”項目...

GPGPU和NPU技術路線對比

FPGA是一種半定制芯片,對芯片硬件層可以靈活編譯。但是缺點也比較明顯,當處理的任務重復性不強、邏輯....
發(fā)表于 2023-09-26 14:20? 369次閱讀
GPGPU和NPU技術路線對比

12V-2x6接口和相應的數(shù)據(jù)線的優(yōu)勢分析

12V-2x6接口在外觀造型、物理尺寸上和12VHPWR幾乎完全一致,還是16個針腳,但是從機械結構....
發(fā)表于 2023-09-26 10:54? 227次閱讀
12V-2x6接口和相應的數(shù)據(jù)線的優(yōu)勢分析

NVIDIA登頂?shù)诙救蚯笆驣C設計公司營收

TrendForce集邦咨詢表示,AI刺激相關供應鏈備貨熱潮,除了激勵第二季全球前十大IC設計公司營....
發(fā)表于 2023-09-25 15:02? 162次閱讀
NVIDIA登頂?shù)诙救蚯笆驣C設計公司營收

加速產(chǎn)品開發(fā):運用 NVIDIA RTX 驅(qū)動 ...

NX Design 中的 GPU 加速繪圖運算工作流程可協(xié)助設計師和工程師以高仿真度處理大型復雜的 ....
發(fā)表于 2023-09-21 17:38? 465次閱讀
加速產(chǎn)品開發(fā):運用 NVIDIA RTX 驅(qū)動 ...

Infosys 與 NVIDIA 合作,助力全球...

兩家公司擴大合作,依托跨行業(yè)的生成式AI應用和解決方案提供提高生產(chǎn)力所需的專業(yè)知識與技術;全新卓越中....
發(fā)表于 2023-09-21 10:21? 89次閱讀
Infosys 與 NVIDIA 合作,助力全球...

北橋芯片和南橋芯片去哪里了?

北橋芯片(North Bridge)和南橋芯片(South Bridge)合稱就是主板的芯片組,是支....
發(fā)表于 2023-09-20 11:37? 243次閱讀
北橋芯片和南橋芯片去哪里了?

【比特熊充電棧】實戰(zhàn)演練構建LLM對話引擎

大模型時代,安全問題不容小覷。但如果把大模型比作孫悟空,那 NVIDIA NeMo Guardrai....
發(fā)表于 2023-09-19 13:40? 492次閱讀
【比特熊充電棧】實戰(zhàn)演練構建LLM對話引擎

十年等待終于到來,艾爾莎RTX4060幻雷者8G...

還記得十年前的時候,犯罪題材類的游戲是非常熱門的,比如大名鼎鼎的GTA5,還有《看門狗》、《熱血無賴....
發(fā)表于 2023-09-18 09:54? 141次閱讀
十年等待終于到來,艾爾莎RTX4060幻雷者8G...

如何解決GPU短缺和成本飆升問題?

越來越多的人工智能初創(chuàng)公司和服務導致對 A100 和 H100 等高端 GPU 的高需求,從而壓垮了....
發(fā)表于 2023-09-14 11:32? 586次閱讀
如何解決GPU短缺和成本飆升問題?

工控機配什么顯卡比較好

隨著科技的發(fā)展,工控機被廣泛應用于工業(yè)自動化、交通運輸、醫(yī)療設備等領域。工控機的性能與顯卡的搭配密切....
發(fā)表于 2023-09-14 11:22? 130次閱讀
工控機配什么顯卡比較好

摩爾線程攜手RealLink共同完成UE5在國產(chǎn)...

近期,摩爾線程攜手虛幻引擎技術解決方案廠商蕊霖(Real-Link),共同完成了UE5在國產(chǎn)顯卡上的....
發(fā)表于 2023-09-13 10:13? 475次閱讀
摩爾線程攜手RealLink共同完成UE5在國產(chǎn)...

NVIDIA Grace Hopper超級芯片橫...

從云端到網(wǎng)絡邊緣,NVIDIA GH200、H100和L4 GPU以及Jetson Orin模組在運....
發(fā)表于 2023-09-13 09:45? 79次閱讀
NVIDIA Grace Hopper超級芯片橫...

揭秘英偉達A100、A800、H100、H800...

摘要:本文主要介紹大模型的內(nèi)部運行原理、我國算力發(fā)展現(xiàn)狀。大模型指具有巨大參數(shù)量的深度學習模型,如G....
發(fā)表于 2023-09-09 11:15? 845次閱讀
揭秘英偉達A100、A800、H100、H800...

Faster Transformer v1.0源...

寫在前面:本文將對 Nvidia BERT 推理解決方案 Faster Transformer 源碼....
發(fā)表于 2023-09-08 10:20? 231次閱讀
Faster Transformer v1.0源...

看淡出口管制風險,AI芯片創(chuàng)企Blaize在阿聯(lián)...

據(jù)報道,blaize將創(chuàng)建一個支持完全可編程的blaize圖形流處理器的人工智能數(shù)據(jù)中心。這是因為美....
發(fā)表于 2023-09-07 14:46? 1159次閱讀
看淡出口管制風險,AI芯片創(chuàng)企Blaize在阿聯(lián)...

技嘉Radeon? RX 7800 XT和RX ...

技嘉科技,發(fā)布 Radeon RX 7800 XT GAMING OC 16G 與 Radeon R....
發(fā)表于 2023-09-07 11:30? 418次閱讀
技嘉Radeon? RX 7800 XT和RX ...

石英差分振蕩器應用解析YSO230LR 高可靠性...

YXC揚興科技的YSO230LR系列石英差分振蕩器是專為顯卡行業(yè)設計的創(chuàng)新產(chǎn)品。該系列石英差分振蕩器....
發(fā)表于 2023-09-05 16:48? 402次閱讀
石英差分振蕩器應用解析YSO230LR 高可靠性...

創(chuàng)企推Chiplet結構大算力芯片,稱性能大幅領...

公司方面表示,該引擎的內(nèi)存帶寬比nvidia的h100a100等高端的gpu大40倍。此外,d-ma....
發(fā)表于 2023-09-05 14:24? 311次閱讀
創(chuàng)企推Chiplet結構大算力芯片,稱性能大幅領...

生成式AI如何幫助創(chuàng)建和編輯逼真的材質(zhì)?

這項研究的演示現(xiàn)身 SIGGRAPH 展會 Real-Time Live 活動,展示了藝術家如何利用....
發(fā)表于 2023-09-01 15:36? 254次閱讀
生成式AI如何幫助創(chuàng)建和編輯逼真的材質(zhì)?

Intel AIGC體驗:酷睿輕薄本也能玩大語言...

在即將上市的14代酷睿Meteor Lake處理器中,就設計了VPU(Visual Processi....
發(fā)表于 2023-09-01 15:02? 311次閱讀
Intel AIGC體驗:酷睿輕薄本也能玩大語言...

新竹廠突發(fā)火災 緯創(chuàng)緊急回應:生產(chǎn)及運營一切正常

此前,臺媒報道稱,雖然緯創(chuàng)從微軟和亞馬遜接到了很多訂單,但由于nvidia的gpu不足,給這些odm....
發(fā)表于 2023-08-31 10:31? 190次閱讀
新竹廠突發(fā)火災 緯創(chuàng)緊急回應:生產(chǎn)及運營一切正常

中國之外,美國限制英偉達向中東國家出口AI芯片

據(jù)悉,nvidia向sec提交的10-q文件中包括:“美國政府通報了在2024年第二季度向nvidi....
發(fā)表于 2023-08-31 09:20? 601次閱讀
中國之外,美國限制英偉達向中東國家出口AI芯片

華為推出Mate 60 Pro先鋒計劃;iQOO...

后置鏡頭:5000萬像素超光變攝像頭(F1.4~F4.0光圈,OIS光學防抖)+ 1200萬像素超廣....
發(fā)表于 2023-08-30 15:56? 359次閱讀
華為推出Mate 60 Pro先鋒計劃;iQOO...

NVIDIA最強CPU芯片架構——NVIDIA ...

NVIDIA Grace Hopper Superchip將節(jié)能、高帶寬的 NVIDIA Grace....
發(fā)表于 2023-08-30 10:45? 438次閱讀
NVIDIA最強CPU芯片架構——NVIDIA ...

NVIDIA助力各方協(xié)作為3D世界制定OpenU...

Hexagon 首席技術官 Burkhard Boeckem 表示:“加入該聯(lián)盟表明 Hexagon....
發(fā)表于 2023-08-29 17:45? 340次閱讀
NVIDIA助力各方協(xié)作為3D世界制定OpenU...

英特爾呂冬:英特爾與玩家共同見證電競首次入亞

自中國電競產(chǎn)業(yè)飛速發(fā)展以來,英特爾可以說是電競二十余載發(fā)展下的一位見證者和推動者。如今電競入亞運,英....
發(fā)表于 2023-08-29 16:28? 261次閱讀
英特爾呂冬:英特爾與玩家共同見證電競首次入亞

宏大冒險再啟程,艾爾莎EA H610M-T與你玩...

隨著硬件性能的不斷提升,如今的游戲也是不斷地往高清化和真實化的方向發(fā)展。然而凡事總有例外,許多游戲廠....
發(fā)表于 2023-08-29 13:51? 106次閱讀
宏大冒險再啟程,艾爾莎EA H610M-T與你玩...

AMD或?qū)⒂?月發(fā)布顯卡一鍵性能提升技術

據(jù)了解,AMD早在去年 RX 7900顯卡發(fā)布會上就提到了 HYPR-RX顯卡一鍵性能提升技術。而該....
發(fā)表于 2023-08-28 11:46? 276次閱讀
AMD或?qū)⒂?月發(fā)布顯卡一鍵性能提升技術

AMD或?qū)l(fā)布兩款顯卡,供電采用雙8pin

據(jù)了解,日前AMD方面發(fā)布RX 7800 XT 和 RX 7700 XT 顯卡的相關信息。 而從相關....
發(fā)表于 2023-08-28 10:03? 191次閱讀
AMD或?qū)l(fā)布兩款顯卡,供電采用雙8pin

DolphinDB加入NVIDIA初創(chuàng)加速計劃

近日,DolphinDB 正式加入“NVIDIA 初創(chuàng)加速計劃(NVIDIA Inception)”....
發(fā)表于 2023-08-27 01:08? 515次閱讀
DolphinDB加入NVIDIA初創(chuàng)加速計劃

使用OpenVINO優(yōu)化并部署訓練好的YOLOv...

在《英特爾銳炫 顯卡+ oneAPI 和 OpenVINO 實現(xiàn)英特爾 視頻 AI 計算盒訓推一體-....
發(fā)表于 2023-08-25 11:08? 360次閱讀
使用OpenVINO優(yōu)化并部署訓練好的YOLOv...

NVIDIA Research在CVPR上贏得自...

新研究成果帶來實現(xiàn)安全自動駕駛系統(tǒng)所需的先進 3D Occupancy 預測。
發(fā)表于 2023-08-24 17:09? 726次閱讀
NVIDIA Research在CVPR上贏得自...

華秋第八屆硬創(chuàng)大賽攜手NVIDIA初創(chuàng)加速計劃,賦能企業(yè)發(fā)展

中國硬件創(chuàng)新創(chuàng)客大賽始于2015年,由深圳華秋電子有限公司主辦,至今已經(jīng)成功舉辦七屆,賽事范圍覆蓋華南、華東、...
發(fā)表于 2022-07-11 11:28? 8968次閱讀
華秋第八屆硬創(chuàng)大賽攜手NVIDIA初創(chuàng)加速計劃,賦能企業(yè)發(fā)展

Arm Neoverse NVIDIA Grace CPU 超級芯片:為人工智能的未來設定步伐

人工智能 (AI) 將改變世界。但要實現(xiàn)其潛力,我們將不得不改變設計計算系統(tǒng)的方式。 諸如在云中訓練神經(jīng)網(wǎng)絡或在...
發(fā)表于 2022-03-29 14:40? 3990次閱讀
Arm Neoverse NVIDIA Grace CPU 超級芯片:為人工智能的未來設定步伐

顯卡過熱的原因及其解決辦法

問題分析在顯卡上長時間運行很多的程序, 導致顯卡過熱, 出現(xiàn)問題.解決方法停掉所有的在顯卡上運行的程序, ERR會消失...
發(fā)表于 2022-01-03 08:33? 4600次閱讀
顯卡過熱的原因及其解決辦法

電壓偏移實現(xiàn)的條件

電壓偏移要足夠低紋波日系電容/臺系電容80 plus(節(jié)能轉化率,電源轉化率)如下單雙路12v的方案。選擇電源的時候,單...
發(fā)表于 2021-12-29 07:49? 1415次閱讀
電壓偏移實現(xiàn)的條件

JetsonNano的環(huán)境配置參考刷機教程

首先要保證安裝好NVIDIA驅(qū)動工具和CUDA以及Cudnn軟件包(主機的環(huán)境配置在第七章中可以找到,JetsonNano...
發(fā)表于 2021-12-21 08:22? 1005次閱讀
JetsonNano的環(huán)境配置參考刷機教程

NVIDIA Jetson介紹

首發(fā)極術社區(qū)如對Arm相關技術感興趣,歡迎私信 aijishu20加入技術微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計算...
發(fā)表于 2021-12-14 08:05? 2122次閱讀
NVIDIA Jetson介紹

顯卡輸出接口有哪幾種?

顯卡輸出接口有哪幾種?
發(fā)表于 2021-10-14 07:49? 2773次閱讀
顯卡輸出接口有哪幾種?

請問i7 10700搭配什么主板比較好?i710700配什么顯卡和多大內(nèi)存好?

請問i7 10700搭配什么主板比較好?i710700配什么顯卡和多大內(nèi)存好?...
發(fā)表于 2021-09-23 08:04? 3060次閱讀
請問i7 10700搭配什么主板比較好?i710700配什么顯卡和多大內(nèi)存好?

顯卡發(fā)燒的原因是什么

電腦是當今社會下每個人都有的,人手必備的一樣東西,相信大家都知道,顯卡是組成電腦的重要部分之一。但是你知道顯卡...
發(fā)表于 2021-09-08 07:17? 1398次閱讀
顯卡發(fā)燒的原因是什么

AMD RX7000系列顯卡核心參數(shù)已被曝出!擁有高達15360個流處理器!

AMD RX7000系列顯卡將在明年問世。近日,下一代顯卡核心Navi 31、Navi 33在外網(wǎng)被曝出,均采用RDNA 3架構設...
發(fā)表于 2021-08-24 17:24? 3707次閱讀
AMD RX7000系列顯卡核心參數(shù)已被曝出!擁有高達15360個流處理器!