NVIDIA 發(fā)布 GeForce RTX 40 系列 GPU,旨在為游戲玩家和創(chuàng)作者提供革命性性能,其中新旗艦產品 RTX 4090 GPU 的性能相較上一代提升最高可達 4 倍。
作為全球首款基于全新 NVIDIA Ada Lovelace 架構的 GPU,RTX 40 系列在性能和效率上都實現(xiàn)了巨大的代際飛躍,意味著實時光線追蹤和利用 AI 生成像素的神經(jīng)網(wǎng)絡渲染的新時代已然來臨。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 GTC 大會主題演講的 GeForce Beyond 特別直播上介紹到:“RTX 光線追蹤和神經(jīng)網(wǎng)絡渲染的時代正在全面展開,全新 NVIDIA Ada Lovelace 架構將其推向了新的高度?!?/p>
”Ada 為游戲玩家提供了質的飛躍,并正在為完全基于仿真的未來游戲鋪路。Ada 的性能是上一代產品的 4 倍,并為整個行業(yè)設立新標準。“ 黃仁勛表示。
NVIDIA Racer RTX 是利用 GeForce RTX 40 系列 GPU 和 NVIDIA DLSS 3 創(chuàng)建未來游戲內容的例子
DLSS 3 可生成全新幀以加速游戲性能
黃仁勛還宣布 NVIDIA DLSS 3 --用于游戲和創(chuàng)作應用的 Deep Learning Super Sampling 深度學習超級采樣是神經(jīng)網(wǎng)絡圖形技術的下一次革命。這項由人工智能驅動的技術可以生成全新幀,從而大幅提高游戲性能。DLSS 3 也可以通過允許 GPU 生成全新幀來克服受 CPU 限制的游戲。
DLSS 3 即將加入到全球最熱門的游戲引擎包括 Unity Engine 和虛幻引擎中。同時,DLSS 3 也已獲得眾多全球領先的游戲開發(fā)者的支持,超過 35 款游戲和應用即將支持該技術。
此外,RTX 40 系列 GPU 具有一系列新的技術創(chuàng)新,包括:
流式多處理器具有高達 83 TFLOPS 的著色器能力,吞吐量超過上一代產品 2 倍。
第三代RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。
第四代 Tensor Cores 具有高達 1.32 Petaflops 的 FP8 張量處理性能,超過上一代使用 FP8 加速性能的 5 倍。
著色器執(zhí)行重排序(SER)通過即時重新安排著色器負載來提高執(zhí)行效率,從而更好地利用 GPU 資源。作為與 CPU 的亂序執(zhí)行一樣的重大創(chuàng)新,SER 為光線追蹤帶來最高可達 3 倍的性能提升,整體游戲性能提升可高達 25%。
Ada 光流加速器帶來 2 倍的性能提升,使 DLSS 3 能夠預測場景中的運動,使神經(jīng)網(wǎng)絡能夠在保持圖像質量的同時提高幀率。
架構上的改進,與 TSMC 4N 定制工藝技術緊密結合,實現(xiàn)了高達 2 倍的性能功耗比飛躍。
雙 NVIDIA 編碼器(NVENC)將輸出時間至多縮短一半,并支持 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多的公司都已在采用 NVENC AV1 編碼器。
全新光線追蹤技術讓游戲更具沉浸感
幾十年來,用正確的物理照明來實時渲染光線追蹤場景一直被認為是圖形學領域的重大突破。同時,隨著 3D 游戲和圖形學不斷努力提供對現(xiàn)實世界最精確地展現(xiàn),環(huán)境和物體渲染的幾何復雜性也在不斷增加。
實現(xiàn)物理準確的圖形需要巨大的計算能力。像《賽博朋克 2077》 (Cyberpunk 2077)之類的現(xiàn)代光線追蹤游戲,我們對每個像素執(zhí)行超過 600 次光線追蹤計算來確定光照,這與四年前推出的首批光線追蹤游戲相比,提升達 16 倍。
全新第三代 RT Cores 可以提供 2 倍的光線與三角形求交性能,以及兩個全新的重要硬件單元。Opacity Micromap 引擎將光線追蹤的 Alpha-Test 幾何性能提升 2 倍;而全新的 Micro-Mesh 引擎可動態(tài)生成微網(wǎng)格,以產生額外的幾何圖形。Micro-Mesh 引擎可在提升幾何圖形豐富度的同時,不以傳統(tǒng)復雜幾何圖形處理的性能和存儲成本為代價。
RTX Remix、新 AV1 編碼器重新定義創(chuàng)作
RTX 40 系列 GPU 和 DLSS 3 為所有 NVIDIA Studio 的創(chuàng)作者帶來了助力。3D 藝術家無需代理就可以利用精確的物理學和逼真的材料渲染完整的光線追蹤環(huán)境,并實時查看效果。
視頻編輯和直播也因 GPU 性能的提升和全新第八代編碼器中 AV1 的加入而得以提升。NVIDIA Broadcast 軟件開發(fā)工具包有三個更新,包括:面部表情預估,眼神追蹤,以及虛擬綠幕的質量改進,現(xiàn)已提供給合作伙伴。
包含在 NVIDIA Studio 全套創(chuàng)意應用中的 NVIDIA Omniverse 即將增加 NVIDIA RTX Remix。NVIDIA RTX Remix 是一個 MOD 平臺,用于為經(jīng)典游戲添加 RTX 效果。RTX Remix 允許 MOD 愛好者輕松捕捉游戲素材,利用強大的 AI 工具自動增強材質,并通過光線追蹤和 DLSS 快速將游戲 RTX 化。
推出《傳送門》(Portal)RTX版
NVIDIA Lightspeed Studios 利用 RTX Remix 重新設計了 Valve 的經(jīng)典電子游戲《傳送門》(Portal),該游戲被認為是有史以來最好的視頻游戲之一。全景光線追蹤和 DLSS 3 等先進的圖形功能為該游戲帶來了引人注目的全新畫質和整體體驗。恰逢《傳送門》(Portal)15 周年,《傳送門》(Portal)RTX 版免費 DLC 將于 11 月發(fā)布。
GeForce RTX 4090 和 4080:全新的終極 GPU
GeForce RTX 4090 GPU 是全新 GeForce RTX 40 系列的旗艦產品,是全球首款基于全新 NVIDIA Ada Lovelace 架構的游戲 GPU
RTX 4090 是全球最快的游戲 GPU,在功耗、靜音、散熱等方面技驚四座。在完整的光線追蹤游戲中,與上一代采用 DLSS 2 的 RTX 3090 Ti 相比,采用 DLSS 3 的 RTX 4090 的性能提升可達 4 倍。在現(xiàn)代游戲中,RTX 4090 的性能提升高達 2 倍,同時保持了相同的 450W 功耗。RTX 4090 具有 760 億個晶體管、16384 個 CUDA 核心和 24 GB 高速美光 GDDR6X 顯存,在 4K 分辨率的游戲中持續(xù)以超過 100 FPS 運行。RTX 4090 將于 10 月 12 日上市,建議零售價 ¥12999 元起。
NVIDIA 還宣布推出采用兩種配置版本的 RTX 4080。
RTX 4080 16GB 擁有 9728 個 CUDA 核心和 16 GB 高速美光 GDDR6X 顯存,在現(xiàn)代游戲中的性能可達 GeForce RTX 3080 Ti 的 2 倍;在較低功率下,性能比 GeForce RTX 3090 Ti 更強大。
RTX 4080 12GB 則擁有 7680 個 CUDA 核心和 12GB 美光 GDDR6X 顯存,比上一代旗艦 GPU -- RTX 3090 Ti 性能更強大。
兩種配置版本的 RTX 4080 將于 11 月上市,建議零售價分別為 ¥9499 元起和 ¥7199 元起。
-
NVIDIA
+關注
關注
14文章
4855瀏覽量
102709 -
gpu
+關注
關注
28文章
4673瀏覽量
128592 -
人工智能
+關注
關注
1789文章
46652瀏覽量
237064
原文標題:GTC22 | NVIDIA 實現(xiàn)性能巨大飛躍,GeForce RTX 40系列開創(chuàng)神經(jīng)網(wǎng)絡渲染新時代
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論