NVIDIA的下一代GeForce游戲卡遲遲不肯露面,一方面是缺乏足夠的競爭刺激,另一方面則是NVIDIA的業(yè)務重心早已經轉移,不再只盯著游戲卡,更關注的是計算平臺,畢竟那里發(fā)展空間更大,利潤也高得多。
NVIDIA今天宣布推出新一代計算平臺“HGX-2”,擁有多達16塊頂級計算卡Tesla V100,而且第一次將AI人工智能、HPC高性能計算融合在了統一架構之內。
Tesla V100基于新一代GPU架構“Volta”(伏特),采用臺積電12nm FFN(16nm加強版)工藝制造,擁有5120個CUDA核心、640個Tensor深度學習核心,面積達815平方毫米,集成了210億個晶體管。
其浮點性能高達半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor性能則有120TFlops,同時搭配4096-bit位寬的16GB HBM2高帶寬顯存,頻率1.75GHz,帶寬900GB/s。
NVIDIA此前的計算平臺HGX-1整合了8塊Tesla V100,總計40960個CUDA核心、5120個Tensor核心、256GB顯存,通過300GB/s雙線帶寬的NVLink總線相連,浮點性能單精度125TFlops、雙精度62TFlops,Tensor性能1PFlops。
而新一代HGX-2則用上了16塊Tesla V100,規(guī)模和性能輕松翻番,總計81920個CUDA核心、10240個Tensor核心、512GB顯存,浮點性能單精度250TFlops、雙精度125TFlops,Tensor性能2PFlops。
NVIDIA還在系統內部署了12顆NVSwitches開關,用于GPU之間的直接互聯,NVLink總線雙向帶寬高達2.4TB/s。
除了高性能,HGX-2平臺的最大優(yōu)點是支持多種精度計算,可適應不同需求,比如在科學計算和模擬中,可使用FP64、FP32高精度計算,而在AI訓練和推理中,則可使用FP16浮點、Int8整數精度計算。
聯想、超微、QCT、Wiwynn四大服務器廠商都將在今年晚些時候發(fā)售各自的HGX-2系統。
富士康、英業(yè)達、廣達、緯創(chuàng)四大ODM廠商則正在設計基于HGX-2的系統,將在今年晚些時候面世,可用于云計算數據中心。
-
NVIDIA
+關注
關注
14文章
4856瀏覽量
102711 -
人工智能
+關注
關注
1790文章
46671瀏覽量
237111 -
計算卡
+關注
關注
0文章
13瀏覽量
3109
原文標題:合體!16塊Tesla V100計算卡 NVIDIA造頂級計算平臺
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論