針對(duì)ChatGPT等大型語(yǔ)言模型的推理,我們宣布推出一款新的Hopper GPU配備雙GPU NVLINK的PCIE H100
同時(shí)還可支持商用PCIE服務(wù)器輕松擴(kuò)展
目前在云上唯一可以實(shí)際處理ChatGPT的GPU是HGX A100與適用于GPT-3處理的HGX A100相比,一臺(tái)搭載四對(duì)H100及雙GPU NVLINK的標(biāo)準(zhǔn)服務(wù)器的速度
H100可將大型語(yǔ)言模型的處理成本,降低一個(gè)數(shù)量級(jí)
Grace Hopper非常適合處理大型數(shù)據(jù)集,例如適用于推薦系統(tǒng)和大型語(yǔ)言模型的AI數(shù)據(jù)庫(kù)。
如今,利用大容量?jī)?nèi)存,CPU會(huì)存儲(chǔ)和查詢巨型嵌入表,然后將結(jié)果傳輸?shù)紾PU進(jìn)行推理,借助Grace-Hopper, Grace可以查詢嵌入表,并將結(jié)果直接傳輸?shù)紿opper速度比PCIE快7倍
GTC 2023主題直播地址:https://t.elecfans.com/live/2302.html
-
cpu
+關(guān)注
關(guān)注
68文章
10804瀏覽量
210829 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8958瀏覽量
85082 -
gtc
+關(guān)注
關(guān)注
0文章
73瀏覽量
4406 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1546瀏覽量
7358
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論