美國南方衛(wèi)理公會大學(xué)使用 NVIDIA DGX SuperPOD 推動德克薩斯州北部地區(qū)進入 AI 時代;密西西比州立大學(xué)和德克薩斯農(nóng)工大學(xué)準備使用 NVIDIA Quantum-2 網(wǎng)絡(luò);英國的一所大學(xué)則升級了其 InfiniBand 網(wǎng)絡(luò)。
正如達拉斯/沃斯堡機場已成為全美旅行樞紐一樣,南方衛(wèi)理公會大學(xué)(SMU)將助力德克薩斯州北部地區(qū)在 AI 行業(yè)發(fā)展中處于領(lǐng)先地位。
南方衛(wèi)理公會大學(xué)正在安裝一臺 NVIDIA DGX SuperPOD 超級計算機。該大學(xué)希望這臺超級計算機為這個擁有 12000 多名學(xué)生和 2400 名教職員工的龐大社區(qū)推動機器學(xué)習(xí)項目的發(fā)展。
除了該大學(xué)之外,美國中南部還有兩所大學(xué)也宣布計劃使用 NVIDIA 技術(shù)以推動研究高速發(fā)展。
德克薩斯農(nóng)工大學(xué)和密西西比州立大學(xué)均計劃使用 NVIDIA 的 400 Gbit/s InfiniBand 網(wǎng)絡(luò)平臺,NVIDIA Quantum-2 將作為其最新高性能計算機的主干網(wǎng)。此外,英國的一臺超級計算機剛剛升級了其 InfiniBand 網(wǎng)絡(luò)。
德克薩斯州喜獲 SuperPOD
提到今年早期在佛羅里達大學(xué)安裝的另一個系統(tǒng)時,南方衛(wèi)理公會大學(xué)首席信息官 Michael Hites 表示:“我們是美國第二所獲得 DGX SuperPOD 系統(tǒng)的大學(xué),它將助力本社區(qū)在使用 AI 技術(shù)推動學(xué)位課程,以及校企合作方面,均處于領(lǐng)先地位?!?/p>
9 月,一篇報導(dǎo)稱,達拉斯地區(qū)因缺乏主要的 AI 研究而 “步履蹣跚”。巧合的是,報導(dǎo)登上當?shù)貓蠹堉畷r,也正是南方衛(wèi)理公會大學(xué)敲定其 DGX SuperPOD 計劃之日。
南方衛(wèi)理公會大學(xué)在 3 月的一份計劃預(yù)覽報告中表示,AI 是 “數(shù)字化轉(zhuǎn)型的核心……沒有任何社會部門能夠不受該技術(shù)的影響。AI 對 K-12 教育行業(yè)和勞動力發(fā)展具有巨大的改善潛力,這將有助于該地區(qū)經(jīng)濟的持續(xù)增長?!?/p>
一項 15 億美元的籌款活動 —— SMU Ignite —— 于 9 月正式啟動。SMU Ignite 將推動 AI 倡議,幫助南方衛(wèi)理公會大學(xué)邁入全國頂級研究型大學(xué)的行列。該大學(xué)正在聘請一位首席創(chuàng)新官來協(xié)助指導(dǎo)此項工作。
打造一個計算煉金爐
南方衛(wèi)理公會大學(xué)研究者 IT 支持團隊主管 Jason Warner 表示,這項工作的核心是人才。因此,他為南方衛(wèi)理公會大學(xué)福特研究與創(chuàng)新中心的一個新中心聘請了一批具有重大影響力的數(shù)據(jù)科學(xué)專家。Warner 將這座新中心稱為南方衛(wèi)理公會大學(xué)的 “計算煉金爐”。
這支團隊由 Eric Godat 領(lǐng)導(dǎo),他在南方衛(wèi)理公會大學(xué)使用大型強子對撞機的數(shù)據(jù)為核結(jié)構(gòu)建模,并因此獲得了粒子物理學(xué)博士學(xué)位。
而今,他正協(xié)助南方衛(wèi)理公會大學(xué)的學(xué)生了解 DGX SuperPOD 所帶來的新機會。第一步,他邀請兩名南方衛(wèi)理公會大學(xué)的學(xué)生使用 NVIDIA Jetson 模塊建造一個 DGX SuperPOD 的微型模型。
Godat 表示:“我們想讓大家感受一下未來的工作會是什么樣子的,尤其是那些沒有做過 AI 方面工作的非技術(shù)領(lǐng)域人員?!?/p>
南方衛(wèi)理公會大學(xué)本科生 Connor Ozenne 協(xié)助建立了一個微型 DGX SuperPOD,南方衛(wèi)理公會大學(xué)年度報告中對其進行了介紹。這臺微型系統(tǒng)由 16 個 Jetson 模塊組成,學(xué)生們將把它看作一個 TOP500 系統(tǒng)來運行 benchmark 測試
這臺全尺寸超級計算機由建立在NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上的20個NVIDIA DGX A100 系統(tǒng)組成。憑借其積木式的模塊化結(jié)構(gòu),這臺超級計算機最早可以在 1 月啟動和運行。它將提供高達 100PFlops 的計算力,足以使其在全球最快超級計算機榜單 TOP500上位居前列。
德克薩斯農(nóng)工大學(xué)為其 ACES
使用 NVIDIA Quantum-2 InfiniBand 技術(shù)
位于南面約 200英里的德克薩斯農(nóng)工大學(xué)高性能計算中心,將成為首批接入 NVIDIA Quantum-2 InfiniBand 平臺的機構(gòu)之一。其 ACES 超級計算機由戴爾科技建造,將使用 400G InfiniBand 網(wǎng)絡(luò)為研究者連接來自四家廠商的五個加速器。
NVIDIA Quantum-2 確保“在 ACES 上單項工作即可以擴展到所有計算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它還具有更低的總擁有成本、更強大的網(wǎng)絡(luò)計算功能和更高的擴展性”,ACES 首席研究員兼項目總監(jiān) Honggao Liu 表示。
德克薩斯農(nóng)工大學(xué)已經(jīng)為研究者提供了四套加速計算系統(tǒng),這四套系統(tǒng)包含 600多個 NVIDIA A100 Tensor Core 和上一代 GPU,其中兩個系統(tǒng)使用了較早版本的 NVIDIA InfiniBand 技術(shù)。
密西西比州立大學(xué)乘上 400G 網(wǎng)速列車
密西西比州立大學(xué)也將使用 NVIDIA Quantum-2 InfiniBand 平臺。它是構(gòu)建 Orion 新系統(tǒng)的首選網(wǎng)絡(luò),Orion 是密西西比州立大學(xué)管理的四個集群中最大的一個集群,這四個集群全部使用較早版本的 InfiniBand 網(wǎng)絡(luò)所構(gòu)建。
Orion 和新系統(tǒng)均由美國國家海洋和大氣管理局(NOAA)所資助,由戴爾科技建造。Orion 和新系統(tǒng)將承擔 NOAA 的工作任務(wù),以及密西西比州立大學(xué)的各項研究課題。
Orion 在 2019 年 6 月首次登上 TOP500榜單,并被列為美國第四大學(xué)術(shù)超級計算機。
密西西比州立大學(xué)高性能計算總監(jiān) Trey Breckenridge 表示:“我們在密西西比州立大學(xué)的四代超級計算機中都使用了 InfiniBand,所以我們知道它既強大又成熟,可以可靠地運行我們需要的大型工作?!?/p>
他補充道:“我們正在添加一套使用 NVIDIA Quantum-2 的新系統(tǒng),以保持在高性能計算領(lǐng)域的領(lǐng)先優(yōu)勢。”
Quantum 在英國掀起風(fēng)潮
在大洋彼岸的英國,萊斯特大學(xué)的數(shù)據(jù)密集型超級計算機—— DIaL 系統(tǒng)——已經(jīng)升級到 200G 版本的 NVIDIA Quantum InfiniBand。
萊斯特大學(xué)理論天體物理學(xué)教授兼高性能計算中心總監(jiān) Mark Wilkinson 表示:“ DIaL專為解決復(fù)雜的數(shù)據(jù)密集型問題而設(shè)計,我們需要解決這些問題,才能推進對周圍宇宙的理解?!?/p>
“這些專業(yè)應(yīng)用對帶寬和延遲的要求都是前所未有的,只有 InfiniBand 能夠滿足要求,使研究工作有效開展?!?/p>
DIaL 是英國 DiRAC 設(shè)施中使用 InfiniBand 的四臺超級計算機之一,另外還包括愛丁堡大學(xué)的 Tursa 系統(tǒng)。
InfiniBand 在技術(shù)評估上表現(xiàn)出色
在一次技術(shù)評估中,研究人員發(fā)現(xiàn)與使用另一種互連方式的純CPU系統(tǒng)Tesseract相比,在由Quantum網(wǎng)絡(luò)和NVIDIA GPU加速器構(gòu)建的Tursa系統(tǒng)上運行應(yīng)用性能可達5倍提升。
基準應(yīng)用測試顯示,Tursa系統(tǒng)上16個節(jié)點的性能是Tesseract系統(tǒng)上512個節(jié)點性能的兩倍。Tursa系統(tǒng)的每個節(jié)點提供10 TFlops計算性能,使用90%的網(wǎng)絡(luò)帶寬,每千瓦性能相比Tesseract有顯著的提高。
這也說明了為什么世界上大多數(shù) TOP500 系統(tǒng)都在使用NVIDIA的技術(shù)。
責(zé)任編輯:haq
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102709 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7485瀏覽量
88540
原文標題:SC21 | 多所大學(xué)采用 NVIDIA 系統(tǒng)和網(wǎng)絡(luò)拓展研究工作
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論