0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fugaku超級計算機程序已實現(xiàn)100倍的速度提升

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2021-12-28 09:26 ? 次閱讀

在不到18個月的時間里,密歇根大學的一個團隊采用GPU,為一個基于復雜數(shù)學的程序?qū)崿F(xiàn)了20倍的提速。該程序為量子科學奠定了基礎。

Vikram Gavini 的實驗室以創(chuàng)紀錄的速度,跨越了微觀世界的一座重要里程碑。

這支由三人組成的密歇根大學團隊創(chuàng)建了一個使用復雜的數(shù)學來深入觀察原子世界的程序。該程序?qū)⑼苿釉S多科學領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設計工作——從更輕的汽車到更高效的藥物。

憑借 GPU ,該團隊開放源碼庫中的代碼在短短18個月內(nèi)實現(xiàn)了20倍速度提升。

通往Summit的旅程

2018年年中,當該團隊正準備發(fā)布一個在 CPU 上運行的代碼版本時,他們收到了橡樹嶺國家實驗室 GPU 黑客馬拉松的邀請。全球最快的超級計算機之一—— Summit 就位于該實驗室。

機械工程和材料科學教授 Gavini 表示:“我們當時的想法是看看我們能實現(xiàn)什么?!?/p>

該實驗室的博士后 Sambit Das 參加了這場為期五天的活動。他認為:“我們很快意識到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力?!?/p>

在活動結(jié)束前, Das 和另一位實驗室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫中,實現(xiàn)了5倍速度提升。這也讓他們意識到,未來能實現(xiàn)的還有更多。

6個月內(nèi)實現(xiàn)從5倍到20倍的速度提升

在接下來的幾個月里,該實驗室繼續(xù)對該程序進行調(diào)優(yōu),使其能夠?qū)?萬個鎂原子中的10萬個電子進行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運行。

隨著 Summit 的節(jié)點數(shù)量不斷增加,該實驗室采用迭代法,在節(jié)點上運行越來越多的代碼。截止4月,該實驗室使用了該系統(tǒng)27,000個 GPU 中的大部分,實現(xiàn)了近 46 petaflops 的性能,達到了之前的20倍。

對于一個基于密度泛函理論(DFT)的程序來說,這是一個前所未有的結(jié)果。密度函數(shù)理論是一項解釋亞原子粒子之間量子相互作用的復雜數(shù)學理論。

適用于高難度算法的分布式計算

DFT 算法的復雜性和基礎性使其目前占用了所有公共研究計算機四分之一的時間。在被引用次數(shù)最多的100篇科學論文中,有12篇是 DFT 為主題的。該計算還被用來分析從天體物理學到 DNA 鏈的一切。

最初,根據(jù)該實驗室的報告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個處理器之外,很難實現(xiàn)進一步的擴展,因此就連效率報告都沒有。

Gavini 表示:“能實現(xiàn)這一前所未有的效率令我們感到非常高興?!?/p>

聲名鵲起

2019年底,該團隊被提名為戈登貝爾獎的入圍者。這是該實驗室首次參加這一“高性能計算領(lǐng)域諾貝爾獎”的評選。

Gavini 表示:“這為我們的實驗室和大學帶來了很高的知名度,我認為這次努力還只是一個開始?!?/p>

事實上,自評選以來,實驗室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達到38%。并且該實驗室已經(jīng)在探索在其他系統(tǒng)和應用上的使用。

尋求更多的應用和更高的性能

最初,這項工作被用于分析鎂。這種比當今汽車和飛機使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實驗室與另一團隊合作,研究電子在 DNA 中的移動方式,這項工作可以幫助其他研究者研發(fā)出更有效的藥物。

接下來重要的一步是在 Perlmutter 上運行代碼。這是一臺使用最新 NVIDIA A100 Tensor Core GPU 的超級計算機。根據(jù)Das的報告,基于A100 GPU對TensorFloat-32的支持,與 Summit GPU 相比,這臺計算機目前已經(jīng)實現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實現(xiàn)高精度的混合精度格式。

與其他 DFT 代碼相比,該實驗室程序已實現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級計算機。

他表示:“眼下的收獲總會令人欣喜,但‘路漫漫其修遠兮,吾將上下而求索’。這次的成果也是我們新征程的開始。”

原文標題:借助數(shù)學的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4591

    瀏覽量

    128144
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7174

    瀏覽量

    87158
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4671

    瀏覽量

    67767

原文標題:借助數(shù)學的力量:密歇根團隊破解亞原子世界的密碼

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計算機進行程序控制工作的基本原理是怎樣的

    計算機程序控制是計算機科學中的一個核心概念,它涉及到計算機如何根據(jù)預設的指令序列執(zhí)行任務。 1. 計算機硬件基礎 在深入
    的頭像 發(fā)表于 09-04 16:57 ?151次閱讀

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?401次閱讀

    工業(yè)計算機與普通計算機的區(qū)別

    在信息化和自動化日益發(fā)展的今天,計算機已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡墓ぞ?。然而,?b class='flag-5'>計算機領(lǐng)域中,工業(yè)計算機和普通計算機雖然都具備基本的計算
    的頭像 發(fā)表于 06-06 16:45 ?673次閱讀

    NVIDIA和Recursion利用AI超級計算機加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅(qū)動,用于加速醫(yī)療領(lǐng)域科學家的工作。在全球超級計算機 TOP500 榜單中,它的排名上升了 100 多位。
    的頭像 發(fā)表于 05-16 09:46 ?1120次閱讀
    NVIDIA和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>加快新藥研發(fā)

    富士通使用富岳超級計算機訓練LLM

    盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?421次閱讀

    日本超算富岳助力構(gòu)建大規(guī)模語言模型Fugaku-LLM

    在昨日公布的新聞稿中,研究團隊表示他們成功發(fā)掘了富岳超級計算機的潛能,使矩陣乘法運算速度提升,通信
    的頭像 發(fā)表于 05-11 17:07 ?794次閱讀

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機這一消息屬實。
    的頭像 發(fā)表于 04-11 10:14 ?412次閱讀

    從原子到超級計算機:NVIDIA與合作伙伴擴展量子計算應用

    量子計算領(lǐng)域的最新進展包括分子研究、部署巨型超級計算機,以及通過一項新的學術(shù)計劃培養(yǎng)量子從業(yè)人員。
    的頭像 發(fā)表于 03-22 10:05 ?321次閱讀

    諾和諾德基金會將聯(lián)手英偉達打造丹麥AI超級計算機

    諾和諾德基金會攜手英偉達,共同宣布在丹麥打造一臺領(lǐng)先的AI超級計算機。這臺超級計算機將致力于推動醫(yī)療保健、生命科學以及綠色轉(zhuǎn)型等領(lǐng)域的科研與創(chuàng)新,為丹麥乃至全球的諾和諾德基金會攜手英偉
    的頭像 發(fā)表于 03-21 13:43 ?440次閱讀

    【量子計算機重構(gòu)未來 | 閱讀體驗】+量子計算機的原理究竟是什么以及有哪些應用

    計算方法的區(qū)別傳統(tǒng)方法是,按照不走枚舉所有情況,而量子計算是一次處理所有情況,是一步到位。但是這里又有疑惑了,量子計算如何實現(xiàn)的一步到位呢, 這里引入了量子比特和傳統(tǒng)
    發(fā)表于 03-11 12:50

    【量子計算機重構(gòu)未來 | 閱讀體驗】+ 初識量子計算機

    欣喜收到《量子計算機——重構(gòu)未來》一書,感謝電子發(fā)燒友論壇提供了一個讓我了解量子計算機的機會! 自己對電子計算機有點了解,但對量子計算機真是一無所知,只是聽說過量子糾纏、超快的運算
    發(fā)表于 03-05 17:37

    計算機為什么利用反碼來實現(xiàn)減法?

    計算機為什么利用反碼來實現(xiàn)減法? 計算機實現(xiàn)減法運算時利用反碼的原因可以從歷史背景、計算機設計優(yōu)勢和運算規(guī)則等方面來分析。 1. 歷史背景
    的頭像 發(fā)表于 02-19 15:10 ?535次閱讀

    中國量子計算機“本源悟空”實現(xiàn)全球訪問量突破100

    據(jù)最新官方消息,截至2月1日上午11時,中國第三代自主超導量子計算機“本源悟空”的全球訪問量突破100萬。這款由中國本源量子計算科技(合肥)股份有限公司(以下簡稱“本源量子”)自主研
    的頭像 發(fā)表于 02-04 10:19 ?768次閱讀

    特斯拉在布法羅超級工廠投資5億美元建造Dojo超級計算機

    霍楚爾表示,此次項目投資為5億美元,并將同時在紐約州立大學建設另一臺獨立的AI超級計算機?!拔液軜s幸地告訴大家,特斯拉將在布法羅投資5億美元,用于其新一代超級計算機的建設”,她說道。
    的頭像 發(fā)表于 01-29 10:58 ?296次閱讀

    Blackwell GB100能否在超級計算機和AI市場保持領(lǐng)先優(yōu)勢?

    NVIDIA 下一代 Blackwell GB100 傳將采用芯片堆棧設計提升效能和效率,但也面臨工藝和封裝的挑戰(zhàn),能否在超級計算機和 AI 市場保持領(lǐng)先優(yōu)勢?
    的頭像 發(fā)表于 10-24 17:43 ?838次閱讀