在將其Grace Hopper芯片直接與量子處理器集成,并在經(jīng)典超級計算機上展示模擬量子系統(tǒng)的能力之間,英偉達本月在量子計算領(lǐng)域掀起了波瀾。
英偉達當然已經(jīng)做好了利用后者的準備。它制造了超級計算機使用的GPU,與人工智能開發(fā)人員渴望的GPU相同。這些GPU作為在經(jīng)典計算機上模擬數(shù)十個量子位的工具也很有價值。新的軟件開發(fā)意味著研究人員現(xiàn)在可以使用越來越多的超級計算資源來代替真正的量子計算機。
但模擬量子系統(tǒng)是一項要求極高的挑戰(zhàn),而這些要求就在背后若隱若現(xiàn)。
經(jīng)典計算機在模擬量子硬件方面有兩個作用。首先,量子計算機構(gòu)建者可以使用經(jīng)典計算來測試他們的設(shè)計。倫敦帝國理工學院博士后研究員Jinzhao Sun表示:“經(jīng)典模擬是理解和設(shè)計量子硬件的一個基本方面,通常是驗證這些量子系統(tǒng)的唯一手段。”
另一方面,經(jīng)典計算機可以運行量子算法來代替實際的量子計算機。正是這種能力讓研究分子動力學、蛋白質(zhì)折疊和新興的量子機器學習領(lǐng)域的研究人員特別感興趣,所有這些都受益于量子處理。
經(jīng)典模擬并不是真正量子物品的完美替代品,但它們經(jīng)常制作合適的傳真。世界上只有這么多量子計算機,而經(jīng)典模擬更容易訪問。經(jīng)典模擬還可以控制困擾真實量子處理器的噪音,并經(jīng)常破壞量子運行。紐約州厄普頓布魯克黑文國家實驗室的計算機科學和機器學習研究員Shinjae Yoo表示,經(jīng)典模擬可能比真正的量子模擬慢,但研究人員仍然可以節(jié)省時間。
因此,捕獲是一個大小問題。由于量子系統(tǒng)中的一個量子位與該系統(tǒng)中的其他量子位糾纏在一起,因此精確模擬該系統(tǒng)的需求呈指數(shù)級增長。根據(jù)經(jīng)驗,每增加一個量子位,模擬所需的經(jīng)典內(nèi)存量就會增加一倍。從單個GPU移動到整個八個GPU節(jié)點需要增加三個量子位。
許多研究人員仍然夢想著在這個指數(shù)斜率上盡可能地向上推進。Yoo說:“如果我們正在進行分子動力學模擬,我們希望有更大數(shù)量的原子和更大規(guī)模的模擬,以獲得更真實的模擬?!?/p>
GPU可以加速量子模擬
GPU是關(guān)鍵的立足點。Yoo說,用GPU換CPU可以將量子系統(tǒng)的模擬速度提高一個數(shù)量級。這種加速可能并不令人驚訝,但由于GPU之間發(fā)送信息的瓶頸,很少有模擬能夠充分利用這一優(yōu)勢。因此,大多數(shù)模擬都停留在一個多GPU節(jié)點甚至該節(jié)點內(nèi)的單個GPU的范圍內(nèi)。
一些幕后的進展使緩解這些瓶頸成為可能。英偉達的cuQuantum軟件開發(fā)套件使研究人員更容易在多個GPU上運行量子模擬。GPU以前需要通過CPU進行通信,這造成了額外的瓶頸——像Nvidia的NCCL這樣的集體通信框架允許用戶直接在節(jié)點之間進行內(nèi)存到內(nèi)存的復制等操作。
cuQuantum與加拿大初創(chuàng)公司Xanadu的PennyLane等量子計算工具包配對。作為量子機器學習社區(qū)的堅定支持者,PennyLane讓研究人員在量子計算機上使用PyTorch等技術(shù)。雖然PennyLane是為在真正的量子硬件上使用而設(shè)計的,但PennyLanne的開發(fā)人員特別添加了在多個GPU節(jié)點上運行的功能。
從理論上講,這些進步可以讓經(jīng)典計算機模擬大約36個量子位。在實踐中,這種規(guī)模的模擬需要太多的節(jié)點小時才能實現(xiàn)。如今更現(xiàn)實的金本位是20s。盡管如此,這比幾年前研究人員所能模擬的還要多出10個量子位。
也就是說,Yoo在Perlmutter超級計算機上工作,這臺超級計算機是由數(shù)千個Nvidia A100 GPU構(gòu)建的,旨在培養(yǎng)和運行人工智能模型的能力,即使在中國,這些模型的銷售也受到美國政府出口管制的限制。西方相當多的其他超級計算機使用A100作為支柱。
經(jīng)典硬件在qbit仿真中的作用
經(jīng)典硬件的規(guī)模能否繼續(xù)增長?挑戰(zhàn)是巨大的。從擁有160G GPU內(nèi)存的英偉達DGX到擁有320GB GPU內(nèi)存的DGX,只不過是一個量子位的跳躍。Jinzhao Sun認為,試圖模擬100多個量子位的經(jīng)典模擬很可能會失敗。
真正的量子硬件,至少在表面上,已經(jīng)遠遠超過了這些量子位的數(shù)量。例如,IBM已經(jīng)穩(wěn)步將其通用量子處理器中的量子位數(shù)量增加到數(shù)百個,并雄心勃勃地計劃將這些數(shù)量增加到數(shù)千個。
這并不意味著模擬在千量子位的未來不會發(fā)揮作用。經(jīng)典計算機可以在模擬大型系統(tǒng)的各個部分中發(fā)揮重要作用——驗證它們的硬件或測試有朝一日可能以全尺寸運行的算法。事實證明,使用29個量子位可以做很多事情。
審核編輯:彭菁
-
仿真
+關(guān)注
關(guān)注
50文章
4023瀏覽量
133336 -
硬件
+關(guān)注
關(guān)注
11文章
3211瀏覽量
66064 -
工具包
+關(guān)注
關(guān)注
0文章
45瀏覽量
9518 -
量子系統(tǒng)
+關(guān)注
關(guān)注
0文章
21瀏覽量
2606
原文標題:研究人員如何使用Nvidia的GPU模擬Qubits
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論