來源:搜狐
人工智能正變得無處不在,全球最快的計算機上也在運行人工智能負載,這也在改變HPC(高性能計算,High Performance Computing)。不過,人工智能將如何影響編程,軟硬件以及和訓練需求?
本文作者認為,AI可能是HPC歷史上最大的變革推動者,至于為什么,他給出了AIHPC產(chǎn)生最大影響的十大原因。
10、 Tensors(張量):人工智能計算的通用語
向量代數(shù)的使用催生了為矢量計算設計的計算機。來自Cray的早期超級計算機是矢量超級計算機,它帶動了應用程序以矢量和矩陣代數(shù)問題的方式表示,這反過來又推動了計算機的設計,確保矢量計算能更快運行。多年來,這種循環(huán)定義了HPC。
張量代數(shù)可以視為廣義矩陣代數(shù),因此它是超級計算機能力的自然演化,而不是一場革命。任何支持矩陣運算的機器都可以進行張量運算。今天,CPU通過通用編譯器,加速Pythons,增強庫和優(yōu)化框架的支持就可以支持矢量和張量的高性能計算。
正如向量之前對HPC的硬件、軟件以及想法的影響,張量也正在深刻的改變著我們。
9、語言:高級編程語言
Fortran編程語言在HPC領域占據(jù)主導地位,再加上C和C ++語言幾乎統(tǒng)治了HPC市場。通常通過C語言接口來擴展來支持加速器。嘗試使用新語言來打破現(xiàn)有的格局已經(jīng)失敗,因為現(xiàn)有語言已經(jīng)形成了一個生態(tài),包括HPC的應用程序、用戶、代碼等。
AI帶來了新的需求,這將擴展與HPC相關的語言。他們不會改變使用Fortran的大多數(shù)物理學家的活動,但使用MATLAB和Python的數(shù)據(jù)科學家需要根據(jù)他們的需求量身定制解決方案。
Python以及其它框架和編程語言,似乎正成為HPC越來越重要的部分。不過他們實際運行的程序仍將用C/C++/Fortran編寫,但AI程序員既不會知道,也不關心它。
8、以不同方式思考:通過重新思考的方法來替換遺留代碼
HPC非常傳統(tǒng),相對而言人工智能是新的。就目前而言,當兩者相互作用時,它將重提有關實現(xiàn)遺留代碼的問題,在某些情況下這些代碼可能早就該實現(xiàn)了。說法可能是“讓我們?yōu)檫@段代碼添加一些人工智能功能”,但現(xiàn)實將是努力可能成為浪費時間。還記得Java熱潮的早期許多“轉換為Java”的努力嗎?
就像那些早期瘋狂的Java時代一樣,急于將代碼重寫為新形式的人既有成功的也有失敗的。投資回報率(ROI)將是關鍵,但預測創(chuàng)新的結果往往是錯誤的。
7、可移植性和安全性:虛擬化和容器
安全性和可移植性的具體問題是,“我可以在我的機器上安全地運行嗎?”和“它能在我的機器上運行嗎?”,這是虛擬化和容器試圖解決的問題。當然,安全性來自于良好的硬件和軟件特性。對于許多人來說,虛擬化和容器似乎能確立這種組合。
容器已引起許多開發(fā)人員的關注,因為它們比虛擬機更靈活、可部署、可升級、具備云多功能性,并且可以節(jié)省虛擬機授權許可成本。
在任何HPC或AI的會議上談論容器似乎只能站著說說。但這正在改變,例如Python和Julia在配置時可以更好地擴展,容器可以幫助部署。
容器為用戶提供了良好的環(huán)境,2019年將看到HPC領域越來越多的容器使用,部分原因是AI用戶的對此表現(xiàn)出的興趣。毫無疑問,這會對HPC帶來挑戰(zhàn),因為這需要優(yōu)化的生態(tài)系統(tǒng)。如今,這個領域正在進行這方面大量的精細工作,HPC社區(qū)將幫助實現(xiàn)這一目標,滿足大家對容器的渴望。
6、規(guī)模問題:大數(shù)據(jù)
只要有人工智能,就有大數(shù)據(jù)。人工智能的重點是利用數(shù)據(jù)模型從大量的數(shù)據(jù)集中找到價值。許多HPC中心已經(jīng)有很多基礎設施可以很好地處理大數(shù)據(jù)問題。
所有HPC中心都將大數(shù)據(jù)作為新系統(tǒng)的主要需求,AI工作負載是大數(shù)據(jù)需求的主要動力。
由于存儲器的高成本,我們看到存儲器大小與FLOP/s的比率多年來一直在下降。這對大數(shù)據(jù)發(fā)展不利。與持久內(nèi)存相關的新功能帶來了一些希望,并支持大型機器(包括HPC)中的大數(shù)據(jù)模型。這些新的內(nèi)存技術提供了主內(nèi)存和本地存儲(SSD)的擴展。
我今天寫的是人工智能如何影響HPC,但我還得指出HPC對可視化的熱愛將對AI產(chǎn)生的影響。將數(shù)據(jù)放在最接近處理器的位置是最適合進行實際數(shù)據(jù)可視化的處理器,是HPC影響AI / ML的最重要的方法之一。當然,使用和理解大數(shù)據(jù)以及可視化數(shù)據(jù)和分析是相互交織的。
5、大量計算:云計算
人工智能開發(fā)人員可能已經(jīng)比HPC開發(fā)人員更多地接受了云計算。雖然HPC“在云中”已經(jīng)出現(xiàn),但AI應用的高性能計算需求將加速“云中的HPC”。
4、硬件:交互式能力,為庫和框架提供性能
人工智能的計算量并不大。這意味著少數(shù)庫接口和框架主宰著“AI加速器”作為其賣點。
交互能力是一個長期存在的要求,它一直被HPC系統(tǒng)“擱置”,現(xiàn)在被AI程序員將其放置在“前端和中心”。這種變化對“HPC”的改變速度還有待觀察,但2019年該領域的創(chuàng)新即使分散且有些隱秘也會引人注目。交互性也可稱為“個性化”。
HPC更多的硬件多樣性、交互性支持以及為性能優(yōu)化的附加庫/框架抽象,以支持AI工作負載。HPC社區(qū)對性能的關注將有助于說明基礎設施的更多融合將有利于數(shù)據(jù)中心部署。沒有人愿意放棄性能,只要他們不必這樣做,HPC社區(qū)的專業(yè)知識將有助于商業(yè)化AI / ML的性能,從而帶動社區(qū)之間更多的硬件技術融合。
3、人員融合:用戶多樣性和對HPC興趣的增加
AI將吸引許多具有不同背景的新人才。AI將以前所未有的規(guī)模為HPC帶來民主化。過去幾年,“HPC民主化”用于描述HPC(以前只有大型組織的人才可以使用)如何被小的工程師團體和科學家群體使用。數(shù)學和物理問題可能推動了早期的超級計算發(fā)展,但最近更多的用戶發(fā)現(xiàn)HPC性能在醫(yī)學、天氣預報和風險管理等領域不可或缺。
AI帶來了比HPC更廣泛的用戶群,為HPC的民主化帶來了全新的應用。將AI增加到發(fā)展HPC的列表中,我們繼續(xù)為追求世界上最高性能的計算添加更多理由, HPC專家和AI專家正在結合,以產(chǎn)生我們都能感受到的興奮。
2、新投資:推理
機器學習通??梢员徽J為是由“訓練”的學習階段和 “推理”的“做”階段組成??雌饋砦覀冃枰嗟难h(huán)進行推理而不是更多循環(huán)進行訓練,特別是當我們看到機器學習無處不在地嵌入到身邊的解決方案中時。市場分析師估計,推理硬件市場是訓練硬件規(guī)模的5-10倍。
有了這么大的市場機會,毫不奇怪,所有人都希望進入市場更大的推理市場。推理已在FPGA,GPU,DSP和眾多定制ASIC處理器上運行。功耗,延遲和總體成本都是賣點。高性能、低延遲、易于重新編程的FPGA似乎是補充當前CPU主導的推理市場的合理選擇,時間會證明。
跟著市場的選擇,您將看到推理工作負載將對包括HPC在內(nèi)的所有計算產(chǎn)生重大影響。
1、應用程序的融合:不是在“重新思考”之后進行替換 ,“融合”兩全其美,擴展工作負載多樣性并看到不同工作負載的融合
那些有遠見的人已經(jīng)證明,HPC和AI結合時有很多機會。鼓舞人心的研究范圍從擁有一個中立的網(wǎng)絡學習到“ 像蒙特卡羅模擬一樣 ”,具有非常好的結果,只需要一小部分計算需求; 將系統(tǒng)整合到能夠預測極端天氣的模式,如颶風,或天氣預報系統(tǒng)。生成對抗網(wǎng)絡(GAN)是一類機器學習系統(tǒng),許多人都非常重視,GAN無疑有助于融合HPC和AI / ML。
雖然現(xiàn)在很少有應用結合HPC算法和AI技術,基于早期的結果,我很容易預測這是HPC應用的未來,并且將因為AI帶來HPC最大的變化。
理解這十種力量
計算在某種意義上并沒有改變:它完全取決于整個系統(tǒng)對用戶的作用。雖然需求有變化,但一個完整的系統(tǒng)由硬件起來和軟件組成不會改變。實際上,很容易被單一技術(硬件或軟件)分散注意力; 最好的系統(tǒng)會謹慎地應用最新技術,我非常偏愛地稱其為“選擇性加速” ,強調(diào)在重要時使用加速。當我經(jīng)常使用Python時,我喜歡Python加速(一種依賴CPU的軟件技術)。當我需要低延遲推理時,我喜歡FPGA加速。當我只需要一點加速時,我不使用任何一個。這是建立平衡系統(tǒng)的藝術。這前十的名單并沒有打破為多用途機器提供最佳整體效果現(xiàn)實的平衡。
結論:AI將使用HPC,這將永遠改變HPC
顯然AI將使用HPC,這將永遠改變HPC。事實上,AI可能是HPC歷史上最大的變革推動者。HPC隨著科技的發(fā)展不斷進步,工作負載也將隨著人工智能的發(fā)展而變化。我不認為辯論收斂與交叉給予足夠的信任的概念,人工智能用戶將加入HPC社區(qū),并留下自己的標記。他們也將使用非HPC系統(tǒng),就像其他HPC用戶一樣。
將有專為AI工作負載設計和構建的定制高性能機器,其他機器的AI工作負載也在可以在更通用的高性能設備上運行。要平衡機器的高性能和靈活才能實現(xiàn)加速。在所有情況下,人工智能將有助于定義未來什么是超級計算,這將永遠改變HPC。
James Reinders是HPC愛好者,也是擁有8本書的超過30年行業(yè)經(jīng)驗的從業(yè)者,其中包括在英特爾工作27年經(jīng)驗(2016年6月退休)。
審核編輯黃宇
-
編程
+關注
關注
88文章
3566瀏覽量
93540 -
人工智能
+關注
關注
1791文章
46671瀏覽量
237123
發(fā)布評論請先 登錄
相關推薦
評論