異構(gòu)計算已經(jīng)成了半導體業(yè)界不得不思考的一個話題,傳統(tǒng)通用計算的性能捉襟見肘,過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機中,各種除CPU以外的計算單元層出不窮,無論是神經(jīng)網(wǎng)絡處理器還是圖像處理器。
異構(gòu)計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機SoC、汽車芯片,大到服務器芯片和超算處理器,異構(gòu)帶來了更大的算力。但與此同時,異構(gòu)計算也帶來了一些潛在的問題。
異構(gòu)計算的崛起
異構(gòu)計算其實早在計算機時代的早期就開始零星出現(xiàn)了,比如英特爾在80年代推出的浮點協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉(zhuǎn)眼進入了新世紀,異構(gòu)出現(xiàn)的頻率也越來越高,2010年蘋果推出了首個自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領域,加速器和協(xié)處理器也數(shù)量也在逐步增加。
全球超算系統(tǒng)加速器/協(xié)處理器的應用趨勢 / TOP500
2020年以后,各國的超級計算機計劃都定位在了Exascale的百億億級別,要想實現(xiàn)目標,要么靠堆核心規(guī)模來堆性能,要么就是選擇異構(gòu)計算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構(gòu)設計。
明眼人都能看出,這種CPU+GPU的異構(gòu)設計也開始變得愈發(fā)緊密,比如英偉達今年宣布的Arm CPU Grace,該處理器靠著英偉達專利互聯(lián)技術(shù)NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實現(xiàn)了500GB/s的內(nèi)存帶寬。
非傳統(tǒng)的架構(gòu)更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個字母了。促使大家選擇異構(gòu)的動力究竟是什么?答案很簡單,異構(gòu)給到了一個更高效的方案,能夠?qū)崿F(xiàn)的算力更高。既然你CPU在計算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術(shù)為我撐腰。
異構(gòu)計算真就完美無缺?
異構(gòu)計算就真的如此完美嗎?并非如此。異構(gòu)計算的存在其實也引出了不少隱患,比如極度差異化的編程模型,從過去的單向編程轉(zhuǎn)為了多向編程。因為異構(gòu)系統(tǒng)中存在多個計算設備,又有著不同的系統(tǒng)架構(gòu)、指令集和編程模型,因此異構(gòu)系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來說,異構(gòu)混合計算系統(tǒng)需要多套不同的代碼,這增大了應用開發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開發(fā)者。
IPU / Graphcore
其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構(gòu),還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構(gòu)下,將并行程序移植到異構(gòu)處理器上需要的可不只是重新編譯,還有代碼重寫。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠都不會被移植到其他加速器上,甚至這一部分工作量還分攤到了加速器廠商的軟件開發(fā)工作量上。
所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開發(fā)者充分利用異構(gòu)處理器的計算資源,而不用在編程時考慮復雜的硬件細節(jié)。現(xiàn)在已經(jīng)有了不少跨平臺的編程標準,比如C++/Fortran、OpenMP、SYCL和Kokkos等。
最后是復雜的數(shù)據(jù)存取過程,異構(gòu)帶來的不僅是不同層級的計算架構(gòu),還有不同層級的存儲架構(gòu),比如主存儲、主緩存、設備主存、設備緩存和寄存器等等。數(shù)據(jù)要在多種存儲類型之間移動,程序執(zhí)行要在同時對多種存儲進行存取,這些存儲方式的帶寬和延遲也不盡相同。
異構(gòu)計算的未來
在近期舉辦的CIUK 2021大會上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對異構(gòu)計算未來的看法。他認為異構(gòu)計算的趨勢還將繼續(xù)發(fā)展下去,差異化不會消失,但也不會出現(xiàn)極度差異化的情況。
其次CPU與GPU的關(guān)系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說通用計算性能,GPU還是要略勝一籌。而且依目前的趨勢來看,CPU也在慢慢汲取GPU上的優(yōu)點,比如HBM、寬矢量處理器的核心、核心內(nèi)部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長路要走。
異構(gòu)計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機SoC、汽車芯片,大到服務器芯片和超算處理器,異構(gòu)帶來了更大的算力。但與此同時,異構(gòu)計算也帶來了一些潛在的問題。
異構(gòu)計算的崛起
異構(gòu)計算其實早在計算機時代的早期就開始零星出現(xiàn)了,比如英特爾在80年代推出的浮點協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉(zhuǎn)眼進入了新世紀,異構(gòu)出現(xiàn)的頻率也越來越高,2010年蘋果推出了首個自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領域,加速器和協(xié)處理器也數(shù)量也在逐步增加。
全球超算系統(tǒng)加速器/協(xié)處理器的應用趨勢 / TOP500
2020年以后,各國的超級計算機計劃都定位在了Exascale的百億億級別,要想實現(xiàn)目標,要么靠堆核心規(guī)模來堆性能,要么就是選擇異構(gòu)計算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構(gòu)設計。
明眼人都能看出,這種CPU+GPU的異構(gòu)設計也開始變得愈發(fā)緊密,比如英偉達今年宣布的Arm CPU Grace,該處理器靠著英偉達專利互聯(lián)技術(shù)NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實現(xiàn)了500GB/s的內(nèi)存帶寬。
非傳統(tǒng)的架構(gòu)更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個字母了。促使大家選擇異構(gòu)的動力究竟是什么?答案很簡單,異構(gòu)給到了一個更高效的方案,能夠?qū)崿F(xiàn)的算力更高。既然你CPU在計算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術(shù)為我撐腰。
異構(gòu)計算真就完美無缺?
異構(gòu)計算就真的如此完美嗎?并非如此。異構(gòu)計算的存在其實也引出了不少隱患,比如極度差異化的編程模型,從過去的單向編程轉(zhuǎn)為了多向編程。因為異構(gòu)系統(tǒng)中存在多個計算設備,又有著不同的系統(tǒng)架構(gòu)、指令集和編程模型,因此異構(gòu)系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來說,異構(gòu)混合計算系統(tǒng)需要多套不同的代碼,這增大了應用開發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開發(fā)者。
IPU / Graphcore
其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構(gòu),還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構(gòu)下,將并行程序移植到異構(gòu)處理器上需要的可不只是重新編譯,還有代碼重寫。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠都不會被移植到其他加速器上,甚至這一部分工作量還分攤到了加速器廠商的軟件開發(fā)工作量上。
所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開發(fā)者充分利用異構(gòu)處理器的計算資源,而不用在編程時考慮復雜的硬件細節(jié)。現(xiàn)在已經(jīng)有了不少跨平臺的編程標準,比如C++/Fortran、OpenMP、SYCL和Kokkos等。
最后是復雜的數(shù)據(jù)存取過程,異構(gòu)帶來的不僅是不同層級的計算架構(gòu),還有不同層級的存儲架構(gòu),比如主存儲、主緩存、設備主存、設備緩存和寄存器等等。數(shù)據(jù)要在多種存儲類型之間移動,程序執(zhí)行要在同時對多種存儲進行存取,這些存儲方式的帶寬和延遲也不盡相同。
異構(gòu)計算的未來
在近期舉辦的CIUK 2021大會上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對異構(gòu)計算未來的看法。他認為異構(gòu)計算的趨勢還將繼續(xù)發(fā)展下去,差異化不會消失,但也不會出現(xiàn)極度差異化的情況。
其次CPU與GPU的關(guān)系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說通用計算性能,GPU還是要略勝一籌。而且依目前的趨勢來看,CPU也在慢慢汲取GPU上的優(yōu)點,比如HBM、寬矢量處理器的核心、核心內(nèi)部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長路要走。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
異構(gòu)
+關(guān)注
關(guān)注
0文章
37瀏覽量
12999 -
異構(gòu)計算
+關(guān)注
關(guān)注
2文章
98瀏覽量
16217
發(fā)布評論請先 登錄
相關(guān)推薦
淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應用場景
關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應用場景淺談如下:
優(yōu)勢
異構(gòu)計算能力 :
異構(gòu)雙核設計結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性,能夠針對特定
發(fā)表于 08-31 08:32
打造異構(gòu)計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設計
參考設計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設備,標志著CXL技術(shù)在數(shù)據(jù)中心領域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進特性,可實現(xiàn)CPU、GPU、DDR、SSD
AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介
Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計算的功能。
在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務處理。這種協(xié)作需要系統(tǒng)采取一系列
發(fā)表于 07-24 09:54
異構(gòu)計算:解鎖算力潛能的新途徑
在這個數(shù)據(jù)爆炸的時代,計算力是推動社會與科技創(chuàng)新的核心。從日常智能設備的流暢運行到超級計算機的尖端模擬,均依賴強大的計算能力。但面對多樣化的復雜計算任務,單一處理器難以勝任。于是,
高通NPU和異構(gòu)計算提升生成式AI性能?
異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負擔,需要配備不同的處理器,如專注于AI工作負載的定制設計的NPU、CPU和GPU。
科學計算與Julia技術(shù)研討會 | 張先軼:從OpenBLAS到異構(gòu)計算軟件棧
蓬勃發(fā)展,新興科學計算語言不斷涌現(xiàn),Julia以其高性能、動態(tài)性成為其中的佼佼者。 12月9日上午1020 ,澎峰科技創(chuàng)始人 張先軼博士 將 在 主論壇:Julia與數(shù)字化和AI 上 作 “ 從OpenBLAS到異構(gòu)計算軟件?!?主題演講,期待與大家見面 ! 研討會完整詳
什么是異構(gòu)集成?什么是異構(gòu)計算?異構(gòu)集成、異構(gòu)計算的關(guān)系?
異構(gòu)集成主要指將多個不同工藝節(jié)點單獨制造的芯片封裝到一個封裝內(nèi)部,以增強功能性和提高性能。
情感語音識別的前世今生
的支持。本文將探討情感語音識別的前世今生,包括其發(fā)展歷程、應用場景、面臨的挑戰(zhàn)以及未來發(fā)展趨勢。 二、情感語音識別的發(fā)展歷程 起步階段:早期的情感語音識別技術(shù)主要依賴于聲譜分析、特征提取等傳統(tǒng)信號處理方法,但這
基石數(shù)據(jù):TOC理論物理學淺析—MES的前世今生(十一)
MES的前世今生前面的文章大體介紹了TOC下的低結(jié)存,計劃統(tǒng)一性原則,列隊生產(chǎn),日結(jié)日清,品質(zhì)問題碎片化等,有很多朋友問是否基石公司不再做數(shù)字化,而做流程梳理,非也!其實所有不同的制造業(yè)生產(chǎn)方式都有
帶你探索吹風筒的前世今生【其利天下高速風筒方案開發(fā)】?
電吹風作為如今生活中不可或缺的小家電之一,這個看似簡單的設備,已經(jīng)走過了漫長的發(fā)展歷程,從它的前世到今生,經(jīng)歷了許多變革和創(chuàng)新,本文將帶您穿越時間,探索其前世
異構(gòu)計算為什么會異軍突起?基于FPGA的異構(gòu)計算討論
簡單的介紹幾個概念,同道中人可以忽略這一段。云計算取代傳統(tǒng)IT基礎設施已經(jīng)基本成為業(yè)界共識和不可阻擋的趨勢。
發(fā)表于 10-26 10:04
?589次閱讀
異構(gòu)時代:CPU與GPU的發(fā)展演變
異構(gòu)計算是指在一個系統(tǒng)中使用不同類型的處理器來執(zhí)行不同的計算任務,以提高性能,效率和可靠性。隨著摩爾定律的放緩,單一類型的處理器已經(jīng)難以滿足日益增長的運算需求。與此同時,不同類型的處理器具有各自
高性能計算環(huán)境下的深度學習異構(gòu)集群建設與優(yōu)化實踐
隨著人工智能在工業(yè)和學術(shù)界大規(guī)模的應用,深度學習訓練需求日益迫切。各組織機構(gòu)投入大量資金購置和搭建配置GPU和InfiniBand網(wǎng)卡異構(gòu)計算集群。集群管理系統(tǒng)(也稱平臺)支持模型訓練,提供作業(yè)
評論