0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Zettascale仍是妄想?HPC不得不面對的成本問題

基于樹莓派的自動駕駛 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-05-19 00:32 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)要說HPC對更高算力等級的追求,往往在很長一段時間之前就開始了,比如最近才開始冒頭的Exascale超算,其實也是從2007年左右才開始規(guī)劃的,直到去年才有了Frontier的出現(xiàn),以及將在今年上線的Aurora和El Captitan超算。其中經(jīng)歷了不少阻礙,比如處理器的設(shè)計問題、供應(yīng)鏈的短缺加上正式上線前持續(xù)的優(yōu)化等。

然而,在達成了一個目標后,我們就會忍不住去設(shè)想下一個目標,Zettascale到底離我們有多遠?到了現(xiàn)在我們也都知道,肯定不會像Intel前圖形部門負責人Raja Koduri說的那樣,在2027年左右實現(xiàn)??晌覀円捕贾垃F(xiàn)在是一個算力指數(shù)增長的時代,為何真正的Zettascale系統(tǒng)卻還要那么久才能出現(xiàn)呢?除了技術(shù)演進外,自然就是成本問題。

規(guī)模硬件成本

首先考慮到的就是規(guī)模成本,目前的Exascale級別系統(tǒng)中,擁有成千上萬個節(jié)點已經(jīng)不是什么稀奇事了,而作為Exascale千倍的Zettascale系統(tǒng),除非通用算力有了飛躍式的提升,不然這樣的規(guī)?;渴鸺幢闶谴笮驮品?wù)廠商或國家實驗室都難以負擔。

就已上面提到的Frontier為例,這臺超算由9472塊AMD Epyc 7453 CPU和37888塊Radeon Instinct MI250X GPU組成,單是硬件成本就達到了6億美元左右。同樣,如此龐大規(guī)模的系統(tǒng)在運營規(guī)模上也不可小覷,根據(jù)超算實驗室負責人透露,在這類機器上運行應(yīng)用程序兩周的成本大概在700萬美元。

以上還只是規(guī)?;挠嬎阌布杀荆恳粋€超算系統(tǒng)還要考慮到規(guī)?;?a target="_blank">電源、冷卻和線纜帶來的成本。如果節(jié)點數(shù)量翻倍的話,以上附加硬件費用也都要統(tǒng)統(tǒng)翻倍,甚至可能會指數(shù)級上漲。

至于可用的規(guī)模化量子計算超算,解決藥物代謝之類的復(fù)雜科學問題,那需要的物理量子位可能要在千萬級以上,總的硬件成本范圍大概在50億美元和200億美元之間??梢哉f,如果無法把這個成本降下幾個數(shù)量級,那么為HPC付出的成本代價勢必會令所有人退卻。

設(shè)計成本

要想及時進入Zettascale時代,直接購買第三方供應(yīng)的處理器必然是最省事的,但對比近來幾個超算系統(tǒng)的部署進度,供應(yīng)商不一定能保證按時交付,有太多因素會影響到原本的部署計劃。而且這種方式因為其通用性缺失省了不少麻煩,卻不一定省錢。那么自研處理器是否會是更加省錢的方法呢?

以日本的富岳超算為例,雖然該系統(tǒng)整個項目的成本達到了10億美元,但其中包括了A64FX這一ARM CPU的設(shè)計與硬件成本。更不用說同樣的架構(gòu)未來可以用于打造下一代超算系統(tǒng)。而不需要購買時下昂貴的第三方處理器。

擁有同樣想法的還有印度政府,他們?yōu)閲鴥?nèi)超算系統(tǒng)打造的AUM處理器同樣采用了ARM架構(gòu),甚至由于采用了96核的Arm Neoverse V1設(shè)計,并采用了臺積電的5nm工藝,在性能上甚至要高于A64FX。

可由于采用了先進工藝,其設(shè)計成本本身就很難降低下來,以目前的市價來看,臺積電N5節(jié)點的設(shè)計成本大概在5億美元,所以如果不是真的打算把自研一直走下去,這種方法反而是最費錢的一種。

小結(jié)

我們是靠吃到了工藝、設(shè)計雙雙爆發(fā)的紅利,才能以這么快的速度進入了Exascale時代,至于64位下的Zettascale系統(tǒng),我們很可能還是要等到2035年才能得見真容。但這并不代表我們不能從現(xiàn)在開始準備,雖然離部署還很遙遠,但對各大處理器和架構(gòu)的評估,其實早就在各大研究機構(gòu)中開展了。尤其是隨著AI負載的加入,任何HPC系統(tǒng)都必須決定未來通用計算與AI計算各自的占比,并研究專為AI打造的一套全新HPC應(yīng)用程序。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    309

    瀏覽量

    23650
收藏 人收藏

    評論

    相關(guān)推薦

    errDump錯誤日志上報:開啟高效排查之門

    相信很多朋友都會忽視errDump錯誤日志上報,但不得不說的是技術(shù)高手都知道它真的是比較重要的一環(huán)。
    的頭像 發(fā)表于 11-02 11:52 ?198次閱讀
    errDump錯誤日志上報:開啟高效排查之門

    HPC云計算前景

    高性能計算(HPC)與云計算的結(jié)合,正逐步成為推動科技創(chuàng)新和產(chǎn)業(yè)升級的重要引擎。隨著數(shù)據(jù)規(guī)模的不斷擴大和計算需求的日益復(fù)雜,HPC云計算展現(xiàn)出了巨大的潛力和價值。
    的頭像 發(fā)表于 10-16 10:17 ?148次閱讀

    英偉達面臨雙重反壟斷調(diào)查挑戰(zhàn)

    英偉達,這家在人工智能芯片領(lǐng)域占據(jù)領(lǐng)先地位的科技公司,近期遭遇了前所未有的挑戰(zhàn)。在享受了數(shù)月由AI芯片需求激增帶來的股價暴漲和市場樂觀情緒后,英偉達不得不面對來自監(jiān)管機構(gòu)的雙重反壟斷調(diào)查。
    的頭像 發(fā)表于 08-14 11:45 ?510次閱讀

    拒絕滲漏,安全、快速、有效的治理變壓器滲漏油

    電廠變壓器滲漏油,用這種技術(shù)治理立竿見影,不得不稱贊!
    的頭像 發(fā)表于 07-25 10:45 ?234次閱讀
    拒絕滲漏,安全、快速、有效的治理變壓器滲漏油

    精密空調(diào)—不得不服的精密空調(diào)"黑科技"!逆天了#精密空調(diào)

    精密空調(diào)
    北京匯智天源
    發(fā)布于 :2024年07月20日 12:33:01

    不得不愛的保護裝置-安全就這么簡單

    保護裝置
    jf_18500570
    發(fā)布于 :2024年07月01日 10:20:02

    3倍ROI,騰訊云卷出一個降本增效神器

    區(qū)。特別是在后疫情時代,競爭的激烈讓每一個身處其中的企業(yè),都不得不節(jié)約每一發(fā)“子彈”。當IT成本開始逐年走高,成為企業(yè)的重要支出時,如何有效降本就成了決策者不得不面對
    的頭像 發(fā)表于 06-19 08:05 ?139次閱讀
    3倍ROI,騰訊云卷出一個降本增效神器

    5v1.2a電源芯片U95123省心又省錢

    隨著商業(yè)模式和市場策略的不斷調(diào)整,許多客戶不得不開始尋求更加實用、經(jīng)濟的電源芯片解決方案。
    的頭像 發(fā)表于 04-17 17:18 ?959次閱讀

    特斯拉裁員背后原因 特斯拉最少裁員1.4萬人

    特斯拉近日掀起了一場裁員風暴,計劃裁員比例高達10%,這一消息瞬間引發(fā)了業(yè)界的廣泛關(guān)注。特斯拉的員工們也不得不面對職場上的巨變。
    的頭像 發(fā)表于 04-16 14:50 ?542次閱讀

    關(guān)于MCU選型不得不知的學問

    MCU選得好不好,往往決定著產(chǎn)品和商業(yè)OK不OK。 這個質(zhì)量,可能是芯片抗干擾強不強?能不能過產(chǎn)品認證? 也可能是在某一溫度能否穩(wěn)定運行? 還有可能是有些應(yīng)用外設(shè)有沒有坑?
    的頭像 發(fā)表于 04-15 10:16 ?381次閱讀

    美方持續(xù)收緊AI芯片對華出口限制,英偉達等巨頭面臨挑戰(zhàn)

    為了挽回中國市場,英偉達不得不做出妥協(xié),推出了符合美方限制政策的A100和A800芯片。
    的頭像 發(fā)表于 04-02 16:28 ?1081次閱讀

    計算機最核心的——CPU

    在CPU的四個結(jié)構(gòu)中,寄存器的重要性遠遠高于其余三個,為什么這么說?因為程序通常是把寄存器作為對象來進行描述的。而說到寄存器,就不得不說到匯編語言,說到匯編語言,就不得不說到高級語言,說起高級語言也就不得不提及語言的概念。
    發(fā)表于 03-13 14:04 ?1554次閱讀
    計算機最核心的——CPU

    企業(yè)組網(wǎng)如何兼顧低成本與高性能?

    在數(shù)字化浪潮席卷全球的今天,企業(yè)的網(wǎng)絡(luò)需求變得愈加復(fù)雜和多樣化。面對激烈的市場競爭,企業(yè)不得不尋求一種既能降低成本又能保證高性能的網(wǎng)絡(luò)解決方案。傳統(tǒng)組網(wǎng)方式雖然穩(wěn)定可靠,但昂貴的硬件投入和升級
    的頭像 發(fā)表于 02-26 14:59 ?354次閱讀

    什么是HPC高性能計算

    高性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機技術(shù),通過合理地組織計算機資源以及運用適合的算法和程序,提高計算效率和處理能力,實現(xiàn)對大量
    的頭像 發(fā)表于 02-19 13:27 ?770次閱讀
    什么是<b class='flag-5'>HPC</b>高性能計算

    怎么實現(xiàn)一個容器編排系統(tǒng)呢?

    隨著容器數(shù)量的增長,又不得不面對新的難題,就是大量的容器如何調(diào)度與通信?畢竟隨著業(yè)務(wù)發(fā)展,公司規(guī)模日益增長,線上運行著幾千個容器,并且按照現(xiàn)在的業(yè)務(wù)發(fā)展趨勢,馬上就要破萬了。
    的頭像 發(fā)表于 01-08 09:46 ?327次閱讀
    怎么實現(xiàn)一個容器編排系統(tǒng)呢?