11月15日,北京,中國超算“放榜日”。
隨著第二屆中國超級算力大會的舉行,2020中國高性能計算機(jī)性能排行榜TOP100揭曉。
榜單的前2位已經(jīng)五年沒有發(fā)生更迭,還是熟悉的兩個“前全球第一超算”——“神威·太湖之光”和“天河二號A”,它們分別部署在國家超級計算無錫中心和國家超級計算廣州中心(注!5年間機(jī)器有升級)。
榜單的第3、4位是新面孔。
其中,排在第3位的是北京超級云計算中心(A分區(qū))。其設(shè)備供應(yīng)方為戴爾科技集團(tuán),Linpack測試性能達(dá)3.743PFlops,峰值性能達(dá)7.035PFlops,采用AMD最新的霄龍處理器“羅馬”為其提供澎湃算力。北京超級云計算中心由中國科學(xué)院與北京市政府共建,位于北京市懷柔科學(xué)城。
榜單第4位是部署在內(nèi)蒙古和林格爾新區(qū)的“內(nèi)蒙古高性能計算公共服務(wù)平臺”,建設(shè)方為清華同方;5~10位由聯(lián)想深騰8800系列占據(jù)。排在榜最后一位的機(jī)器性能為1.869PFlops,較去年最后一位性能提升33.2%。
此次榜單看起來雖然變化不大,但綜合分析來看,仍有不少亮點。
01
國家超算的大國重器地位不動搖
榜單前兩位無錫超算和廣州超算,是國家超算的杰出代表。
眾所周知,兩臺設(shè)備都曾在全球超算TOP500排行榜上排名第一。其中,天河二號(含升級后的天河二號A)在2013年6月~2015年11月,連續(xù)六次在TOP500排名第一;神威·太湖之光在2016年6月~2017年12月,連續(xù)四次在TOP500排名第一。
當(dāng)然,兩大國家級超算的貢獻(xiàn)絕不止于TOP500的排名,二者對于推動我國超大規(guī)模計算機(jī)的研制、部署、軟件開發(fā)、應(yīng)用等方面同樣居功甚偉。
以神威·太湖之光為例。
自2016年該機(jī)器奪得全球第一超算的桂冠后,當(dāng)年,我國科學(xué)家楊超等人就憑借運行在其上的千萬核級應(yīng)用,首次摘得“高性能計算領(lǐng)域的諾貝爾獎”——戈登貝爾獎。這一最高獎項在此前的近30年中,一直被美國和日本壟斷。
此后的2017年,青年科學(xué)家付昊桓等人再次憑借基于神威·太湖之光的應(yīng)用“非線性地震模擬”幫助中國蟬聯(lián)“戈登貝爾獎”。
連續(xù)兩年將“戈登貝爾獎”收入囊中,對于推動我國超算應(yīng)用發(fā)展、提高我國超算軟實力,甚至提振中國超算士氣方面都有著重要意義。
當(dāng)然,作為國之重器,國家超算在承擔(dān)加速學(xué)科交叉和信息化發(fā)展、加速產(chǎn)業(yè)轉(zhuǎn)型與融合升級、培養(yǎng)復(fù)合型人才等國家使命方面也扮演著重要的角色。
就拿“天河二號A”來說,多年來一直向大氣—海洋環(huán)境模擬、天文地球物理、工業(yè)設(shè)計制造、生物醫(yī)藥健康等方面給予算力和計算應(yīng)用支撐。
02
通用和行業(yè)超算是重要補充
國家級超算都是大家伙、重武器,能夠負(fù)載萬核、十萬核甚至千萬核以上應(yīng)用。但是,在“國民經(jīng)濟(jì)主戰(zhàn)場”,更多的應(yīng)用是無法企及國之重器這樣的高度的,這也要求超算不能只是“王謝堂前燕”,還要“飛入尋常百姓家”。
簡單來說,國家超算是國家戰(zhàn)略計算裝備,不僅要有,還要盡量“大”,和世界一流水平同頻共振;而用于各行各業(yè)、作為生產(chǎn)工具的通用超算、行業(yè)超算,也同等重要,但這類設(shè)備追求的不是“大”,而是要追求通用、易用、好用。
這次Top100榜單排在第三位的北京超級云計算中心(A分區(qū)),別看它排名靠前,但它是不折不扣的、服務(wù)千行百業(yè)的通用超算,是國家超算重要的算力補充。
鑒于這一集群系統(tǒng)的代表性,加之此前該集群非常低調(diào),只有很少的公開信息,今次本文以相對長的篇幅做一些介紹和分析。
北京超級云計算中心(不要被名字迷惑,它不是我們常說的云計算,而是以云服務(wù)形式提供超算算力的平臺)于 2011 年依托中科院計算機(jī)網(wǎng)絡(luò)信息中心成立,北京北龍超級云計算有限責(zé)任公司負(fù)責(zé)運營,位于懷柔科學(xué)城。
本次上榜的是北京超級云計算中心的A分區(qū)(關(guān)于為何“分區(qū)”,后文詳述),算力規(guī)模為3.743PFlops,全部為通用X86超算。
通用X86超算在圈內(nèi)又被稱作“純CPU通用算力”,這類算力資源,由于生態(tài)完善、代碼可移植性強(qiáng)等原因,用戶友好度非常高。
更值得一提的是北京超級云計算中心提供算力的模式。正如其名,該中心以隨需供應(yīng)的“超級云計算服務(wù)”的模式向用戶提供算力,這是其最大的特點。
前面說超算要從“舊時王謝堂前燕”“飛入尋常百姓家”,怎么飛?北京超級云計算中心的實踐證明,“超級云計算服務(wù)模式”就是一種行之有效的方式。
來看幾個例子。
03
“超級云計算”的幾個案例
成立于1998年的“金風(fēng)科技”,是我國風(fēng)電事業(yè)發(fā)展的親歷者和推動者。金風(fēng)科技打造的仿真軟件“風(fēng)匠”系統(tǒng),是一款“更適合中國風(fēng)資源特征的仿真軟件”。依托北京超級云計算中心支持,金風(fēng)科技以北京超級云計算中心A分區(qū)為主資源,進(jìn)行風(fēng)資源評估相關(guān)的業(yè)務(wù)生產(chǎn)和產(chǎn)品研發(fā)。
為了滿足金風(fēng)科技不同業(yè)務(wù)部門需求,在計算資源方面,北京超級云計算中心為其提供了獨占、包核時等使用方式,同時提供數(shù)量和類型豐富的配置資源,這保障其能夠通過彈性擴(kuò)展,有效支撐高峰—平峰使用需求。
“經(jīng)在A分區(qū)的測試和日常生產(chǎn)使用,總體計算性能和速度,有明顯提升。”
金風(fēng)科技相關(guān)負(fù)責(zé)人在用戶試用報告中寫道:“在技術(shù)支持和資源效能方面,基于我方系統(tǒng)需求,提供了多種接入方式和技術(shù)支持,并提供了專屬的技術(shù)支持人員提供資源。在使用A分區(qū)資源計算過程中,系統(tǒng)未出現(xiàn)問題?!?/p>
提供以獨占、包核時的靈活使用模式來滿足計算資源需求,除金風(fēng)科技之外的受益者,還有一長串名字。
這其中就有自然資源部海洋環(huán)境科學(xué)與數(shù)值模擬重點實驗室。其首席科學(xué)家宋振亞說,A分區(qū)計算速度快、節(jié)點數(shù)量多、通信性能高、并行可擴(kuò)展性好,而且可通過多種方式使用,高效、便捷。
同時,該實驗室以萬核規(guī)模經(jīng)過一周以上的不間斷運行,系統(tǒng)也沒有出現(xiàn)問題,計算數(shù)據(jù)經(jīng)過驗證,結(jié)果正確,“說明該系統(tǒng)運行穩(wěn)定可靠”。宋振亞說,他們有計劃下一步將自主研發(fā)的短期氣候預(yù)測系統(tǒng)也移植到北京超級云計算中心A分區(qū)開展業(yè)務(wù)運行。
中科院院士、中科院物理所研究員向濤團(tuán)隊課題組,是我國在凝聚態(tài)物理研究方面的重要力量,他們課題組長期致力于“張量重正化群方法”的發(fā)展和應(yīng)用。而要發(fā)展和應(yīng)用這種方法所需的算力,不僅須滿足多核心并行,還要有大的內(nèi)存支撐。
北京超級云計算中心A分區(qū)的計算資源,單節(jié)點64核心、內(nèi)存高達(dá)256G,恰能滿足向濤院士課題組對計算資源的要求。很快,A分區(qū)就成了該課題組科學(xué)研究的有力工具。
“我們體會到了省時省力?!?/p>
向濤院士課題組研究人員評價說,A分區(qū)的存在,簡化了計算資源的維護(hù)、降低了調(diào)試成本,打破了他們一開始對計算資源運維的“心理恐懼”。
上邊這3個案例,都是本次榜單上北京超級云計算中心A分區(qū)的“光榮事跡”。
前面也有提到,A分區(qū)只是北京超級云計算中心的一個主力分區(qū),除A分區(qū)外,北京超級云計算中心還有T分區(qū)、M分區(qū)、IO分區(qū),還有科技云9分區(qū)、12分區(qū)、15分區(qū)、17分區(qū)、19分區(qū)等等。
為什么要劃分這么多分區(qū)?
對于超算的需求方而言,他們對超算的需求是多種多樣的——有的需要更燃的計算,有的需要更多內(nèi)存,有的需要更快的數(shù)據(jù)傳輸。而所有這些分區(qū),都是因向?qū)τ嬎阗Y源有不同需求的用戶提供更便捷高效的服務(wù)而存在的。
北京超級云計算中心還在不斷動態(tài)擴(kuò)容、不斷“分蘗”,也顯示了其以用戶服務(wù)為核心,“將超級云計算服務(wù)模式進(jìn)行到底”的決心。
04
中國超算既要“捅破天” 還要“接地氣”
超算是重要的基礎(chǔ)工具。沒有“神威·太湖之光”、“天河二號”、“曙光星云”等這些大國重器,我們就無法實現(xiàn)尖端科技的突破,無法不斷向科學(xué)技術(shù)廣度和深度進(jìn)軍。
但同時也應(yīng)看到,我國經(jīng)濟(jì)社會的進(jìn)步、各行各業(yè)升級發(fā)展的需求日益迫切,也在呼喚能夠更接地氣的海量計算應(yīng)用,呼喚北京超級云計算中心、阿里云、華為云等一系列能夠提供超級算力、提供計算服務(wù)、提供大數(shù)據(jù)處理能力的行業(yè)貢獻(xiàn)者。
還應(yīng)指出的是,“計算”作為一種支撐和工具,它還只是先進(jìn)生產(chǎn)力鏈條中的一個環(huán)節(jié)。在計算之外,數(shù)據(jù)的采集與處理、軟件的設(shè)計與調(diào)優(yōu)、模型模式的開發(fā)等等,需要行業(yè)內(nèi)外更多人的參與。
今天榜單上的所有集群,都只是超算作為硬件形態(tài)的一個體現(xiàn)。這一個個的“大家伙”要變成真正的生產(chǎn)力,需要跨越超算硬件與應(yīng)用之間的“死谷”。
北京超級云計算中心在解決這個問題上想到和實踐的方法是“超級云計算服務(wù)模式”,但這就夠了嗎?
美國在超算部署上一直有制定詳盡的計劃。從國家戰(zhàn)略計算計劃(著名的NSCI計劃),到美國能源部制定實施的百億億次計算研發(fā)項目(ECP計劃),都強(qiáng)調(diào)多部門協(xié)同、更重視應(yīng)用。
特別是ECP計劃,美國計劃5年投入“18億美元+18億美元”,一半用于E級計算機(jī)研制,一半用于研發(fā)應(yīng)用。
超算行業(yè)專家、中山大學(xué)數(shù)據(jù)科學(xué)與計算機(jī)學(xué)院院長錢德沛曾總結(jié)中國超算應(yīng)用上的弱點:缺乏應(yīng)用軟件、缺乏人才、缺乏有效合作。說到底,我們更需要一個完善的“超算用起來”的環(huán)境。
無論國家超算、通用超算、行業(yè)超算、商業(yè)超算,存在形態(tài)真的無大所謂,可以兼容并收,但要用起來。只有形成了一個健康的應(yīng)用生態(tài),中國超算,才算真的頂天立地。
責(zé)編AJX
-
超級計算機(jī)
+關(guān)注
關(guān)注
2文章
459瀏覽量
41906
發(fā)布評論請先 登錄
相關(guān)推薦
評論