電子發(fā)燒友網(wǎng)報道(文/吳子鵬)6月13日,在2022阿里云峰會上,阿里云智能總裁、阿里巴巴達摩院院長張建鋒表示,阿里云今年最重要策略是“Back to Basic”,回到云計算的本質(zhì),堅持技術(shù)長征。
阿里云智能總裁、阿里巴巴達摩院院長張建鋒
圖源:阿里云
圍繞這一核心主題,張建鋒詳細介紹阿里云新一代云數(shù)據(jù)中心處理器CIPU,以及與其相關(guān)聯(lián)的飛天操作系統(tǒng)、神龍計算層架構(gòu)等等。
圖源:阿里云
專為云數(shù)據(jù)中心打造的CIPU
從CIPU的名字來看,大家都有一種很熟悉的感覺,因為它和處理器CPU僅僅只有一個字母“I”的差別。但實際上,CIPU和CPU有明顯的不同,CIPU是Cloud Infrastructure Processing Units的簡稱,中文釋義為云基礎(chǔ)設(shè)施處理器,是為新型云數(shù)據(jù)中心設(shè)計的專用處理器。
當然,CIPU和CPU也有一層深層的關(guān)系,CIPU在云數(shù)據(jù)中心領(lǐng)域是CPU的替代者,成為新的算力引擎。
我們先看一下CIPU提出的背景,傳統(tǒng)數(shù)據(jù)中心以CPU為核心進行打造,經(jīng)過歷年來的不斷優(yōu)化,這種方式已經(jīng)觸及到了天花板,在性能、功耗和時延等方面有著明顯的瓶頸限制。與此同時,數(shù)據(jù)中心在需求端的明顯變化進一步放大了這一短板,數(shù)據(jù)密集型的計算需求不斷涌現(xiàn),低時延和高帶寬都是必要的參數(shù)配置,而滿足這些需求的前提是更加低碳環(huán)保。
此外,目前全球都在規(guī)模性部署超大型數(shù)據(jù)中心。根據(jù)市場調(diào)研公司Synergy Research Group的數(shù)據(jù)分析,目前全球擁有314個超大型數(shù)據(jù)中心,未來3年的時間內(nèi)將增加到1000個。張建鋒指出,基于CPU為中心的架構(gòu)無法解決超大規(guī)模的復雜管理問題。
作為CPU在云數(shù)據(jù)中心領(lǐng)域的繼任者,張建鋒介紹稱CIPU主要有以下幾點重要特性:
?網(wǎng)絡(luò):對高帶寬物理網(wǎng)絡(luò)進行硬件加速,通過建設(shè)大規(guī)模的eRDMA分布式高性能網(wǎng)絡(luò),實現(xiàn)RDMA技術(shù)的普惠化;
?存儲:對存算分離架構(gòu)的塊存儲接入進行硬件加速,提供超高性能的云盤;
?計算:快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。
上面更多是質(zhì)變的描述,我們看一下量變的情況。根據(jù)張建鋒的介紹,CIPU在主流通用計算場景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%;大數(shù)據(jù)和AI 場景下,AI深度學習場景訓練性能提升30%,Spark計算性能提升30%。
在存儲方面,CIPU存儲時延最低可至30us(PLX),IOPS高達300萬,存儲帶寬可達200 Gbps,全面超越市面上所有云產(chǎn)品。
在網(wǎng)路傳輸方面,CIPU基礎(chǔ)帶寬從100G升級至200G,VPC的PPS轉(zhuǎn)發(fā)性能從2000萬提升至4000萬,網(wǎng)絡(luò)時延從22us降低至16us,RDMA協(xié)議下更可低至5.5us。
阿里云CIPU性能參數(shù),圖源:阿里云
更需要特別指出的是,CIPU并不是一個獨立的高性能硬件,而是一個硬件基礎(chǔ),它可對計算資源進行云化加速,并可部署飛天操作系統(tǒng)對云資源進行管控。和阿里云當前的飛天架構(gòu)和神龍架構(gòu)結(jié)合,都能夠迸發(fā)出1+1大于2的效果。
阿里云的軟硬件一體化布局
當前,全球數(shù)據(jù)中心的發(fā)展已經(jīng)步入新階段,數(shù)據(jù)中心的構(gòu)建和對算力的需求都發(fā)生了巨大的變化,傳統(tǒng)通用處理器已經(jīng)越來越難以滿足這些情況變化。我們看到,不僅僅是阿里云,各個大型數(shù)據(jù)中心運營商都在致力于自研專用處理器,配合自家的架構(gòu)體系,以求在功耗、時延和性能等方面打造最佳的平衡。
近幾年阿里云在軟硬件方面持續(xù)投入,收獲頗豐,并逐漸實現(xiàn)自家軟硬件的深度融合。
回顧2021阿里云峰會,阿里云宣布,飛天操作系統(tǒng)正在全面兼容X86、ARM、RISC-V等多種芯片架構(gòu),實現(xiàn)“一云多芯”。按照阿里云的描述,“一云多芯”的實現(xiàn)讓阿里云成為全球支持CPU種類最多的云廠商。
隨后2021阿里云棲大會上,阿里云又發(fā)布首款通用芯片倚天710,采用最新ARMv9架構(gòu),多達128核,主頻最高3.2GHz,可同時兼顧性能和功耗,適配云的不同應用場景。2022年4月,基于倚天710的公共云 ECS實例已上線邀測。硬件方面,阿里云還在去年發(fā)布了自研的磐久服務(wù)器。
而為了能夠最大化釋放這些硬件的潛能,阿里云在云數(shù)據(jù)中心部署各個關(guān)鍵節(jié)點都發(fā)布了自研的基礎(chǔ)架構(gòu)和核心平臺。為解決服務(wù)器長久以來的虛擬化性能損耗的問題,阿里云在計算層推出了自研的神龍架構(gòu),神龍與CIPU結(jié)合,可將虛擬化轉(zhuǎn)移到專用硬件中進行加速,可將物理機的高性能與虛擬機的靈活性融為一體,虛擬化損耗幾乎為零,并帶來更強勁的性能表現(xiàn);為提升存儲傳輸速度、安全防護和容災能力等,阿里云在存儲層推出了自研的盤古架構(gòu),是阿里云底層的統(tǒng)一存儲架構(gòu),采用了分布式系統(tǒng)先進的容錯架構(gòu)和柔性平臺設(shè)計,具備彈性伸縮、自動負載均衡等能力,大幅提高了存儲系統(tǒng)的可靠性和安全性,可支持塊存儲、對象存儲、表格存儲、文件存儲、離線大數(shù)據(jù)處理等多種存儲模式;為了實現(xiàn)“讓網(wǎng)絡(luò)更簡單”的理念,阿里云推出自研的洛神核心技術(shù)平臺,支撐起百萬級的用戶業(yè)務(wù)部署,讓更多能夠人體驗到云計算帶來的高效便捷服務(wù),2021云棲大會上,阿里云更新推出了洛神云網(wǎng)絡(luò)3.0新平臺架構(gòu)。
在軟硬件如此多元化和大范圍的投入,阿里云的目的是在提供更好算力支持的情況下,打造更加綠色的數(shù)據(jù)中心。根據(jù)Supermicro發(fā)布的《數(shù)據(jù)中心與環(huán)境2021綠色數(shù)據(jù)中心現(xiàn)狀分析報告》,目前全球數(shù)據(jù)中心已占全球發(fā)電總量近3%,預計到2030年將快速增加到8%,也有可能接近一成。
張建鋒表示,阿里云是國內(nèi)最早實踐綠色數(shù)據(jù)中心的廠商之一,目前阿里云自建的數(shù)據(jù)中心都已達到國家綠色數(shù)據(jù)中心標準,全年平均PUE小于1.3。
-
云計算
+關(guān)注
關(guān)注
39文章
7704瀏覽量
137118 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4632瀏覽量
71898 -
阿里云
+關(guān)注
關(guān)注
3文章
934瀏覽量
42932
發(fā)布評論請先 登錄
相關(guān)推薦
評論