0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

lPCU_elecfans ? 來源:未知 ? 2022-12-06 07:20 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在近期舉辦的Re:Invent大會(huì)上,亞馬遜為其AWS云服務(wù)公布了上線全新的EC2實(shí)例,分別是C7gn、HPC7g和R7iz。R7iz用到了英特爾最新的第四代Xeon Scalable處理器Sapphire Rapids,而HPC7g則是由新處理器Graviton3E來驅(qū)動(dòng)的。與此同時(shí),AWS還在本次會(huì)議上公布了第五代Nitro芯片Nitro v5和第二代推理芯片AWS Inferentia 2,其中Graviton3E和Nitro v5都是基于Arm架構(gòu)打造的。

性能更上一層樓的Graviton3E

在HPC領(lǐng)域,Arm的出鏡率還是比較低的,除了像富岳超算這樣的頂級(jí)存在外,我們很少看到云服務(wù)廠商基于Arm芯片來打造HPC計(jì)算集群,Graviton的出現(xiàn)可謂改變了這一點(diǎn)。AWS在2020年推出的C6gn實(shí)例,就是基于其Graviton2處理器打造的,相較基于第二代AMD EPYC處理器的C5實(shí)例,C6gn做到了成本低上20%,性能卻高上40%的表現(xiàn)。

Graviton3E在不同負(fù)載下的性能提升 / 亞馬遜
根據(jù)亞馬遜給出的數(shù)據(jù),Graviton3E在Graviton3的基礎(chǔ)上再加改良,以測(cè)試浮點(diǎn)性能的基準(zhǔn)HPL為例,Graviton3E將矢量指令處理性能再度提高了35%。而HPC7g實(shí)例相比基于Graviton2的C6gn實(shí)例,更是將浮點(diǎn)性能拔高至兩倍,比基于第3代AMD EPYC 7003系列48核處理器的HPC6a實(shí)例,性能上也能高出20%,可以說是AWS上性價(jià)比最高的HPC實(shí)例了。
如今的亞馬遜已經(jīng)有了100多個(gè)不同的Graviton實(shí)例,供使用者靈活選擇。而且讓Graviton充分發(fā)揮作用的不僅是AWS EC2這樣的彈性計(jì)算云服務(wù),還有Fargate這樣無需管理實(shí)例的服務(wù),也獲得了不小的性能提升。
然而對(duì)于大部分云服務(wù)廠商來說,他們首推的實(shí)例很多依然是基于x86的,這不禁讓人深思,真的會(huì)有大型公司選擇了Arm服務(wù)器芯片嗎?亞馬遜給出了肯定的答案,也介紹了Graviton極快的普及速度。
從亞馬遜給出的合作伙伴中,我們可以看到大宇無限、Epic、Lyft、Zoom等公司,都選了圍繞Graviton芯片來構(gòu)造他們的產(chǎn)品服務(wù)。比如美國電視串流服務(wù)DirectTV在使用Graviton 3的實(shí)例后,成本減少了20%的同時(shí),延遲也有了最高50%的降低,使得他們能在訪問流量變化巨大的同時(shí)靈活擴(kuò)展容量,還能保證性能不受影響。

加劇DPU和AI芯片內(nèi)卷的Nitro和Inferentia

對(duì)于多數(shù)超大規(guī)模數(shù)據(jù)中心和云服務(wù)廠商來說,他們的DPU往往來自第三方,比如英偉達(dá)的BlueField、AMD的Pensando等,而亞馬遜旗下的Annapurna Labs,則成了AWS DPU產(chǎn)品的Nitro的幕后功臣。

Nitro v5芯片 / 亞馬遜
而這次Annapurna Labs設(shè)計(jì)的Nitro v5在性能上再度實(shí)現(xiàn)了飛躍,亞馬遜展示的數(shù)據(jù)上提到,Nitro v5相較上一代集成了兩倍的晶體管數(shù)目,在算力上提升近兩倍,擁有快上50%的DRAM速度,PCIe帶寬也提升至兩倍。由此可以看出,Nitro v5應(yīng)該選擇了更先進(jìn)的工藝,DRAM和PCIe也換成了最新一代。
在實(shí)際測(cè)試中,Nitro v5可以提高最多60%的吞吐量,降低30%的延遲,在能效比上也有了40%的提升。正是因?yàn)橛兄@樣強(qiáng)大的性能,AWS選擇了將其集成到C7gn、HPC7g實(shí)例中去,與Graviton3和Graviton3E一起實(shí)現(xiàn)200Gbps的超高網(wǎng)絡(luò)性能。
大型語言模型的出現(xiàn)推動(dòng)深度學(xué)習(xí)進(jìn)入了下一個(gè)階段,但龐大的參數(shù)量加大了推理所需的算力和成本。2019年,AWS的Inferentia芯片第一代出現(xiàn)在Inf1實(shí)例上,為用戶提供了性價(jià)比優(yōu)于GPU實(shí)例的選項(xiàng),但彼時(shí)的深度學(xué)習(xí)模型還大多數(shù)停留在數(shù)百萬個(gè),如今某些深度學(xué)習(xí)模型的參數(shù)已經(jīng)超過了數(shù)百億,比如百度的PLATO-XL對(duì)話生成模型、亞馬遜的AlexaTM等。
為此,Annapurna Labs拿出了全新的Inferentia2芯片,最高可支持到1750億參數(shù)的大型深度學(xué)習(xí)模型。基于Inferentia2芯片的Inf2實(shí)例也首次支持到分布式推理,將大型模型分布到多個(gè)芯片上進(jìn)行推理。與上一代Inf1實(shí)例相比,Inf2可以提供高達(dá)4倍的吞吐量和10分之一的延遲,與GPU實(shí)例相比更是將能效提高了50%之多。

小結(jié)

這樣頻繁的芯片發(fā)布節(jié)奏,足以看出亞馬遜在自研服務(wù)器芯片上已經(jīng)到了一個(gè)新的高度。不得不承認(rèn),亞馬遜早在2016年就收購Annapurna Labs是一個(gè)多么具有前瞻性的戰(zhàn)略決策,在云服務(wù)廠商競(jìng)爭愈演愈烈的當(dāng)下,擁有自研可控的服務(wù)器芯片無疑是殺手锏。雖然谷歌、阿里巴巴等廠商也都加入到了自研服務(wù)器芯片的行列中來,但與亞馬遜的AWS相比,在產(chǎn)品陣容和布局時(shí)間上還是有所差距。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。


更多熱點(diǎn)文章閱讀

  • 馬斯克:預(yù)計(jì)6個(gè)月后進(jìn)行大腦芯片的人體試驗(yàn),愿意給自己孩子植入
  • 硅料降價(jià)拐點(diǎn)來臨,光伏市場(chǎng)有望重啟裝機(jī)潮
  • 造車新勢(shì)力11月銷量:哪吒第一,蔚理進(jìn)前三,小鵬依舊墊底
  • 行業(yè)機(jī)構(gòu)頻發(fā)警報(bào) 2023年全球半導(dǎo)體市場(chǎng)面臨下滑風(fēng)險(xiǎn)
  • 富士康失去iPhone 14 Pro獨(dú)家代工資格!立訊和碩上位,果鏈格局大變?


原文標(biāo)題:再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    亞馬遜AWSAI芯片崛起,挑戰(zhàn)英偉達(dá)

    近期,據(jù)路透社獨(dú)家報(bào)道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實(shí)驗(yàn)室中,六位來亞馬遜AWS的工程師正在對(duì)一種尚未公開透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開深入測(cè)試。這一關(guān)鍵事件引人注
    的頭像 發(fā)表于 07-27 14:33 ?874次閱讀

    亞馬遜正測(cè)試一款融入AI芯片的新型服務(wù)器設(shè)計(jì)

    在得克薩斯州奧斯汀的秘密芯片實(shí)驗(yàn)室中,亞馬遜正緊鑼密鼓地測(cè)試一款高度保密的新型服務(wù)器設(shè)計(jì),該設(shè)計(jì)融入了亞馬遜自主研發(fā)的AI芯片,旨在與業(yè)界巨
    的頭像 發(fā)表于 07-26 14:21 ?398次閱讀

    服務(wù)器和虛擬服務(wù)器的區(qū)別是什么

    服務(wù)器和虛擬服務(wù)器是兩種常見的服務(wù)器類型,它們?cè)诤芏喾矫嬗邢嗨浦帲灿幸恍╆P(guān)鍵的區(qū)別。本文將詳細(xì)介紹云服務(wù)器和虛擬服務(wù)器的區(qū)別,包括它
    的頭像 發(fā)表于 07-02 09:48 ?330次閱讀

    蘋果計(jì)劃搭建芯片驅(qū)動(dòng)的AI數(shù)據(jù)中心

    據(jù)內(nèi)部人士透露,蘋果已將自芯片應(yīng)用于云計(jì)算服務(wù)器,用以支持其設(shè)備未來的高級(jí)AI服務(wù)。目前我們尚未收到蘋果方面對(duì)此事的回應(yīng)。
    的頭像 發(fā)表于 05-10 16:31 ?409次閱讀

    高通服務(wù)器芯片"SD1"揭曉,核心搭載Oryon

    據(jù)國外科技媒體Android Authority透露,高通公司在公布驍龍X Elite / Plus芯片之后,內(nèi)部正在研發(fā)代號(hào)為“SD1”、內(nèi)置Oryon處理服務(wù)器芯片。
    的頭像 發(fā)表于 04-26 10:16 ?486次閱讀

    蘋果AI服務(wù)器芯片,預(yù)計(jì)2025年臺(tái)積電3nm工藝

    4 月 24 日,知名數(shù)碼博主@手機(jī)晶片達(dá)人發(fā)布動(dòng)態(tài),爆料蘋果正研發(fā)自家 AI 服務(wù)器芯片,預(yù)計(jì) 2025 年下半年量產(chǎn),采用臺(tái)積電 3nm 制程。
    的頭像 發(fā)表于 04-24 11:00 ?725次閱讀

    linux服務(wù)器和windows服務(wù)器

    Linux服務(wù)器和Windows服務(wù)器是目前應(yīng)用最廣泛的兩種服務(wù)器操作系統(tǒng)。兩者各有優(yōu)劣,也適用于不同的應(yīng)用場(chǎng)景。本文將 對(duì)Linux服務(wù)器和Windows
    發(fā)表于 02-22 15:46

    微軟正在研發(fā)新型網(wǎng)卡,旨在提升AI芯片性能

    微軟近日被曝正在秘密研發(fā)一款高性能的新型網(wǎng)卡,這一創(chuàng)新旨在增強(qiáng)其的Maia AI服務(wù)器芯片的功能,并可能大幅度降低對(duì)外部芯片設(shè)計(jì)廠商如英
    的頭像 發(fā)表于 02-21 11:01 ?599次閱讀

    獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別

    獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別是很多用戶在選擇服務(wù)器時(shí)要做的課程,那么獨(dú)立服務(wù)器和云服務(wù)器的區(qū)別有哪些呢?
    的頭像 發(fā)表于 01-17 10:58 ?669次閱讀

    蘋果Wi-Fi芯片之路充滿挑戰(zhàn)

    據(jù)悉,蘋果在5G調(diào)制解調(diào)芯片上投入了大量資金,如今希望在Wi-Fi
    的頭像 發(fā)表于 12-26 14:46 ?607次閱讀

    邊緣計(jì)算新篇章:亞馬遜云科技海外服務(wù)器服務(wù)成就全球創(chuàng)新

    2022年亞馬遜云科技re:Invent盛會(huì)于近日在拉斯維加斯成功召開,吸引了眾多業(yè)界精英和創(chuàng)新者。亞馬遜云科技邊緣服務(wù)副總裁Jan Hofmeyr在演講中分享了關(guān)于亞馬遜云科技海外
    的頭像 發(fā)表于 12-21 15:45 ?354次閱讀
    邊緣計(jì)算新篇章:<b class='flag-5'>亞馬遜</b>云科技海外<b class='flag-5'>服務(wù)器</b><b class='flag-5'>服務(wù)</b>成就全球創(chuàng)新

    服務(wù)生態(tài)演進(jìn):亞馬遜云科技輕量應(yīng)用服務(wù)器應(yīng)對(duì)復(fù)雜需求

    難度、使用和管理流程,提供了獨(dú)立的產(chǎn)品控制臺(tái),并一站式融合了常用基礎(chǔ)云服務(wù),是眾多企業(yè)上云的理想選擇。 隨著輕量應(yīng)用服務(wù)器的逐漸興起,各大服務(wù)器提供商也開始在這一領(lǐng)域加大投入。Amazon Lightsail作為
    的頭像 發(fā)表于 12-21 09:06 ?435次閱讀
    云<b class='flag-5'>服務(wù)</b>生態(tài)演進(jìn):<b class='flag-5'>亞馬遜</b>云科技輕量應(yīng)用<b class='flag-5'>服務(wù)器</b>應(yīng)對(duì)復(fù)雜需求

     物理服務(wù)器和大寬服務(wù)器怎么選

    種形式,分別是塔式服務(wù)器、機(jī)架服務(wù)器、刀片服務(wù)器,它們每一種的應(yīng)用場(chǎng)景均不同。例如,如果空間不夠大,可以選擇塔式服務(wù)器。
    的頭像 發(fā)表于 12-20 10:50 ?440次閱讀

    亞馬遜再發(fā)兩款芯片,訓(xùn)練芯片時(shí)隔年迎來更新

    時(shí)隔數(shù)年終于更新的Trainium2。 ? 第四代Arm服務(wù)器CPU ? 從2018年11月,到今年的11月,Gravition這一亞馬遜
    的頭像 發(fā)表于 11-30 00:09 ?1404次閱讀

    亞馬遜云科技Amazon Lightsail(VPS)虛擬專用服務(wù)器,價(jià)格低廉且可預(yù)測(cè)

    亞馬遜云科技可以通過將虛擬機(jī)和存儲(chǔ)服務(wù)提供給開發(fā)者,用戶不需要構(gòu)建自己的服務(wù)器,獲取計(jì)算和存儲(chǔ)能力,并且可以像水電一樣隨取隨用。 這才有了我們今天可以探討的主題:VPS。 那么什么是VPS呢? VPS就是虛擬專用
    的頭像 發(fā)表于 10-26 17:25 ?582次閱讀
    <b class='flag-5'>亞馬遜</b>云科技Amazon Lightsail(VPS)虛擬專用<b class='flag-5'>服務(wù)器</b>,價(jià)格低廉且可預(yù)測(cè)