0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

192個自研核心,AmpereOne的絕對性能壓制

安晟培半導(dǎo)體 ? 來源:電子發(fā)燒友網(wǎng) ? 2023-06-13 15:03 ? 次閱讀

亞馬遜、英偉達和阿里巴巴等廠商紛紛圍繞Arm Neoverse架構(gòu)打造服務(wù)器處理器之際,Ampere Computing選擇了一條與眾不同的路線,自研核心。近日,Ampere宣布推出全新的AmpereOne系列處理器,可配置多達192個核心,且這些都是基于Ampere自有IP打造的自研核心。

Ampere Altra到AmpereOne,Ampere的自研之路

f249cb88-0985-11ee-962d-dac502259ad0.png

Ampere Altra與AmpereOne對比 / Ampere Computing 憑借前兩代Ampere Altra系列產(chǎn)品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服務(wù)器CPU領(lǐng)域的先行者之一。主流的大型云服務(wù)廠商(CSP)都已經(jīng)推出了基于這兩款CPU的服務(wù)器,如京東云就在近日推出了其首款基于Arm架構(gòu)的云主機,搭載的正是Ampere Altra Max CPU。 CSP廠商紛紛擁抱Arm的原因很簡單,高并發(fā)、高算力和更低的價格,為上云提供了極具性價比的選擇。但如何做好差異化,是每個Arm服務(wù)器CPU廠商都需要思考的問題,比如英偉達選擇了與自己的GPU結(jié)合打造Grace Hopper這樣的SuperChip。 而擁有Arm ISA架構(gòu)授權(quán)的Ampere選擇了從微架構(gòu)上進一步創(chuàng)新,打造自研的Arm云原生核,從絕對性能和可擴展性上超越同類產(chǎn)品。單個AmpereOne CPU的可配置核心已經(jīng)達到192個,比上一代的Ampere Altra Max多出了50%,內(nèi)核數(shù)為業(yè)界最高。 這意味著基于AmpereOne CPU的單機架性能將再創(chuàng)新高,為了匹配新CPU強大計算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設(shè)計,斷絕了內(nèi)存帶寬和I/O性能上出現(xiàn)瓶頸的可能。針對高速增長的云原生應(yīng)用,AmpereOne還集成了一系列新特性,包括網(wǎng)格擁塞管理、細粒度電源管理和內(nèi)存標(biāo)簽等。Ampere表示,AmpereOne將幫助該公司進一步擴大在每機架性能方面的優(yōu)勢。 Ampere首席產(chǎn)品官Jeff Wittich:“192 核是一個非常大的數(shù)字,比英特爾AMD 要多很多。用一個具體的場景來說明,在云環(huán)境中運行虛擬機時,用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機架運行的虛擬機數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍?!?/p>

AmpereOne發(fā)力Chiplet與AI推理

得益于工藝的進步和架構(gòu)的創(chuàng)新,AmpereOne能做到如此規(guī)格似乎并不意外,但能在Ampere Altra Max面世后的短時間內(nèi)推出這樣一個“性能怪獸”,其實也離不開在設(shè)計方法上的轉(zhuǎn)變。從AmpereOne的架構(gòu)可以看出,與此前Ampere Altra系列不同的是,新的處理器轉(zhuǎn)為采用Chiplet設(shè)計。近來不少先進芯片設(shè)計中都采用了這一技術(shù),電子發(fā)燒友網(wǎng)也就這一轉(zhuǎn)變詢問了Ampere,Chiplet究竟有何助力,是否加快了芯片設(shè)計周期? Jeff Wittich指出:“綜合而言,我們在Ampere中轉(zhuǎn)為大量采用小芯片帶來了許多的優(yōu)勢,其中第一點就是能夠有更高的靈活度,第二點就是如問題中提到的,幫助我們加快了整個芯片設(shè)計周期。在采用了Chiplet架構(gòu)之后,產(chǎn)品的TTM也會隨之縮短,還可以提供更高的可擴展性,從而提供現(xiàn)代云原生CPU的最佳性能。第三,Chiplet拓撲的設(shè)計也可以使AmpereOne更輕易地實現(xiàn)內(nèi)存到內(nèi)核的訪問,而不需要為處理器引入額外的HOPs?!?另外值得注意的一點是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發(fā)布服務(wù)器的定位來看,其主要還是用于Web服務(wù)、視頻編解碼以及云游戲等非AI應(yīng)用上。而此次發(fā)布的AmpereOne,則在AI計算上加大了力度。

f29d8df4-0985-11ee-962d-dac502259ad0.png

AI推理性能對比 / Ampere 從性能對比上,我們可以看出AmpereOne在AI推理負載上的領(lǐng)先,比如在生成式AI和推薦算法上,AmpereOne的單機架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統(tǒng)功耗,AmpereOne的優(yōu)勢在此展現(xiàn)得一覽無余。 這與Ampere自身的發(fā)展以及行業(yè)趨勢也緊密相關(guān),AI負載已經(jīng)成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態(tài)。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協(xié)同優(yōu)化,為AmpereOne提供卓越的AI性能,比如對BF16精度的支持等等。

解決性能與能效的矛盾

f2d2b5e2-0985-11ee-962d-dac502259ad0.png

服務(wù)器CPU的能效象限 / Ampere Computing 在Ampere公布今年的路線圖時,創(chuàng)始人/董事長兼首席執(zhí)行官Renée J. James表示:“Ampere已經(jīng)向行業(yè)證明,擊破單核性能與能耗之間的矛盾正是行業(yè)所有人都在尋找的新象限。在能耗與性能的坐標(biāo)軸之中,朝坐標(biāo)軸的右下方移動是行業(yè)發(fā)展的新常態(tài),目的是實現(xiàn)更低的能耗和更高的性能?!?針對云計算的需求,在設(shè)計產(chǎn)品的過程中,Ampere借助Arm架構(gòu)的優(yōu)勢,綜合考量從核、SoC到其他方面的因素,致力于實現(xiàn)每瓦性能、每機架性能的提升。對比x86架構(gòu)的CPU,Ampere Altra系列的的云原生處理器可以實現(xiàn)每機架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發(fā)布的AmpereOne將幫助Ampere進一步擴大領(lǐng)先優(yōu)勢。 Jeff Wittich表示:“其實我們Ampere Altra系列處理器已經(jīng)提供了行業(yè)領(lǐng)先的單機架性能,在能效方面已經(jīng)是行業(yè)標(biāo)桿性的產(chǎn)品。不僅是在性能方面,在能效方面我們也是領(lǐng)先AMD和英特爾所有的產(chǎn)品,即使是他們近期發(fā)布的低功耗產(chǎn)品。”

寫在最后

誠然,對于大部分服務(wù)器CPU而言,面向的客戶都是CSP和服務(wù)器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質(zhì)量方案。不少Arm服務(wù)器CPU,雖然都在設(shè)計上做了差異化,但計算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點,可擴展性與規(guī)?;?。 成立5年多來,Ampere,已經(jīng)在x86壟斷的服務(wù)器市場占領(lǐng)了一席之地。在一切背后,是Ampere 認為云需要一種從本質(zhì)上而言完全不同的方法。隨著所有的計算轉(zhuǎn)移到云端,整個平臺的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進行徹底的CPU創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10698

    瀏覽量

    209330
  • OEM
    OEM
    +關(guān)注

    關(guān)注

    4

    文章

    397

    瀏覽量

    50119
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8700

    瀏覽量

    84534

原文標(biāo)題:媒體視角|192個自研核心,AmpereOne的絕對性能壓制

文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    蘋果Wi-Fi芯片或明年商用,用于部分iPad

    9月20日最新資訊顯示,蘋果公司在芯片領(lǐng)域的成就斐然,其標(biāo)志性的A系列芯片在iPhone和iPad上持續(xù)多年引領(lǐng)性能巔峰,而2020年起推出的M系列芯片更是成功助力Mac產(chǎn)品線完
    的頭像 發(fā)表于 09-20 16:23 ?302次閱讀

    消息稱小鵬汽車智駕芯片流片成功

    小鵬汽車近期傳來振奮人心的消息,其自主研發(fā)的智能駕駛芯片已成功完成流片,標(biāo)志著小鵬在核心技術(shù)領(lǐng)域邁出了堅實的一步。據(jù)知情人士透露,這款小鵬智駕芯片專為滿足高度智能化的駕駛需求而生,采用先進的端到端大模型設(shè)計理念,構(gòu)建了一套艙
    的頭像 發(fā)表于 08-28 15:37 ?391次閱讀

    國產(chǎn)車企智駕芯片加速落地,蔚來小鵬等領(lǐng)跑賽道

    在智能汽車產(chǎn)業(yè)加速變革的浪潮中,中國車企正以前所未有的決心和速度推進核心技術(shù),特別是在智能駕駛芯片這一關(guān)鍵領(lǐng)域,蔚來、小鵬等頭部企業(yè)已邁出堅實步伐,
    的頭像 發(fā)表于 07-11 16:20 ?865次閱讀

    Ampere下一代AmpereOne系列處理器將擁有256核心

    雖然訓(xùn)練 AI 需要超強大的 GPU 算力,但 AI 算法的執(zhí)行首先需要超高效的芯片。就像 AmpereCPU,未來的 AmpereOne 將擁有不少于256內(nèi)核,其功率僅為350W。(原文轉(zhuǎn) Adrian Branco 發(fā)
    的頭像 發(fā)表于 06-18 14:35 ?426次閱讀

    理想汽車大模型Mind GPT通過國家備案

    理想汽車近日宣布,其全的多模態(tài)認知大模型Mind GPT已正式通過國家《生成式人工智能服務(wù)管理暫行辦法》備案,成為汽車行業(yè)中首個成功通過該備案的大模型。這一里程碑式的成就,彰顯
    的頭像 發(fā)表于 03-29 11:05 ?478次閱讀

    微軟正在研發(fā)新型網(wǎng)卡,旨在提升AI芯片性能

    微軟近日被曝正在秘密研發(fā)一款高性能的新型網(wǎng)卡,這一創(chuàng)新旨在增強其的Maia AI服務(wù)器芯片的功能,并可能大幅度降低對外部芯片設(shè)計廠商如英偉達的依賴。據(jù)知情人士透露,這款網(wǎng)卡的設(shè)計思路與英偉達熱銷的ConnectX-7網(wǎng)卡有著
    的頭像 發(fā)表于 02-21 11:01 ?597次閱讀

    英偉達缺貨?OpenAI選擇芯片

    ?電子發(fā)燒友網(wǎng)報道(文/周凱揚)在生成式AI和大模型帶來的AI洪流下,不少大廠都不約而同地選擇了AI芯片。即便這意味著組建新的團隊,花費大量的資金,但從長遠發(fā)展的角度來看,芯片
    的頭像 發(fā)表于 01-30 00:51 ?3548次閱讀

    搭載潮汐架構(gòu),F(xiàn)ind X7 將刷新芯片性能上限!

    OPPO 今日宣布 Find X7 將搭載潮汐架構(gòu),以芯片級性能解決方案為旗艦芯片平臺帶來刷新上限的極致能效表現(xiàn)。OPPO表示潮汐是地球上最強大的,也是永不枯竭的自然能量之一,寓意著這一創(chuàng)新
    發(fā)表于 01-03 11:18 ?331次閱讀
    搭載<b class='flag-5'>自</b><b class='flag-5'>研</b>潮汐架構(gòu),F(xiàn)ind X7 將刷新芯片<b class='flag-5'>性能</b>上限!

    蘋果Wi-Fi芯片之路充滿挑戰(zhàn)

    據(jù)悉,蘋果在5G調(diào)制解調(diào)器芯片上投入了大量資金,如今希望在Wi-Fi芯片上取得突破。然而,據(jù)報道,該項目一度陷入停頓,項目團隊也進行了重新組織。同時,蘋果與高通之間在5G調(diào)制解
    的頭像 發(fā)表于 12-26 14:46 ?600次閱讀

    從授權(quán)到內(nèi)核,汽車MCU大廠倒戈RISC-V?

    CPU核心,而這一核心未來也將集成到瑞薩的32位MCU上。 ? 率先開始授權(quán)RISC-V核心的瑞薩 ? 盡管瑞薩宣布RISC-V
    的頭像 發(fā)表于 12-05 00:20 ?1805次閱讀
    從授權(quán)到<b class='flag-5'>自</b><b class='flag-5'>研</b>內(nèi)核,汽車MCU大廠倒戈RISC-V?

    微軟AI芯片與H100、特斯拉D1性能對比

    微軟的多年投資顯示,芯片對于在AI和云計算領(lǐng)域取得優(yōu)勢至關(guān)重要。芯片可以讓微軟從硬件中獲得性能和價格優(yōu)勢,還可以避免微軟過度依賴任何一家供應(yīng)商。目前業(yè)界對英偉達AI芯片的爭奪戰(zhàn),更加凸顯了這個問題。
    發(fā)表于 11-22 15:38 ?495次閱讀
    微軟AI<b class='flag-5'>自</b><b class='flag-5'>研</b>芯片與H100、特斯拉D1<b class='flag-5'>性能</b>對比

    微軟重磅推出AI芯片!

    根據(jù)微軟官方消息,他們在最近舉行的Microsoft Ignite全球技術(shù)大會上推出了兩款人工智能芯片,并與AMD和英偉達展開合作,以推進人工智能和計算能力。
    的頭像 發(fā)表于 11-16 18:24 ?1078次閱讀

    什么是小鵬理解的全棧?

    全棧能力為車企提供高效率,縮短20%的開發(fā)時間,減少60%座艙的開發(fā)成本,減少智能駕駛成本50%。
    的頭像 發(fā)表于 10-27 10:57 ?849次閱讀

    的regression腳本yrun都有哪些東西呢?

    yrun是處芯積律的regression腳本,yrun都有哪些東西呢?
    的頭像 發(fā)表于 10-12 09:26 ?1231次閱讀
    <b class='flag-5'>自</b><b class='flag-5'>研</b>的regression腳本yrun都有哪些東西呢?

    【求助】RK3568工控板,原廠SDK的Linux啟動失敗

    公司按照瑞芯微官方設(shè)計了一塊3568工控板,主要的外設(shè)就原生兩路GMAC外接了裕泰的8531SH,另外通過PCIE3X2外接了一PCIE網(wǎng)卡。 開發(fā)板回板后跟硬件的同事一起調(diào)試原廠的SDK
    發(fā)表于 10-09 08:29