0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾揭秘第六代至強架構(gòu),披露未來3年產(chǎn)品

sakobpqhz ? 來源:算力基建 ? 2023-08-29 15:23 ? 次閱讀

9月14-15日,AIGC與大模型時代首場AI芯片峰會——2023全球AI芯片峰會將在深圳舉行。清華大學(xué)教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍領(lǐng)銜40+位演講嘉賓,NVIDIA與AMD齊聚,15家國產(chǎn)AI芯片企業(yè)屆時將登臺,3+Chiplet企業(yè)首度亮相。掃碼報名,線下交流。

芯片大廠紛紛入坑Chiplet。

一年一度的頂級芯片盛會Hot Chips正在舉行,作為全球芯片架構(gòu)創(chuàng)新的風(fēng)向標(biāo),今年的Hot Chips繼續(xù)披露工業(yè)界前沿研發(fā)成果和突破性技術(shù),覆蓋人工智能(AI)訓(xùn)練及推理、Chiplet、近存計算、處理器、光子計算、晶圓級集群、神經(jīng)擬態(tài)計算等熱門領(lǐng)域。

2ec1eab2-461e-11ee-a2ef-92fbcf53809c.png

本屆大會為期三天,NVIDIA、高通、英特爾、AMD、谷歌、SK海力士、三星、Arm、IBM等芯片巨頭,Meta、微軟等科技巨頭,晶圓級芯片創(chuàng)企Cerebras、光子AI芯片創(chuàng)企曦智科技、稀疏化計算AI芯片創(chuàng)企墨芯人工智能、RISC-V服務(wù)器處理器創(chuàng)企Ventana、RISC-V IP供應(yīng)商SiFive等具有代表性的創(chuàng)業(yè)公司,均發(fā)表了展現(xiàn)當(dāng)前芯片工業(yè)界前沿趨勢的主題演講。 期間,英特爾揭秘了其第六代至強數(shù)據(jù)中心處理器的架構(gòu)變化,詳解了新一代架構(gòu)、E核和P核處理器技術(shù),包括內(nèi)存和I/O子系統(tǒng)的設(shè)計改進,并披露2023~2025年的最新產(chǎn)品路線圖。

2efb2c3c-461e-11ee-a2ef-92fbcf53809c.png

英特爾宣布將在明年推出兩款采用Intel 3工藝技術(shù)的至強新品——為計算密集型和人工智能工作負載優(yōu)化的高性能核心(P核)和針對高密度和橫向擴展工作負載優(yōu)化的高能效核心(E核)。E核至強處理器(代號Sierra Forest)將在2024年上半年問世,P核至強處理器(代號(Granite Rapids)將緊隨其后登場。 總體而言,英特爾將至強處理器稱作“人工智能的最佳CPU”,Granite Rapids可將AI工作負載性能提升2-3倍,實現(xiàn)2.8倍的更好內(nèi)存帶寬,內(nèi)存模組MCR DIMM帶寬可提高30-40%;而Sierra Forest可在機架級別將機架密度提高250%,將每瓦性能提高240%。

2f041194-461e-11ee-a2ef-92fbcf53809c.png

插播一則會議預(yù)告。9月14-15日,2023全球AI芯片峰會將在深圳舉行。清華大學(xué)魏少軍教授領(lǐng)銜近50位演講嘉賓,NVIDIA與AMD齊聚,15+國產(chǎn)AI芯片企業(yè)屆時將登臺交鋒,3家Chiplet企業(yè)首度亮相。開幕式、AI芯片架構(gòu)創(chuàng)新專場、AI大算力芯片專場和高能效AI芯片專場將在主會場進行。智算中心算力與網(wǎng)絡(luò)高峰論壇等板塊將在分會場進行。掃碼報名~

01.全面轉(zhuǎn)向Chiplet,內(nèi)存和I/O大幅升級英特爾Fellow、數(shù)據(jù)中心處理器架構(gòu)師Chris Gianos發(fā)表了主題為《為靈活性和價值而設(shè)計的未來英特爾至強處理器架構(gòu)》演講。 未來的英特爾至強處理器引入了一種新架構(gòu),能提供必要的可擴展性、能效、性能和多功能性,滿足日益增長的數(shù)據(jù)中心工作負載和部署需求。 該架構(gòu)采用模塊化設(shè)計方式,通過fabric技術(shù)把模塊化die互連,實現(xiàn)靈活的架構(gòu),可將獨立的計算和I/O的chiplets(常譯為“芯?!?、“小芯片”)進行靈活組合,并借助EmiB封裝技術(shù)實現(xiàn)高帶寬和低延遲。基于該架構(gòu)的模塊化SoC包含通用IP、固件、操作系統(tǒng)、平臺組件等組件。

2f7a9008-461e-11ee-a2ef-92fbcf53809c.png

當(dāng)前最新一代英特爾至強可擴展處理器(代號Sapphire Rapids)最高支持8個DDR5通道和80個PCIe 5.0/CXL 1.1連接通道。相比之下,AMD的EPYC 4數(shù)據(jù)中心處理器擁有12個DDR5通道和128個PCIe通道。 而第六代至強將在通道數(shù)量和內(nèi)存帶寬上取得顯著進步,內(nèi)存配置轉(zhuǎn)向12個通道的DDR/MCR、1-2DPC,先進I/O支持136個通道的PCIe 5.0/CXL 2.0以及6個UPI鏈路(144通道),內(nèi)存帶寬相比Sapphire Rapids將提高近3倍。值得一提的是服務(wù)器內(nèi)存模組MCR DIMM,據(jù)稱內(nèi)存帶寬會比傳統(tǒng)DDR5大幅提升。早在今年3月英特爾宣布更新其數(shù)據(jù)中心和人工智能路線圖時,就曾演示過一個帶有新MCR DIMM模塊的的預(yù)生產(chǎn)Granite Rapids至強,速率高達8800MT/s,這幾乎是當(dāng)前服務(wù)器平臺上可用的DDR5(4400~4800MT/s)速率的兩倍。下一代至強架構(gòu)具有可擴展性,將提供P核和E核版本,支持1S-8S規(guī)格的P核、1S-2S規(guī)格的E核?;谶@些功能,不同工藝節(jié)點之間能夠進行匹配,從而得以實現(xiàn)性能和能效的最佳平衡。 得益于I/O和內(nèi)存子系統(tǒng)的進步,這一架構(gòu)提供了高性能和平臺靈活性的優(yōu)化,邏輯單片計算集群相較以往的產(chǎn)品提供了更好的每瓦特性能和每線程性能,并為未來代號為Granite Rapids和Sierra Forest的英特爾至強處理器奠定基礎(chǔ)。

02.兩種核心架構(gòu):

基于Intel 3工藝節(jié)點,專攻高性能與高能效

能效已經(jīng)成為現(xiàn)代云計算和數(shù)據(jù)中心改變高性能服務(wù)器處理器設(shè)計的關(guān)鍵因素。對于數(shù)據(jù)中心來說,省電才是硬道理。

英特爾高級首席工程師、架構(gòu)師Don Soltis在Hot Chips上發(fā)表的《基于高能效核心(E-Core)的英特爾至強處理器:下一代高性能、高能效計算》主題演講,便重點介紹了代號為Sierra Forest的全新英特爾至強處理器的架構(gòu)設(shè)計細節(jié),如何在消耗同樣能源的情況下,讓每個芯片完成更多的計算工作。 英特爾探討了其首款高能效核心E核至強如何補充現(xiàn)有和未來的英特爾高性能核心P核處理器解決方案,以提供一個高度通用的平臺,最大限度地提高計算性能、最大限度地降低功耗。 英特爾觀察到客戶需求正在變化:對高性能CPU核心的需求持續(xù)不斷;對更高密度和更高每瓦性能的CPU核心的需求也不斷增長;不同工作負載及應(yīng)用,需要在核心性能、核心能效與核心密度之間取得平衡;擴展部署模型要求增加功率、I/O、帶寬和內(nèi)存。

2fad52a4-461e-11ee-a2ef-92fbcf53809c.png

針對這些趨勢,英特爾通過P核和E核來滿足性能和效率需求。 英特爾第六代至強可擴展處理器將提供P核和E核兩種版本的核心架構(gòu),其中P核至強Granite Rapids針對計算密集型和AI工作負載的性能進行了優(yōu)化,E核至強Sierra Forest針對高密度和橫向擴展工作負載的能效進行了優(yōu)化。

2fefc4e0-461e-11ee-a2ef-92fbcf53809c.png

P核和E核均基于最新的Intel 3工藝技術(shù)(相當(dāng)于7nm工藝),支持客戶輕松優(yōu)化,具有硬件兼容、軟件棧共享、全面安全性等特點,并在TCO和每瓦性能上取得進步。 兩種架構(gòu)擁有不同的功能集。P核采用經(jīng)驗證的至強架構(gòu),優(yōu)化了每核性能并提高了能效,新軟件功能包括支持用于AI/ML的FP16的高級矩陣擴展(AMX)、長度256位的內(nèi)存加密秘鑰、Code SW預(yù)取和取指分支提示、單線程MBA+L2高速緩存分配技術(shù)/代碼和數(shù)據(jù)優(yōu)先級(CAT/CDP)。

300c2f9a-461e-11ee-a2ef-92fbcf53809c.png

其微架構(gòu)對性能進行優(yōu)化,包括:64KB、16路指令高速緩存(I-cache),改進分支預(yù)測和錯誤恢復(fù),3-cycle FP乘法,更突出的內(nèi)存請求和預(yù)取能力。E核采用全新英特爾至強架構(gòu),擁有優(yōu)化的能效吞吐量性能,軟件功能支持BF16、FP16轉(zhuǎn)換,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。

30145670-461e-11ee-a2ef-92fbcf53809c.png

該處理器將擁有144個核心,提供單插槽和雙插槽配置,微架構(gòu)對能效進行優(yōu)化,包括64kB I-cache、6-wide解碼器、5-wide分配器、8-wide retire、2核或4核共享4MB L2、支持處理多達64個outstanding misses。 英特爾聲稱在機架級別,與當(dāng)前的Sapphire Rapids相比,E核至強處理器Sierra Forest面向云計算可將機架密度提高250%,將每瓦性能提高240%。

308b53b0-461e-11ee-a2ef-92fbcf53809c.png

03.結(jié)語:Chiplet在數(shù)據(jù)中心走向主流從英特爾對下一代數(shù)據(jù)中心處理器架構(gòu)的投資,可以看到面對計算多樣性,提高算力涉及的技術(shù)跨度更加廣泛,需要兼顧到計算單元、I/O單元、內(nèi)存的可擴展性,更加高速的互連網(wǎng)絡(luò),靈活高效的模塊化功能,電源管理能力等等。 進入高算力時代,英特爾和AMD這兩大數(shù)據(jù)中心處理器巨頭都選擇走上了Chiplet路線,在處理器封裝大量獨立的計算和I/O chiplets,讓芯片設(shè)計如同“搭積木”般成為可能。這種將I/O功能從計算芯片中分離出來的設(shè)計正在風(fēng)靡數(shù)據(jù)中心芯片設(shè)計行業(yè),不僅是數(shù)據(jù)中心CPU,英偉達的A100 GPU、AMD的AI芯片MI300、特斯拉Dojo超級計算機的D1芯片等均是Chiplet產(chǎn)品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50212

    瀏覽量

    420951
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9861

    瀏覽量

    171292
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    416

    瀏覽量

    12541
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2276

    瀏覽量

    2359

原文標(biāo)題:16家芯片頂流火拼Hot Chips!英特爾揭秘第六代至強架構(gòu),披露未來3年產(chǎn)品

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英特爾至強品牌新戰(zhàn)略發(fā)布

    品牌是企業(yè)使命和發(fā)展的象征,也承載著產(chǎn)品特質(zhì)和市場認可。在英特爾GTC科技體驗中心的英特爾 至強 6 能效核處理器發(fā)布會上,英特爾公司全球副
    的頭像 發(fā)表于 10-12 10:13 ?352次閱讀

    英特爾發(fā)布至強6處理器產(chǎn)品

    以“綠色向新,釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強6能效核處理器新品發(fā)布會在北京舉行。會上,英特爾重磅推出首款配備能效核的英特爾至強6處理器
    的頭像 發(fā)表于 09-23 15:48 ?297次閱讀

    英特爾發(fā)布新一Lunar Lake處理器

    在近期舉辦的中國臺北國際電腦展(Computex)上,英特爾CEO蓋爾辛格向全球展示了其最新的技術(shù)成果。他發(fā)布了第六代至強處理器,并重點強調(diào)了Gaudi AI加速器的出色性價比。更引人矚目的是,蓋爾辛格還公布了新一
    的頭像 發(fā)表于 06-05 11:23 ?856次閱讀

    英特爾AI產(chǎn)品助力其運行Meta新一大語言模型Meta Llama 3

    英特爾豐富的AI產(chǎn)品——面向數(shù)據(jù)中心的至強處理器,邊緣處理器及AI PC等產(chǎn)品為開發(fā)者提供最新的優(yōu)化,助力其運行Meta新一大語言模型Me
    的頭像 發(fā)表于 04-28 11:16 ?556次閱讀

    第五英特爾至強處理器,AI特化的通用服務(wù)器CPU

    計算性能的同時,也新增了AI相關(guān)的新指令集,諸如AXM、AVX等。 第五至強可擴展處理器架構(gòu)剖析 2023年年底發(fā)布的第五
    的頭像 發(fā)表于 03-18 08:14 ?4129次閱讀
    第五<b class='flag-5'>代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>處理器,AI特化的通用服務(wù)器CPU

    英特爾展示下一至強處理器,助力vRAN性能顯著提升

    里程碑事件不僅凸顯了移動行業(yè)推動vRAN和Open RAN發(fā)展的長期投入,也表明了英特爾正在持續(xù)踐行其以領(lǐng)先的產(chǎn)品路線圖助力行業(yè)發(fā)展的堅定承諾。代號為Granite Rapids–D的下一
    的頭像 發(fā)表于 03-01 15:43 ?380次閱讀
    <b class='flag-5'>英特爾</b>展示下一<b class='flag-5'>代</b><b class='flag-5'>至強</b>處理器,助力vRAN性能顯著提升

    英特爾至強處理器優(yōu)化升級,助力打造未來高能效數(shù)據(jù)中心

    英特爾最新發(fā)布的第五至強可擴展處理器,擁有多達64個核心,性能提升高達1.4倍。 英特爾于去年12月正式推出了擁有多達64個核心的第五
    的頭像 發(fā)表于 02-26 17:39 ?656次閱讀

    英特爾專家為您揭秘第五英特爾? 至強? 可擴展處理器如何為AI加速

    近日,英特爾發(fā)布了第五至強 可擴展處理器,尤其是其“為 AI 加速”的口號引起了廣泛關(guān)注。 在 AI 快速發(fā)展的今天,第五英特爾
    的頭像 發(fā)表于 12-23 12:20 ?696次閱讀

    寶德服務(wù)器全面升級到第五英特爾?至強?平臺

    發(fā)布全新一基于第五英特爾?至強?可擴展處理器的寶德服務(wù)器。 ? 卓越性能,新一寶德服務(wù)器為計算用戶提供更優(yōu)選 第五
    的頭像 發(fā)表于 12-21 16:12 ?659次閱讀
    寶德服務(wù)器全面升級到第五<b class='flag-5'>代</b><b class='flag-5'>英特爾</b>?<b class='flag-5'>至強</b>?平臺

    64核+高內(nèi)存帶寬!英特爾發(fā)布第五至強服務(wù)器,加速AI原生應(yīng)用落地

    使用第五至強開發(fā)新品服務(wù)器和大模型訓(xùn)練的案例。 這款產(chǎn)品英特爾最強AI性能的CPU,采用了Intel7工藝,該處理器擁有多達64 核,具備8 條 DDR5 通道,支持高達5,600
    的頭像 發(fā)表于 12-20 00:26 ?2008次閱讀

    英特爾推出新一強大產(chǎn)品, 加速實現(xiàn) “AI 無處不在 ”

    英特爾? 酷睿? Ultra 和第五英特爾? 至強? 可擴展處理器豐富了英特爾出色的AI產(chǎn)品
    發(fā)表于 12-16 16:27 ?421次閱讀
    <b class='flag-5'>英特爾</b>推出新一<b class='flag-5'>代</b>強大<b class='flag-5'>產(chǎn)品</b>, 加速實現(xiàn) “AI 無處不在 ”

    第五英特爾至強可擴展處理器,為AI加速而生

    與生態(tài)伙伴分享了該全新產(chǎn)品在京東云、百度智能云、阿里云、火山引擎的成功實踐及其應(yīng)用價值。 第五英特爾 至強 可擴展處理器在提高人工智能、科學(xué)計算、網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、安全等關(guān)鍵工作負
    的頭像 發(fā)表于 12-16 16:15 ?413次閱讀
    第五<b class='flag-5'>代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>可擴展處理器,為AI加速而生

    AI 無處不在,英特爾酷睿Ultra 和第五英特爾至強可擴展處理器正式發(fā)布

    英特爾 ?酷睿?Ultra處理器和第五英特爾 ? 至強 ? 可擴展處理器支持的AI產(chǎn)品亮相,展現(xiàn)了英特
    的頭像 發(fā)表于 12-16 16:05 ?669次閱讀
    AI 無處不在,<b class='flag-5'>英特爾</b>酷睿Ultra 和第五<b class='flag-5'>代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>可擴展處理器正式發(fā)布

    第五英特爾至強可擴展處理器,為AI加速而生

    今日,在以“AI無處不在 創(chuàng)芯無所不及”為主題的2023英特爾新品發(fā)布會暨AI技術(shù)創(chuàng)新派對上,英特爾正式推出第五英特爾? 至強? 可擴展處
    發(fā)表于 12-16 15:53 ?315次閱讀
    第五<b class='flag-5'>代</b><b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>可擴展處理器,為AI加速而生

    英特爾發(fā)布酷睿Ultra和第五至強可擴展處理器

    戰(zhàn)略的發(fā)布,以及英特爾 酷睿 Ultra處理器和第五英特爾 至強 可擴展處理器支持的 AI 產(chǎn)品亮相,展現(xiàn)了
    的頭像 發(fā)表于 12-16 15:23 ?1228次閱讀