被黑人姿势猛到抽搐视频,成年片色大黄全免费网站久久高潮

英特爾在Hot Chips大會上發(fā)布了首款AI 處理器，專為大型計算中心設計。該芯片基于10納米Ice Lake處理器，專為大型數(shù)據(jù)中心設計，可以用最少的能耗來處理高工作負載。本文帶來這款芯片的詳細設計細節(jié)。

近日在Hot Chips 2019大會上，英特爾發(fā)布了首款AI處理器，專為大型計算中心設計。

英特爾表示，該芯片由位于以色列海法的研發(fā)中心開發(fā)，名為Nervana NNP-I或Springhill，基于10納米Ice Lake處理器，可以用最少的能耗來處理高工作負載。

英特爾表示，隨著AI領域?qū)碗s計算的需求日益增加，這款新的硬件芯片將有助于大型企業(yè)使用英特爾Xeon處理器。

在Hot Chips大會上，他們提供了這款AI芯片的更多設計細節(jié)。

英特爾首款AI芯片設計細節(jié)

英特爾正采取數(shù)項不同的舉措，通過其“無處不在的AI”('AI everywhere)戰(zhàn)略，擴大其在蓬勃發(fā)展的AI市場的影響力。該公司廣泛的產(chǎn)品包括GPU，FPGA和定制ASIC，用于應對AI領域的不同挑戰(zhàn)，其中一些解決方案專為計算密集型的訓練任務而設計，用于為目標識別、語音翻譯、語音合成等工作負載創(chuàng)建復雜的神經(jīng)網(wǎng)絡，將產(chǎn)生的訓練模型作為輕量級代碼運行的單獨解決方案稱為推理。

英特爾的Spring Hill Nervana神經(jīng)網(wǎng)絡推理處理器(NNP-I) 1000，我們在下文中簡稱為NNP-I，用于處理數(shù)據(jù)中心的輕量級推理工作負載。這款芯片足夠小，可以安裝在標準的M.2設備上，然后插入主板上的標準M.2端口，從而將Xeon服務器從推理密集型工作負載中解放出來，將更大的芯片釋放出來用于一般計算任務。用于訓練的神經(jīng)網(wǎng)絡處理器 (NPP-T)作為英特爾的Nervana解決方案用于訓練工作負載，但這兩種設備的底層架構有很大的不同。

英特爾修改了10nm Ice Lake處理器，去掉了兩個計算核心和圖形引擎，以適應12個推理計算引擎(ICE)。ICE加速器具有基于硬件的單元間同步，與兩個IA核共享一個連貫的結構和24MB的L3緩存，這兩個IA核具有Sunny Cove微架構。

IA核心是標準的Ice Lake核心，支持AVX-512和VNNI指令，可加速卷積神經(jīng)網(wǎng)絡，而一個完全集成的電壓調(diào)節(jié)模塊(FIVR)動態(tài)地向組件供電，將更多的功率預算分配給最活躍的on-die單元。該芯片配備了兩個LPDDR4X內(nèi)存控制器，連接到封裝內(nèi)存，你可以將其視為M.2 PCB左下方的單個組件?？刂破魈峁└哌_4.2 GT/s (68 GB/s)的吞吐量，并支持 in-band ECC。

英特爾尚未透露LPDDR4的容量，也沒有透露有關M.2設備的其他細節(jié)。我們知道英特爾將這個軟件包安裝在不同形式的插入卡上，比如上面的M.2版本，它可以插入服務器主板上的標準M.2端口，或者插入標準的PCIe插槽的更大的附加卡。與谷歌的TPU等為人AI設計的定制芯片不同，這款設備基本上與所有現(xiàn)有的現(xiàn)代服務器硬件兼容。這種方法也是可擴展的：你可以根據(jù)需要向服務器添加盡可能多的NNP-I，特別是對于包含多個M.2端口的PCIe提升板。

該設備通過PCIe 3.0 x4或x8接口與主機通信，但不使用NVMe協(xié)議。相反，它作為一個標準的PCIe設備運行。英特爾將提供一種軟件，可以將推理“作業(yè)”完全編排到加速器上，當工作完成時，該軟件將通知Xeon CPU。卸載消除了Xeon與其他類型的加速器在PCIe總線上的來回通信，這對CPU來說是一種負擔，因為它會生成中斷并需要數(shù)據(jù)移動。相反，NNP-I是一個獨立的系統(tǒng)，具有自己的I/O調(diào)節(jié)(PCH)，允許它訪問處理所需的數(shù)據(jù)。

該設備可以支持從10W到50W的不同功率范圍，這對性能有影響。M.2接口的15W限制阻礙了插入標準M.2插座的設備的功率傳輸，但NNP-I在更大的外接卡中可以在最高TDP額定值下運行，這意味著它們提供了更好的性能。在INT8操作中，TOP/s的范圍從48到92。根據(jù)配置的TDP，芯片的效率為每瓦特2~4.8 TOP/s，但該指標不包括總包功率。

推理計算引擎內(nèi)部

深入研究ICE引擎可以發(fā)現(xiàn)，每個ICE單元都有額外的4MB SRAM，有助于減少芯內(nèi)數(shù)據(jù)移動，這在功耗和時間方面總是比實際的計算操作更昂貴。深度學習計算網(wǎng)格(DL Compute Grid)是一個張量引擎，通過數(shù)據(jù)和控制結構連接到SRAM和VP6 DSP。DSP引擎可以用于沒有專門針對固定功能DL計算網(wǎng)格進行優(yōu)化的算法。此外，其他代碼可以在Ice Lake核心上使用VNNI運行，使多個模型可以同時在設備上運行，也為快速移動的AI空間提供了一些必需的前向兼容性。

DL Compute Grid支持FP16和INT8，但也支持INT4、2和1，以支持未來可能對AI算法進行的調(diào)整。令人驚訝的是，它不支持bfloat16。通過調(diào)整工作負載在ICE單元之間的分布方式，可以優(yōu)化fabric的帶寬或延遲，如下表所示。

這里我們可以看到DL Compute Grid的特寫視圖，它被設計得很靈活，以最大化其4D并行計算能力，以及用于矢量處理的Tensilicon Vision P6 DSP。Tensilica DSP引擎是一個廣泛的VLIW機器，支持INT8, 16, 32，和FP16。該引擎是完全可編程的，并具有一個雙向管道和DL Compute Grid，可在兩個硬件同步單元之間快速傳輸數(shù)據(jù)。。

芯片的內(nèi)存子系統(tǒng)

回到內(nèi)存子系統(tǒng)，可以看到每個計算單元中所做的設計決策背后的許多合理化。這里我們可以看到硬件控制的L3緩存被分成8個3MB的片段，在AI核心和ICE單元之間共享。該設計經(jīng)過優(yōu)化，使數(shù)據(jù)盡可能接近計算引擎，并具有四個不同的層。

圖表左側的一系列blocks量化了通過內(nèi)存結構的每一層移動數(shù)據(jù)的延遲。從DRAM到DLCompute Grid的數(shù)據(jù)傳輸被設置為基線，我們可以看到分層結構中的每一層將數(shù)據(jù)傳輸?shù)膃ngine的速度是多么快。從L3緩存訪問比DRAM快10倍，而存儲在DL Compute Grid中的數(shù)據(jù)比DRAM快1000倍。

總之，分層設計允許Xeon向設備卸載幾種不同類型的神經(jīng)網(wǎng)絡，每一層都支持一定的精度。請注意，上面的金字塔是根據(jù)每瓦特的性能排列的。

英特爾與ResNet50共享性能數(shù)據(jù)，運行速度為每秒3600 次推理，芯片設置為10W TDP。這相當于每瓦特4.8 TOP/s的效率測量，符合公司的設計目標。值得注意的是，芯片在較低的TDP范圍內(nèi)效率更高，因此在較高的性能設置下效率可能會有所不同。這些數(shù)字也只適用于ASIC，不包括整個M.2設備的功耗。英特爾表示，未來將分享更多的性能數(shù)據(jù)。

英特爾提供了一個編譯器，可以為NNP-I的加速器定制代碼，并正在與Facebook合作，以確保Glo編譯器也支持NNP-I的加速器。Facebook是英特爾在開發(fā)期間的“定義”合作伙伴。該設備還支持所有標準框架，如PyTorch和TensorFlow等，幾乎沒有任何更改。英特爾堅持認為，任何能夠使用Xeons進行推理的人都可以使用NNP-I。

在數(shù)據(jù)中心，推理應用遠比訓練普遍，價格合理的低功耗設備將集體銷售給超大規(guī)模和云服務提供商（CSP），意思是這可以成為英特爾的一個利潤豐厚的細分市場。該公司本身并沒有打算將這些設備推向零售市場，但確實希望CSP在未來通過基于云的實例來公開它們。

英特爾已經(jīng)研發(fā)了兩代NNP-I。該公司將在今年年底前開始批量生產(chǎn)，NNP-I已經(jīng)開始提供樣品。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

芯片

芯片

+關注

關注
451

文章
49725

瀏覽量
417645
英特爾

英特爾

+關注

關注
60

文章
9773

瀏覽量
170743
AI處理器

AI處理器

+關注

關注
0

文章
92

瀏覽量
9430

原文標題：英特爾首款AI芯片終于面世！10nm工藝，以色列團隊設計細節(jié)曝光

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

英特爾發(fā)布至強6處理器產(chǎn)品

以“綠色向新，釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強6能效核處理器新品發(fā)布會在北京舉行。會上，英特爾重磅推出首

發(fā)表于 09-23 15:48 ?152次閱讀

英特爾至強6系列處理器:全能核心,滿足各種工作需求

英特爾在去年Hot Chips大會上宣布，全新至強6系列處理器分為全能效核與全性能核兩大產(chǎn)品線，

發(fā)表于 08-30 15:15 ?375次閱讀

英特爾首款至強6處理器上市

在北京這座古都的現(xiàn)代舞臺上，英特爾?舉行了一場別開生面的新品發(fā)布會，主題為“綠色向新，釋放新質(zhì)生產(chǎn)力”。此次盛會聚焦在英特爾至強? 6能效核

發(fā)表于 06-11 09:51 ?447次閱讀

已有超過500款AI模型在英特爾酷睿Ultra處理器上得以優(yōu)化運行

近日，英特爾宣布在全新英特爾 酷睿 Ultra處理器上，有超過500款AI模型得以優(yōu)化運行。

發(fā)表于 05-11 09:31 ?579次閱讀

英特爾酷睿Ultra處理器突破500個AI模型優(yōu)化

英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布，超過500款AI模型已得到優(yōu)化運行。

發(fā)表于 05-09 11:18 ?640次閱讀

英特爾重磅發(fā)布全新AI戰(zhàn)略，攜手生態(tài)共同釋放企業(yè)AAI潛力

在近期舉行的Intel Vision 2024大會上，英特爾重磅發(fā)布其開放的、可擴展的全新AI戰(zhàn)略，同時公布

發(fā)表于 04-28 11:11 ?444次閱讀

<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>全新<b class='flag-5'>AI</b>戰(zhàn)略，攜手生態(tài)共同釋放企業(yè)AAI潛力

成都匯陽關于成英特爾推出多款新品，24 年或成為 AI PC 出貨元年

【英特爾發(fā)布酷睿 14 代系列新品，臺式+移動場景全覆蓋】在 CES 2024 大會上，英特爾推出了酷睿第 14 代臺式和移動端

發(fā)表于 01-18 10:10 ?518次閱讀

英特爾酷睿14代處理器系列發(fā)布，Arrowlake/LunarLake24年問世

處理器英特爾

looger123

發(fā)布于 :2024年01月10日 17:44:38

AI 無處不在，英特爾酷睿Ultra 和第五代英特爾至強可擴展處理器正式發(fā)布

英特爾 ?酷睿?Ultra處理器和第五代英特爾 ? 至強 ? 可擴展處理器支持的AI產(chǎn)品亮相，展現(xiàn)了

發(fā)表于 12-16 16:05 ?597次閱讀

第五代英特爾至強可擴展處理器，為AI加速而生

今日，在以“AI無處不在創(chuàng)芯無所不及”為主題的2023英特爾新品發(fā)布會暨AI技術創(chuàng)新派對上，英特爾

發(fā)表于 12-16 15:53 ?277次閱讀

英特爾發(fā)布酷睿Ultra和第五代至強可擴展處理器

戰(zhàn)略的發(fā)布，以及英特爾 酷睿 Ultra處理器和第五代英特爾 至強可擴展處理器支持的 AI

發(fā)表于 12-16 15:23 ?1132次閱讀

英特爾新處理器，掀AI PC戰(zhàn)火

隨著ai時代的到來，英特爾正在構想新的酷睿Ultra處理器（代號Meteor Lake），這是英特爾的第一個基于npu的處理器，旨在在pc上

發(fā)表于 12-11 11:26 ?832次閱讀

英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

英特爾研究院將在NeurIPS 2023大會上展示一系列富有價值、業(yè)界領先的AI創(chuàng)新成果。面向廣大開發(fā)者、研究人員和學界人士，這一AI和計算機視覺領域的全球頂會將于12月10日至16日

發(fā)表于 12-08 19:15 ?485次閱讀

英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

英特爾研究院將重點展示31項研究成果，它們將推進面向未來的AI創(chuàng)新。 ? ? ? ?英特爾研究院將在NeurIPS 2023大會上展示一系列富有價值、業(yè)界領先的

發(fā)表于 12-08 09:17 ?599次閱讀

英特爾發(fā)布面向發(fā)燒友的英特爾酷睿第14代臺式機處理器

近日，英特爾發(fā)布了以i9-14900K為代表的全新英特爾 酷睿第14代臺式機處理器產(chǎn)品家族，涵蓋了此次推出的六

發(fā)表于 10-21 16:40 ?700次閱讀

搜索歷史

英特爾在Hot Chips大會上發(fā)布了首款AI處理器

評論

英特爾發(fā)布至強6處理器產(chǎn)品

英特爾至強6系列處理器:全能核心,滿足各種工作需求

英特爾首款至強6處理器上市

已有超過500款AI模型在英特爾酷睿Ultra處理器上得以優(yōu)化運行

英特爾酷睿Ultra處理器突破500個AI模型優(yōu)化

英特爾重磅發(fā)布全新AI戰(zhàn)略，攜手生態(tài)共同釋放企業(yè)AAI潛力

成都匯陽關于成英特爾推出多款新品，24 年或成為 AI PC 出貨元年

英特爾酷睿14代處理器系列發(fā)布，Arrowlake/LunarLake24年問世

AI 無處不在，英特爾酷睿Ultra 和第五代英特爾至強可擴展處理器正式發(fā)布

第五代英特爾至強可擴展處理器，為AI加速而生

英特爾發(fā)布酷睿Ultra和第五代至強可擴展處理器

英特爾新處理器，掀AI PC戰(zhàn)火

英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

英特爾發(fā)布面向發(fā)燒友的英特爾酷睿第14代臺式機處理器