成年人免费视频,男女羞羞的视频网站在线观看,处一女一级a一片AV

引言

隨著人工智能和5G的興起，數(shù)據(jù)處理對(duì)芯片的算力和帶寬要求更高。為了布局未來(lái)，助力人工智能和5G，賽靈思也推出了自己的FPGA加速芯片-ACAP。ACAP是一款基于7nm工藝，集成了通用處理器（PS），F(xiàn)PGA（PL），math engine以及network-on-chip的革命性芯片。特別是新增的ME結(jié)構(gòu)，是一個(gè)類似于GPU的多核并發(fā)計(jì)算單元，可以大大提高數(shù)據(jù)處理能力。同時(shí)ME支持軟件語(yǔ)言C，C++，這有利于擴(kuò)大FPGA的使用用戶，同時(shí)方便了設(shè)計(jì)開(kāi)發(fā)。

ME結(jié)構(gòu)簡(jiǎn)介

ME結(jié)構(gòu)由很多ME核組成的二維陣列結(jié)構(gòu)，核之間可以實(shí)現(xiàn)數(shù)據(jù)通信。ME陣列通過(guò)NoC可以和PL以及PS端進(jìn)行通信，NoC是一種互聯(lián)總線，其提供了ME陣列到PL側(cè)的高帶寬通路。ME核包含了BRAM，DSP以及控制邏輯。ME具有以下特點(diǎn)：

1）有一個(gè)RISC處理器，能夠支持32bit標(biāo)量數(shù)據(jù)運(yùn)算，包括sin/cos，開(kāi)方，乘法等操作；

2）向量乘法計(jì)算單元。這是一個(gè)由DSP組成的陣列，能夠支持32個(gè)16bitx8bit，64個(gè)16x8bit，128個(gè)8x8bit計(jì)算。還支持8個(gè)單精度乘法計(jì)算；

3）指令控制結(jié)構(gòu)支持load和save，向量乘法等操作，這些操作統(tǒng)一用一個(gè)指令字段描述；

4）含有多路AXI stream，可以實(shí)現(xiàn)高速數(shù)據(jù)通信；

5）含有一個(gè)128bit寬1K深的程序存儲(chǔ)器，支持指令壓縮，可通過(guò)AXI-MM進(jìn)行配置；

6）含有多個(gè)數(shù)據(jù)存儲(chǔ)器，分成多個(gè)bank，共有32KB容量；

7）含有配置接口，用于ME核的配置和調(diào)試；

8）含有debug/trace/profile功能，用于程序追蹤和調(diào)試；

ME核的工作頻率達(dá)到1GHz，電壓0.7V，具有較低功耗。ME支持多種形式的數(shù)據(jù)傳送，包括AXI-MM，AXI-stream，以及ME之間共享的bank進(jìn)行數(shù)據(jù)直接交互。

為了保證性能的可預(yù)測(cè)性，ME之間數(shù)據(jù)通信不存在緩存一致性。但是ME和PS之間通信是需要緩存一致性功能的，ME和PS端共享DDR中一段內(nèi)存。當(dāng)PS處理完數(shù)據(jù)發(fā)送給ME時(shí)，是要保證處理的數(shù)據(jù)都已經(jīng)存儲(chǔ)到DDR中了。而ME處理完數(shù)據(jù)寫(xiě)到DDR中后，也要讓PS知道數(shù)據(jù)已經(jīng)寫(xiě)完。ME可以使用虛擬地址去訪問(wèn)PS的存儲(chǔ)或者DDR，ME地址會(huì)經(jīng)過(guò)PS端的MMU進(jìn)行解析。

為了保證某些過(guò)程的安全性（比如對(duì)TrustZone的保護(hù)，或者防止ME陣列的重要信息被讀?。琈E提供了一些保護(hù)措施。主要包括對(duì)ME訪問(wèn)的保護(hù)，AXI-MM傳輸?shù)陌踩员Ｗo(hù)，AXI-stream數(shù)據(jù)訪問(wèn)的保護(hù)等。

ME陣列可以在功能上被分割成多個(gè)子陣列使用，這可以用于一些需要ME陣列完成多種功能的任務(wù)。其中ME核，AXI-stream，數(shù)據(jù)存儲(chǔ)訪問(wèn)等模塊都可以被分割。只有AXI-MM不能被分割。NoC中可以支持對(duì)控制信息的修改，從而可以給不同子陣列發(fā)送不同的控制信息。每個(gè)ME核含有256Kb的數(shù)據(jù)存儲(chǔ)器和128Kb的程序存儲(chǔ)器，對(duì)于一個(gè)300個(gè)ME核的芯片就含有77Mb數(shù)據(jù)存儲(chǔ)和38Mb程序存儲(chǔ)，這么大的空間，保證數(shù)據(jù)準(zhǔn)確性是很關(guān)鍵的。因此不論是數(shù)據(jù)存儲(chǔ)器還是程序存儲(chǔ)器都提供了ECC校驗(yàn)，以防止軟件錯(cuò)誤產(chǎn)生的數(shù)據(jù)錯(cuò)誤問(wèn)題。程序存儲(chǔ)器每144bit包含128bit有效數(shù)據(jù)和8bitECC校驗(yàn)位。8bit校驗(yàn)位可以在每64bit數(shù)據(jù)中糾正1bit數(shù)據(jù)和檢測(cè)出2bit數(shù)據(jù)錯(cuò)誤。存儲(chǔ)數(shù)據(jù)出錯(cuò)會(huì)生成錯(cuò)誤事件，反饋給debug或者profile模塊報(bào)告這些錯(cuò)誤。

ME陣列被分配了4個(gè)1GB的地址映射區(qū)域，目前芯片只有一個(gè)ME陣列，所以只使用了1GB地址映射空間。ME的地址含有整體陣列的offset，陣列的行列編號(hào)，以及ME核中存儲(chǔ)地址。這些信息可以確定往哪個(gè)ME中的存儲(chǔ)位置讀寫(xiě)數(shù)據(jù)。

ME中有4個(gè)時(shí)鐘：ME核時(shí)鐘，高頻，可到1GHz，用于ME中的數(shù)據(jù)傳輸和運(yùn)算。NoC時(shí)鐘，數(shù)據(jù)時(shí)鐘，用于從PL到ME的數(shù)據(jù)輸送。PL側(cè)時(shí)鐘以及NPI時(shí)鐘，NPI時(shí)鐘用于調(diào)試追蹤等。

數(shù)據(jù)傳輸結(jié)構(gòu)

為了保證不同設(shè)備之間的數(shù)據(jù)交換，我們需要滿足兩個(gè)條件：一個(gè)是數(shù)據(jù)實(shí)際的流通，這個(gè)包含數(shù)據(jù)傳輸通路和數(shù)據(jù)存儲(chǔ)；當(dāng)然也不必包含有存儲(chǔ)，流水線處理的數(shù)據(jù)只有數(shù)據(jù)流通；另外一個(gè)是發(fā)送者和收發(fā)者之間的同步。接受者接收數(shù)據(jù)只有在發(fā)送者發(fā)出數(shù)據(jù)之后，同時(shí)發(fā)送者發(fā)送數(shù)據(jù)必須等接受者準(zhǔn)備好接收數(shù)據(jù)。因此一些同步信號(hào)是必須的。

ME陣列中能夠?qū)崿F(xiàn)數(shù)據(jù)交互的設(shè)備有：

1）本地存儲(chǔ)bank。每個(gè)ME包含8個(gè)bank，這些bank可以用于和周圍4個(gè)ME進(jìn)行數(shù)據(jù)通信。ME通過(guò)load和save指令來(lái)讀寫(xiě)本地存儲(chǔ)器。如果ME的寫(xiě)和另外一個(gè)ME的讀同時(shí)發(fā)生，可以通過(guò)ping/pong操作同步。

2） Stream-network可用于所有ME之間數(shù)據(jù)交互。而且stream本身是具有同步信號(hào)的，所以無(wú)需增加額外同步信號(hào)。

3） AXI-MM接口能夠用于ME和PL端甚至是外部存儲(chǔ)器進(jìn)行通信。

保證數(shù)據(jù)同步的裝置有：

1） ME本地原子鎖。這個(gè)鎖可以保證生產(chǎn)者和消費(fèi)者的數(shù)據(jù)訪問(wèn)沖突解決。如果鎖被置為1，表示可以被讀，如果為0表示可以寫(xiě)。

2） Shim-DMA鎖。用于同步不同DMA通道，或者DMA通道和AXI-MM通道；

3）信號(hào)量機(jī)制。對(duì)于ME和PS端的數(shù)據(jù)通信，還可以通過(guò)軟件層次的信號(hào)量機(jī)制來(lái)進(jìn)行同步，因?yàn)镻S端可以通過(guò)AXI-MM接口實(shí)現(xiàn)和ME之間的數(shù)據(jù)同步；

4） Stream網(wǎng)絡(luò)自身附帶的同步特性，用于不同ME之間交換數(shù)據(jù)。

PL和ME由于處于不同時(shí)鐘區(qū)域，ME是高頻時(shí)鐘，而PL側(cè)時(shí)鐘頻率較低。為了實(shí)現(xiàn)數(shù)據(jù)跨時(shí)鐘域傳輸，芯片提供了shim接口，shim中含有異步FIFO。FPGA可以以64bit或者32bit將數(shù)據(jù)寫(xiě)入FIFO，而ME將FIFO中數(shù)據(jù)讀出進(jìn)行運(yùn)算。ME獲得數(shù)據(jù)有兩種方式，一種是通過(guò)DMA將數(shù)據(jù)讀出寫(xiě)入到ping/pong buffer，這樣可以實(shí)現(xiàn)ME核中兩個(gè)函數(shù)的計(jì)算任務(wù)。如果ME中不需要ping/pong操作，可以不同各國(guó)DMA將數(shù)據(jù)存儲(chǔ)到buffer?？梢詮膕tream直接獲得數(shù)據(jù)進(jìn)行計(jì)算。

接下來(lái)我們看看ME內(nèi)部數(shù)據(jù)如何通信：

1） ME內(nèi)部不同操作之間可以使用shared memory來(lái)進(jìn)行數(shù)據(jù)交互，但是每次只允許一個(gè)操作來(lái)訪問(wèn)shared memory，即讀寫(xiě)無(wú)法同時(shí)進(jìn)行；

2）兩個(gè)相鄰ME可以通過(guò)shared memory來(lái)進(jìn)行數(shù)據(jù)交互，通過(guò)ping/pong buffer可以實(shí)現(xiàn)一個(gè)寫(xiě)一個(gè)讀；

3）對(duì)于不相鄰的ME，也可以使用ping/pong buffer。但是這個(gè)時(shí)候ME無(wú)法直接去訪問(wèn)另外一個(gè)ME的存儲(chǔ)，但是每個(gè)ME都可以建立自己的ping/pong buffer，這兩組buffer可以通過(guò)DMA進(jìn)行數(shù)據(jù)交互；

4）不同的ME之間還可以通過(guò)AXI-stream接口進(jìn)行數(shù)據(jù)交互；

5）有時(shí)候一個(gè)大型計(jì)算要在幾個(gè)ME之間完成，這就需要不同ME之間進(jìn)行高速數(shù)據(jù)通信，相鄰的ME之間還有級(jí)聯(lián)總線，可以實(shí)現(xiàn)兩個(gè)ME之間的累加運(yùn)算，這個(gè)總線位寬達(dá)到384bit；

6） ME還可以直接從外部存儲(chǔ)器中獲得數(shù)據(jù)，它將數(shù)據(jù)請(qǐng)求包發(fā)送給ME-shim，這個(gè)請(qǐng)求包含有包頭和數(shù)據(jù)請(qǐng)求信息，包頭中有原和目的地址，數(shù)據(jù)請(qǐng)求中含有數(shù)據(jù)長(zhǎng)度信息。

編輯：hfy

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

FPGA

FPGA

+關(guān)注

關(guān)注
1625

文章
21620

瀏覽量
601238
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4673

瀏覽量
128592
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46652

瀏覽量
237073
數(shù)據(jù)存儲(chǔ)器

數(shù)據(jù)存儲(chǔ)器

+關(guān)注

關(guān)注
1

文章
69

瀏覽量
17764
ACAP

ACAP

+關(guān)注

關(guān)注
1

文章
54

瀏覽量
8148

評(píng)論

相關(guān)推薦

今日看點(diǎn)丨傳蘋(píng)果2025年采用自研Wi-Fi芯片臺(tái)積電7nm制造；富士膠片開(kāi)始銷售用于半導(dǎo)體EUV光刻的材料

半年的新產(chǎn)品（例如iPhone 17）計(jì)劃采用自家的Wi-Fi芯片，采用臺(tái)積電N7（7nm）工藝制造，支持最新的Wi-Fi 7規(guī)格。蘋(píng)果預(yù)計(jì)

發(fā)表于 11-01 10:57 ?695次閱讀

所謂的7nm芯片上沒(méi)有一個(gè)圖形是7nm的

最近網(wǎng)上因?yàn)楣饪虣C(jī)的事情，網(wǎng)上又是一陣熱鬧。好多人又開(kāi)始討論起28nm/7nm的事情了有意無(wú)意之間，我也看了不少網(wǎng)上關(guān)于國(guó)產(chǎn)自主7nm工藝的文章。不過(guò)這些文章里更多是抒情和遐想，卻很少

發(fā)表于 10-08 17:12 ?175次閱讀

所謂的<b class='flag-5'>7nm</b><b class='flag-5'>芯片</b>上沒(méi)有一個(gè)圖形是<b class='flag-5'>7nm</b>的

三星奪得首個(gè)2nm芯片代工大單，加速AI芯片制造競(jìng)賽

在半導(dǎo)體行業(yè)的激烈競(jìng)爭(zhēng)中，三星電子于7月9日宣布了一項(xiàng)重大突破，成功贏得了日本人工智能（AI）企業(yè)Preferred Networks（PFN）的訂單，為其生產(chǎn)基于尖端2nm工藝和先進(jìn)封裝技術(shù)的AI

發(fā)表于 07-11 09:52 ?491次閱讀

PMP22165.1-適用于 Xilinx 通用自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 的電源 PCB layout 設(shè)計(jì)

電子發(fā)燒友網(wǎng)站提供《PMP22165.1-適用于 Xilinx 通用自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 的電源 PCB layout 設(shè)計(jì).pdf》資料免費(fèi)下載

發(fā)表于 05-19 10:45 ?0次下載

PMP22165.1-適用于 Xilinx 通用自適應(yīng)計(jì)算<b class='flag-5'>加速</b>平臺(tái) (<b class='flag-5'>ACAP</b>) 的電源 PCB layout 設(shè)計(jì)

存內(nèi)計(jì)算——助力實(shí)現(xiàn)28nm等效7nm功效

可重構(gòu)芯片嘗試在芯片內(nèi)布設(shè)可編程的計(jì)算資源，根據(jù)計(jì)算任務(wù)的數(shù)據(jù)流特點(diǎn)，動(dòng)態(tài)構(gòu)造出最適合的計(jì)算架構(gòu)，國(guó)內(nèi)團(tuán)隊(duì)設(shè)計(jì)并在12nm工藝下制造的CGRA芯片

發(fā)表于 05-17 15:03 ?1665次閱讀

BittWare提供基于英特爾Agilex? 7 FPGA最新加速板

BittWare 當(dāng)前的加速板產(chǎn)品組合包括最新的英特爾 Agilex 7 FPGA F、I 和 M 系列，包括 Compute Express Link (CXL) 和 PCIe* 5.0

發(fā)表于 04-30 15:22 ?770次閱讀

FPGA芯片你了解多少？

2019年正式銷售，目前已經(jīng)向國(guó)內(nèi)數(shù)百家客戶發(fā)貨，填補(bǔ)了國(guó)產(chǎn)高端 FPGA的空白，目前公司基于28nm工藝制程的FPGA產(chǎn)品已多達(dá)數(shù)十款。安路科技成立于2011年，公司的主營(yíng)業(yè)務(wù)為

發(fā)表于 04-17 11:13

2024年全球與中國(guó)7nm智能座艙芯片行業(yè)總體規(guī)模、主要企業(yè)國(guó)內(nèi)外市場(chǎng)占有率及排名

7nm智能座艙芯片市場(chǎng)報(bào)告主要研究： 7nm智能座艙芯片市場(chǎng)規(guī)模：產(chǎn)能、產(chǎn)量、銷售、產(chǎn)值、價(jià)格、成本、利潤(rùn)等 7nm智能座艙

發(fā)表于 03-16 14:52

Ethernovia推出全球首款采用7nm工藝的汽車PHY收發(fā)器系列樣品

硅谷初創(chuàng)企業(yè) Ethernovia宣布推出全球首款采用 7nm 工藝的單端口和四端口 10G 至 1G 汽車 PHY 收發(fā)器系列樣品，將在汽車領(lǐng)域帶來(lái)巨大變革，滿足軟件定義車輛 (SDV) 不斷增長(zhǎng)的帶寬需求

發(fā)表于 03-15 09:07 ?949次閱讀

無(wú)意發(fā)展至10nm以下，第二梯隊(duì)晶圓代工廠的成熟工藝現(xiàn)狀

梯隊(duì)的廠商們還在成熟工藝上穩(wěn)扎穩(wěn)打。 ? 早在兩年前，我們還會(huì)將28nm視作成熟工藝以及先進(jìn)工藝的分水嶺。但隨著3nm的推出，以及即將到來(lái)的

發(fā)表于 02-21 00:17 ?3365次閱讀

一文詳解芯片的7nm工藝

芯片的7nm工藝我們經(jīng)常能聽(tīng)到，但是7nm是否真的意味著芯片的尺寸只有7nm呢？讓我們一起來(lái)看看

發(fā)表于 12-07 11:45 ?5139次閱讀

產(chǎn)能利用率低迷，傳臺(tái)積電7nm將降價(jià)10%！

早在今年10月的法說(shuō)會(huì)上，臺(tái)積電總裁魏哲家就曾被外資當(dāng)面詢問(wèn)7nm產(chǎn)能利用率不斷下滑的問(wèn)題，臺(tái)積電7nm在總營(yíng)收當(dāng)中的占比持續(xù)滑落，從第二季度的23%降至了第三季度17%，相比去年同期的26%更是下跌了近10個(gè)百分點(diǎn)。

發(fā)表于 12-04 17:16 ?814次閱讀

臺(tái)積電7nm制程降幅約為5%至10%

據(jù)供應(yīng)鏈消息透露，臺(tái)積電計(jì)劃真正降低其7nm制程的價(jià)格，降幅約為5%至10%。這一舉措的主要目的是緩解7nm制程產(chǎn)能利用率下滑的壓力。

發(fā)表于 12-01 16:46 ?837次閱讀

簡(jiǎn)述Xilinx 7系列FPGA芯片相關(guān)知識(shí)

芯片的知識(shí)以及特點(diǎn)。一、7系列芯片的工藝級(jí)別 xilinx 7系列FPGA

發(fā)表于 11-28 10:20 ?1052次閱讀

詳細(xì)解讀7nm制程，看半導(dǎo)體巨頭如何拼了老命為摩爾定律延壽

Tick-Tock，是Intel的芯片技術(shù)發(fā)展的戰(zhàn)略模式，在半導(dǎo)體工藝和核心架構(gòu)這兩條道路上交替提升。半導(dǎo)體工藝領(lǐng)域也有類似的形式存在，在14nm/16

發(fā)表于 11-16 11:52 ?2336次閱讀