機(jī)器學(xué)習(xí)實(shí)戰(zhàn)：GNN（圖神經(jīng)網(wǎng)絡(luò)）加速器的FPGA解決方案

應(yīng)用Achronix?Speedster7t FPGA設(shè)計(jì)高能效、可擴(kuò)展的GNN加速器

作者：袁光（Kevin?Yuan），Achronix資深現(xiàn)場(chǎng)應(yīng)用工程師

1.?概述

得益于大數(shù)據(jù)的興起以及算力的快速提升，機(jī)器學(xué)習(xí)技術(shù)在近年取得了革命性的發(fā)展。在圖像分類、語(yǔ)音識(shí)別、自然語(yǔ)言處理等機(jī)器學(xué)習(xí)任務(wù)中，數(shù)據(jù)為大小維度確定且排列有序的歐氏（Euclidean）數(shù)據(jù)。然而，越來(lái)越多的現(xiàn)實(shí)場(chǎng)景中，數(shù)據(jù)是以圖（Graph）這種復(fù)雜的非歐氏數(shù)據(jù)來(lái)表示的。Graph不但包含數(shù)據(jù)，也包含數(shù)據(jù)之間的依賴關(guān)系，比如社交網(wǎng)絡(luò)、蛋白質(zhì)分子結(jié)構(gòu)、電商平臺(tái)客戶數(shù)據(jù)等等。數(shù)據(jù)復(fù)雜度的提升，對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)算法設(shè)計(jì)以及其實(shí)現(xiàn)技術(shù)帶來(lái)了嚴(yán)峻的挑戰(zhàn)。在此背景之下，諸多基于Graph的新型機(jī)器學(xué)習(xí)算法—GNN（圖神經(jīng)網(wǎng)絡(luò)），在學(xué)術(shù)界和產(chǎn)業(yè)界不斷的涌現(xiàn)出來(lái)。

GNN對(duì)算力和存儲(chǔ)器的要求非常高，其算法的軟件實(shí)現(xiàn)方式非常低效，所以業(yè)界對(duì)GNN的硬件加速有著非常迫切的需求。我們知道傳統(tǒng)的CNN（卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)）硬件加速方案已經(jīng)有非常多的解決方案；但是，GNN的硬件加速尚未得到充分的討論和研究，在本文撰寫之時(shí)，Google和百度皆無(wú)法搜索到關(guān)于GNN硬件加速的中文研究。本文的撰寫動(dòng)機(jī)，旨在將國(guó)外最新的GNN算法、加速技術(shù)研究、以及筆者對(duì)GNN的FPGA加速技術(shù)的探討相結(jié)合起來(lái)，以全景圖的形式展現(xiàn)給讀者。

2.?GNN?簡(jiǎn)介

GNN的架構(gòu)在宏觀層面有著很多與傳統(tǒng)CNN類似的地方，比如卷積層、Polling、激活函數(shù)、機(jī)器學(xué)習(xí)處理器（MLP）和FC層等等模塊，都會(huì)在GNN中得以應(yīng)用。下圖展示了一個(gè)比較簡(jiǎn)單的GNN架構(gòu)。

圖?1：典型的GNN架構(gòu)（來(lái)源：https://arxiv.org/abs/1901.00596）

但是， GNN中的Graph數(shù)據(jù)卷積計(jì)算與傳統(tǒng)CNN中的2D卷積計(jì)算是不同的。以圖2為例，針對(duì)紅色目標(biāo)節(jié)點(diǎn)的卷積計(jì)算，其過(guò)程如下：

lGraph卷積：以鄰居函數(shù)采樣周邊節(jié)點(diǎn)特征并計(jì)算均值，其鄰居節(jié)點(diǎn)數(shù)量不確定且無(wú)序（非歐氏數(shù)據(jù)）。

l2D卷積：以卷積核采樣周邊節(jié)點(diǎn)特征并計(jì)算加權(quán)平均值，其鄰居節(jié)點(diǎn)數(shù)量確定且有序（歐氏數(shù)據(jù)）。

圖?2： Graph卷積和2D卷積（來(lái)源：https://arxiv.org/abs/1901.00596）

3.?GraphSAGE算法簡(jiǎn)介

學(xué)術(shù)界已對(duì)GNN算法進(jìn)行了非常多的研究討論，并提出了數(shù)目可觀的創(chuàng)新實(shí)現(xiàn)方式。其中，斯坦福大學(xué)在2017年提出的GraphSAGE是一種用于預(yù)測(cè)大型圖中動(dòng)態(tài)新增未知節(jié)點(diǎn)類型的歸納式表征學(xué)習(xí)算法，特別針對(duì)節(jié)點(diǎn)數(shù)量巨大、且節(jié)點(diǎn)特征豐富的圖做了優(yōu)化。如下圖所示，GraphSAGE計(jì)算過(guò)程可分為三個(gè)主要步驟：

圖?3：GraphSAGE算法的視覺(jué)表述（來(lái)源：http://snap.stanford.edu/graphsage）

l鄰節(jié)點(diǎn)采樣：用于降低復(fù)雜度，一般采樣2層，每一層采樣若干節(jié)點(diǎn)

l聚合：用于生成目標(biāo)節(jié)點(diǎn)的embedding，即graph的低維向量表征

l預(yù)測(cè)：將embedding作為全連接層的輸入，預(yù)測(cè)目標(biāo)節(jié)點(diǎn)d的標(biāo)簽

為了在FPGA中實(shí)現(xiàn)GraphSAGE算法加速，我們需要知悉其數(shù)學(xué)模型，以便將算法映射到不同的邏輯模塊中。下圖所示的代碼闡述了本算法的數(shù)學(xué)過(guò)程。

圖?4：GraphSAGE算法的數(shù)學(xué)模型（來(lái)源：http://snap.stanford.edu/graphsage）

對(duì)于每一個(gè)待處理的目標(biāo)節(jié)點(diǎn)xv，GraphSAGE?執(zhí)行下列操作：

1）通過(guò)鄰居采樣函數(shù)N（v），采樣子圖(subgraph)中的節(jié)點(diǎn)

2）聚合被采樣的鄰節(jié)點(diǎn)特征，聚合函數(shù)可以為mean()、lstm()或者?polling()等

3）將聚合結(jié)果與上一次迭代的輸出表征合并，并以Wk做卷積

4）卷積結(jié)果做非線性處理

5）迭代若干次以結(jié)束當(dāng)前第k層所有鄰節(jié)點(diǎn)的處理

6）將第k層迭代結(jié)果做歸一化處理

7）迭代若干次以結(jié)束所有K層采樣深度的處理

8）最終迭代結(jié)果zv即為輸入節(jié)點(diǎn)xv的嵌入（embedding）

4.?GNN加速器設(shè)計(jì)挑戰(zhàn)

GNN的算法中涉及到大量的矩陣計(jì)算和內(nèi)存訪問(wèn)操作，在傳統(tǒng)的x86架構(gòu)的服務(wù)器上運(yùn)行此算法是非常低效的，表現(xiàn)在速度慢，能耗高等方面。

新型GPU的應(yīng)用，可以為GNN的運(yùn)算速度和能效比帶來(lái)顯著收益。然而GPU內(nèi)存擴(kuò)展性的短板，使其無(wú)法勝任海量節(jié)點(diǎn)Graph的處理；GPU的指令執(zhí)行方式，也造成了計(jì)算延遲過(guò)大并且不可確定，無(wú)法勝任需要實(shí)時(shí)計(jì)算Graph的場(chǎng)景。

如上所述種種設(shè)計(jì)挑戰(zhàn)的存在，使得業(yè)界急需一種可以支持高度并發(fā)實(shí)時(shí)計(jì)算、巨大內(nèi)存容量和帶寬、以及在數(shù)據(jù)中心范圍可擴(kuò)展的GNN加速解決方案。

5.?GNN加速器的FPGA設(shè)計(jì)方案

Achronix 公司推出的 Speedster7t系列高性能FPGA，專門針對(duì)數(shù)據(jù)中心和機(jī)器學(xué)習(xí)工作負(fù)載進(jìn)行了優(yōu)化，消除了CPU、GPU以及傳統(tǒng) FPGA 存在的若干性能瓶頸。Speedster7t FPGA 基于臺(tái)積電的 7nm FinFET 工藝，其架構(gòu)采用革命性的新型 2D 片上網(wǎng)絡(luò) （NoC），獨(dú)創(chuàng)的機(jī)器學(xué)習(xí)處理器矩陣（MLP），并利用高帶寬 GDDR6 控制器、400G 以太網(wǎng)和 PCI Express Gen5 接口，在保障ASIC 級(jí)別性能的同時(shí)，為用戶提供了靈活的硬件可編程能力。下圖展示了Speedster7t1500高性能FPGA的架構(gòu)。

圖5:?Achronix?Speedster7t1500?高性能FPGA?架構(gòu) （來(lái)源：http://www.achronix.com）

如上所述種種特性，使得Achronix?Speedster7t1500 FPGA器件為GNN加速器設(shè)計(jì)中所面臨的各種挑戰(zhàn)，提供了完美的解決方案。

表1：GNN設(shè)計(jì)挑戰(zhàn)與Achronix的Speedster7t1500?FPGA解決方案

GNN設(shè)計(jì)挑戰(zhàn)	Speedster7t1500解決方案
高速矩陣運(yùn)算	MLP機(jī)器學(xué)習(xí)處理器矩陣
高帶寬低延遲存儲(chǔ)	LRAM+BRAM+GDDR6+DDR4
高并發(fā)低延遲計(jì)算	FPGA使用可編程邏輯電路，在硬件層面確保低高并發(fā)延遲計(jì)算
內(nèi)存擴(kuò)展	基于4*400Gbps的RDMA，確保在數(shù)據(jù)中心范圍以極低延遲擴(kuò)展內(nèi)存訪問(wèn)
算法不斷演進(jìn)	FPGA使用可編程邏輯電路，在硬件層面確保算法可升級(jí)重配
設(shè)計(jì)復(fù)雜	豐富的硬IP減少開(kāi)發(fā)時(shí)間和復(fù)雜度，NoC簡(jiǎn)化模塊間互連并提高時(shí)序

5.1?GNN加速器頂層架構(gòu)

本GNN加速器針對(duì)GraphSAGE進(jìn)行設(shè)計(jì)，但其架構(gòu)具有一定的通用性，可以適用于其他類似的GNN算法加速，其頂層架構(gòu)如下圖所示。

圖6:?GNN加速器頂層架構(gòu)（來(lái)源：Achronix原創(chuàng)）

圖中GNN?Core為算法實(shí)現(xiàn)的核心部分，其設(shè)計(jì)細(xì)節(jié)將在下文展開(kāi)談?wù)?；RoCE-Lite為RDMA協(xié)議的輕量級(jí)版本，用于通過(guò)高速以太網(wǎng)進(jìn)行遠(yuǎn)程內(nèi)存訪問(wèn)，以支持海量節(jié)點(diǎn)的Graph計(jì)算，其設(shè)計(jì)細(xì)節(jié)將在本公眾號(hào)的后續(xù)文章中討論；400GE以太網(wǎng)控制器用來(lái)承載RoCE-Lite協(xié)議；GDDR6用于存放GNN處理過(guò)程中所需的高速訪問(wèn)數(shù)據(jù)；DDR4作為備用高容量?jī)?nèi)存，可以用于存儲(chǔ)相對(duì)訪問(wèn)頻度較低的數(shù)據(jù)，比如待預(yù)處理的Graph；PCIe?Gen5x16提供高速主機(jī)接口，用于與服務(wù)器軟件交互數(shù)據(jù)；上述所有模塊，皆通過(guò)NoC片上網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)高速互聯(lián)。

5.2?GNN?Core?微架構(gòu)

在開(kāi)始討論GNN?Core?微架構(gòu)之前，我們先回顧一下本文第3節(jié)中的GraphSAGE算法，其內(nèi)層循環(huán)的聚合以及合并（包含卷積）等兩個(gè)操作占據(jù)了算法的絕大部分計(jì)算和存儲(chǔ)器訪問(wèn)。通過(guò)研究，我們得到這兩個(gè)步驟的特征如下：

表2：GNN算法中聚合與合并操作對(duì)比（來(lái)源：https://arxiv.org/abs/1908.10834）

?	聚合操作（Aggregation）	合并操作（Combination）
存儲(chǔ)器訪問(wèn)模式	間接訪問(wèn)，不規(guī)則	直接訪問(wèn)，規(guī)則
數(shù)據(jù)復(fù)用	低	高
計(jì)算模式	動(dòng)態(tài)，不規(guī)則	靜態(tài)，規(guī)則
計(jì)算量	低	高
性能瓶頸	存儲(chǔ)	計(jì)算

可以看出，聚合操作與合并操作，其對(duì)計(jì)算和存儲(chǔ)器訪問(wèn)的需求完全不同。聚合操作中涉及到對(duì)鄰節(jié)點(diǎn)的采樣，然而Graph屬于非歐氏數(shù)據(jù)類型，其大小維度不確定且無(wú)序，矩陣稀疏，節(jié)點(diǎn)位置隨機(jī)，所以存儲(chǔ)器訪問(wèn)不規(guī)則并難以復(fù)用數(shù)據(jù)；在合并操作中，其輸入數(shù)據(jù)為聚合結(jié)果（節(jié)點(diǎn)的低維表征）以及權(quán)重矩陣，其大小維度固定，存儲(chǔ)位置規(guī)則線性，對(duì)存儲(chǔ)器訪問(wèn)不存在挑戰(zhàn)，但是矩陣的計(jì)算量非常大。

基于以上分析，我們決定在GNN?Core加速器設(shè)計(jì)中用兩種不同的硬件結(jié)構(gòu)來(lái)處理聚合操作與合并操作，功能框圖如下圖所示：

圖7:?GNN?Core功能框圖（來(lái)源：Achronix原創(chuàng)）

聚合器（Aggregator）：通過(guò)SIMD（單指令多數(shù)據(jù)處理器）陣列來(lái)對(duì)Graph進(jìn)行鄰居節(jié)點(diǎn)采樣并進(jìn)行聚合操作。其中的“單指令”可以預(yù)定義為mean()均值計(jì)算，或者其他適用的聚合函數(shù)；“多數(shù)據(jù)”則表示單次mean()均值計(jì)算中需要多個(gè)鄰居節(jié)點(diǎn)的特征數(shù)據(jù)作為輸入，而這些數(shù)據(jù)來(lái)自于子圖采樣器（Subgraph?Sampler）；SIMD陣列通過(guò)調(diào)度器Agg Scheduler做負(fù)載均衡；子圖采樣器通過(guò)NoC從GDDR6或DDR4讀回的鄰接矩陣和節(jié)點(diǎn)特征數(shù)據(jù)h0v，分別緩存在Adjacent?List?Buffer和Node?Feature Buffer之中；聚合的結(jié)果hkN(v)存儲(chǔ)在Agg?Buffer之中。

合并器（Combinator）：通過(guò)脈動(dòng)矩陣PE來(lái)執(zhí)行聚合結(jié)果的卷積操作；卷積核為Wk權(quán)重矩陣；卷積結(jié)果通過(guò)ReLU激活函數(shù)做非線性處理，同時(shí)也存儲(chǔ)在Partial?Sum?Buffer中以方便下一輪迭代。

合并的結(jié)果通過(guò)L2BN歸一化處理之后，即為最終的節(jié)點(diǎn)表征hkv。

在比較典型的節(jié)點(diǎn)分類預(yù)測(cè)應(yīng)用中，該節(jié)點(diǎn)表征hkv可以通過(guò)一個(gè)全連接層（FC），以得到該節(jié)點(diǎn)的分類標(biāo)簽。此過(guò)程屬于傳統(tǒng)的機(jī)器學(xué)習(xí)處理方法之一，沒(méi)有在GraphSAGE論文中體現(xiàn)，此設(shè)計(jì)中也沒(méi)有包含這個(gè)功能。

6.?結(jié)論

本文深入討論了GraphSAGE?GNN?算法的數(shù)學(xué)原理，并從多個(gè)維度分析了GNN加速器設(shè)計(jì)中的技術(shù)挑戰(zhàn)。作者通過(guò)分解問(wèn)題并在架構(gòu)層面逐一解決的方法，綜合運(yùn)用Achronix?Speedster7t1500?FPGA所提供的競(jìng)爭(zhēng)優(yōu)勢(shì)，創(chuàng)造了一個(gè)性能極佳且高度可擴(kuò)展的GNN加速解決方案。

閱讀全文

FPGA(591969) FPGA(591969)
存儲(chǔ)器(161623) 存儲(chǔ)器(161623)
機(jī)器學(xué)習(xí)(130422) 機(jī)器學(xué)習(xí)(130422)
Achronix(22461) Achronix(22461)
GNN(6280) GNN(6280)

評(píng)論

相關(guān)推薦

PowerVR Series2NX神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)

我的母親是一名護(hù)士，目前已經(jīng)退休。她是一個(gè)非常聰明的人，對(duì)自己的工作業(yè)務(wù)非常的盡職盡責(zé)。幾天前我和她說(shuō)我正在研究Imagination最新的神經(jīng)網(wǎng)絡(luò)加速器，她詫異的說(shuō)：你說(shuō)的是什么意思？，當(dāng)然只有

2018-06-19 18:36:17

5332

圖神經(jīng)網(wǎng)絡(luò)概述第三彈：來(lái)自IEEE Fellow的GNN綜述

本文來(lái)源：機(jī)器之心編譯作者：Zonghan Wu 圖神經(jīng)網(wǎng)絡(luò)（GNN）熱度持續(xù)上升，之前我們?cè)榻B了清華兩篇綜述論文，參見(jiàn)：深度學(xué)習(xí)時(shí)代的圖模型，清華發(fā)文綜述圖網(wǎng)絡(luò)，和清華大學(xué)圖神經(jīng)網(wǎng)絡(luò)綜述：模型

2019-01-10 10:26:12

12097

FPGA芯片用于神經(jīng)網(wǎng)絡(luò)算法優(yōu)化的設(shè)計(jì)實(shí)現(xiàn)方案

前言 AI芯片（這里只談FPGA芯片用于神經(jīng)網(wǎng)絡(luò)加速）的優(yōu)化主要有三個(gè)方面：算法優(yōu)化，編譯器優(yōu)化以及硬件優(yōu)化。算法優(yōu)化減少的是神經(jīng)網(wǎng)絡(luò)的算力，它確定了神經(jīng)網(wǎng)絡(luò)部署實(shí)現(xiàn)效率的上限。編譯器優(yōu)化和硬件優(yōu)化

2020-09-29 11:36:09

4383

基于FPGA的GNN加速器頂層架構(gòu)

接上一篇...... GNN加速器頂層架構(gòu) 此GNN加速器是為GraphSAGE算法設(shè)計(jì)的，但是它的設(shè)計(jì)也可以應(yīng)用于其他類似的GNN算法加速。其頂層架構(gòu)如下圖所示。該架構(gòu)由以下模塊組成：圖中

2021-08-27 09:44:26

7613

GNN（圖神經(jīng)網(wǎng)絡(luò)）硬件加速的FPGA實(shí)戰(zhàn)解決方案

，對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)算法設(shè)計(jì)以及其實(shí)現(xiàn)技術(shù)帶來(lái)了嚴(yán)峻的挑戰(zhàn)。在此背景之下，諸多基于Graph的新型機(jī)器學(xué)習(xí)算法—GNN（圖神經(jīng)網(wǎng)絡(luò)），在學(xué)術(shù)界和產(chǎn)業(yè)界不斷的涌現(xiàn)出來(lái)。GNN對(duì)算力和存儲(chǔ)器的要求非常高，其

2021-07-07 08:00:00

機(jī)器學(xué)習(xí)實(shí)戰(zhàn)：GNN加速器的FPGA解決方案

的提升，對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)算法設(shè)計(jì)以及其實(shí)現(xiàn)技術(shù)帶來(lái)了嚴(yán)峻的挑戰(zhàn)。在此背景之下，諸多基于Graph的新型機(jī)器學(xué)習(xí)算法—GNN（圖神經(jīng)網(wǎng)絡(luò)），在學(xué)術(shù)界和產(chǎn)業(yè)界不斷的涌現(xiàn)出來(lái)。GNN對(duì)算力和存儲(chǔ)器的要求非常高

2020-10-20 09:48:39

機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)的代價(jià)函數(shù)

吳恩達(dá)機(jī)器學(xué)習(xí)筆記之神經(jīng)網(wǎng)絡(luò)參數(shù)的反向傳播算法

2019-05-22 15:11:21

神經(jīng)網(wǎng)絡(luò)解決方案讓自動(dòng)駕駛成為現(xiàn)實(shí)

、成本及功耗的要求。輕型嵌入式神經(jīng)網(wǎng)絡(luò)卷積式神經(jīng)網(wǎng)絡(luò) (CNN) 的應(yīng)用可分為三個(gè)階段：訓(xùn)練、轉(zhuǎn)化及 CNN 在生產(chǎn)就緒解決方案中的執(zhí)行。要想獲得一個(gè)高性價(jià)比、針對(duì)大規(guī)模車輛應(yīng)用的高效結(jié)果，必須在每階段

2017-12-21 17:11:34

神經(jīng)網(wǎng)絡(luò)教程（李亞非）

　　第1章概述　　1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展　　1.2 生物神經(jīng)元　　1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成　　第2章人工神經(jīng)網(wǎng)絡(luò)基本模型　　2.1 MP模型　　2.2 感知器模型　　2.3 自適應(yīng)線性

2012-03-20 11:32:43

神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索有什么優(yōu)勢(shì)？

近年來(lái)，深度學(xué)習(xí)的繁榮，尤其是神經(jīng)網(wǎng)絡(luò)的發(fā)展，顛覆了傳統(tǒng)機(jī)器學(xué)習(xí)特征工程的時(shí)代，將人工智能的浪潮推到了歷史最高點(diǎn)。然而，盡管各種神經(jīng)網(wǎng)絡(luò)模型層出不窮，但往往模型性能越高，對(duì)超參數(shù)的要求也越來(lái)越嚴(yán)格

2019-09-11 11:52:14

神經(jīng)網(wǎng)絡(luò)資料

基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法

2019-05-16 17:25:05

AI知識(shí)科普 | 從無(wú)人相信到萬(wàn)人追捧的神經(jīng)網(wǎng)絡(luò)

誤差反向傳播算法的學(xué)習(xí)過(guò)程，由信息的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成，是一種應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)。先來(lái)看一下BP神經(jīng)網(wǎng)絡(luò)的流程圖：由BP神經(jīng)網(wǎng)絡(luò)流程圖可以看出，正向傳播處理過(guò)程和人工神經(jīng)網(wǎng)絡(luò)的流程

2018-06-05 10:11:50

ETPU-Z2全可編程神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)平臺(tái)

是一臺(tái)包含GPU的服務(wù)器或高性能PC，Device從機(jī)是一個(gè)ZYNQ/FPGA開(kāi)發(fā)板。另一方面，通常情況下，當(dāng)落地到具體場(chǎng)景解決某個(gè)具體問(wèn)題時(shí)，神經(jīng)網(wǎng)絡(luò)算法通常僅是整體解決方案的一小部分，其他的算法和流程

2020-05-18 17:13:24

EdgeBoard中神經(jīng)網(wǎng)絡(luò)算子在FPGA中的實(shí)現(xiàn)方法是什么？

FPGA加速的關(guān)鍵因素是什么？EdgeBoard中神經(jīng)網(wǎng)絡(luò)算子在FPGA中的實(shí)現(xiàn)方法是什么？

2021-09-28 06:37:44

MATLAB神經(jīng)網(wǎng)絡(luò)工具箱函數(shù)

MATLAB神經(jīng)網(wǎng)絡(luò)工具箱函數(shù)說(shuō)明：本文檔中所列出的函數(shù)適用于MATLAB5.3以上版本，為了簡(jiǎn)明起見(jiàn)，只列出了函數(shù)名，若需要進(jìn)一步的說(shuō)明，請(qǐng)參閱MATLAB的幫助文檔。1. 網(wǎng)絡(luò)創(chuàng)建函數(shù)newp

2009-09-22 16:10:08

labview BP神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)

請(qǐng)問(wèn)：我在用labview做BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)故障診斷，在NI官網(wǎng)找到了機(jī)器學(xué)習(xí)工具包（MLT），但是里面沒(méi)有關(guān)于這部分VI的幫助文檔，對(duì)于”BP神經(jīng)網(wǎng)絡(luò)分類“這個(gè)范例有很多不懂的地方，比如

2017-02-22 16:08:08

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+學(xué)習(xí)和一些思考

AI加速器設(shè)計(jì)的學(xué)習(xí)和一些思考致謝首先感謝電子發(fā)燒友論壇提供的書籍然后為該書打個(gè)廣告吧，32K的幅面，非常小巧方便，全彩印刷，質(zhì)量精良，很有質(zhì)感。前言設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)首先要考慮的幾個(gè)問(wèn)題

2023-09-16 11:11:01

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀后感

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀感 ? ?在本書的引言中也提到“一圖勝千言”，讀完第一章節(jié)后，對(duì)其進(jìn)行了一些歸納（如圖1），第一章對(duì)常見(jiàn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了介紹，舉例了一些結(jié)構(gòu)

2023-09-11 20:34:01

【AI學(xué)習(xí)】第3篇--人工神經(jīng)網(wǎng)絡(luò)

`本篇主要介紹：人工神經(jīng)網(wǎng)絡(luò)的起源、簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)模型、更多神經(jīng)網(wǎng)絡(luò)模型、機(jī)器學(xué)習(xí)的步驟：訓(xùn)練與預(yù)測(cè)、訓(xùn)練的兩階段：正向推演與反向傳播、以TensorFlow + Excel表達(dá)訓(xùn)練流程以及AI普及化教育之路。`

2020-11-05 17:48:39

【PYNQ-Z2申請(qǐng)】基于PYNQ-Z2的神經(jīng)網(wǎng)絡(luò)圖形識(shí)別

項(xiàng)目名稱：基于PYNQ-Z2的神經(jīng)網(wǎng)絡(luò)圖形識(shí)別試用計(jì)劃：申請(qǐng)理由：本人為一名嵌入式軟件工程師，對(duì)FPGA有一段時(shí)間的接觸，基于FPGA設(shè)計(jì)過(guò)簡(jiǎn)單的ASCI數(shù)字芯片。目前正好在學(xué)習(xí)基于python

2019-01-09 14:48:59

【PYNQ-Z2申請(qǐng)】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車

項(xiàng)目名稱：基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車試用計(jì)劃：一、本人技術(shù)背景本人有四年以上的嵌入式開(kāi)發(fā)和三年以上的機(jī)器視覺(jué)領(lǐng)域項(xiàng)目實(shí)踐經(jīng)驗(yàn)，在計(jì)算機(jī)視覺(jué)與FPGA數(shù)字圖像處理方面有較多的理論研究與項(xiàng)目實(shí)踐

2018-12-19 11:36:24

【PYNQ-Z2申請(qǐng)】基于PYNQ的卷積神經(jīng)網(wǎng)絡(luò)加速

探索整個(gè)過(guò)程中資源利用的優(yōu)化使整個(gè)過(guò)程更加節(jié)能高效預(yù)計(jì)成果：1、在PYNQ上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)2、對(duì)以往實(shí)現(xiàn)結(jié)構(gòu)進(jìn)行優(yōu)化3、為卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)路在硬件上，特別是在FPGA實(shí)現(xiàn)提供一種優(yōu)化思路和方案

2018-12-19 11:37:22

【PYNQ-Z2試用體驗(yàn)】神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí)

神經(jīng)網(wǎng)絡(luò)首先來(lái)看一下維基百科對(duì)神經(jīng)網(wǎng)絡(luò)的定義：人工神經(jīng)網(wǎng)絡(luò)（英語(yǔ)：Artificial Neural Network，ANN），簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)（Neural Network，NN）或類神經(jīng)網(wǎng)絡(luò)，在機(jī)器

2019-03-03 22:10:19

【PYNQ-Z2試用體驗(yàn)】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車 - 項(xiàng)目規(guī)劃

小車運(yùn)動(dòng)的控制信號(hào)，實(shí)現(xiàn)小車自動(dòng)駕駛。在初步實(shí)現(xiàn)方案中，為了快速實(shí)現(xiàn)整體功能，使用軟件神經(jīng)網(wǎng)絡(luò)作為控制器，使用單片機(jī)作為底盤電機(jī)的控制器。在進(jìn)一步的實(shí)現(xiàn)中，所有數(shù)據(jù)處理和底盤控制全部由Zynq FPGA

2019-03-02 23:10:52

【書籍評(píng)測(cè)活動(dòng)NO.18】 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，掌握如何從零開(kāi)始設(shè)計(jì)一個(gè)能用、好用的產(chǎn)品級(jí)加速器。通過(guò)閱讀本書，你將：透徹理解與深度學(xué)習(xí)相關(guān)的機(jī)器學(xué)習(xí)算法及其實(shí)現(xiàn) 學(xué)會(huì)主流圖像處理領(lǐng)域神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 掌握加速器運(yùn)算子系統(tǒng)和存儲(chǔ)子系統(tǒng)

2023-07-28 10:50:51

【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

今天學(xué)習(xí)了兩個(gè)神經(jīng)網(wǎng)絡(luò)，分別是自適應(yīng)諧振（ART）神經(jīng)網(wǎng)絡(luò)與自組織映射（SOM）神經(jīng)網(wǎng)絡(luò)。整體感覺(jué)不是很難，只不過(guò)一些最基礎(chǔ)的概念容易理解不清。首先ART神經(jīng)網(wǎng)絡(luò)是競(jìng)爭(zhēng)學(xué)習(xí)的一個(gè)代表，競(jìng)爭(zhēng)型學(xué)習(xí)

2019-07-21 04:30:00

【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)

}或o koko_{k}）的誤差神經(jīng)元偏倚的變化量：ΔΘ ΔΘ Delta Theta=學(xué)習(xí)步長(zhǎng)η ηeta × ×imes 乘以神經(jīng)元的誤差BP神經(jīng)網(wǎng)絡(luò)算法過(guò)程網(wǎng)絡(luò)的初始化：包括權(quán)重和偏倚的初始化計(jì)算

2019-07-21 04:00:00

一種基于FPGA的圖神經(jīng)網(wǎng)絡(luò)加速器解決方案

擴(kuò)展到數(shù)據(jù)中心的GNN加速解決方案?；?b class="flag-6" style="color: red">FPGA設(shè)計(jì)方案的GNN加速器Achronix的Speedster?7t系列FPGA產(chǎn)品（以及該系列的第一款器件AC7t1500）是針對(duì)數(shù)據(jù)中心和機(jī)器學(xué)習(xí)工作負(fù)載

2021-09-25 17:20:41

人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方法有哪些？

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network，ANN)是一種類似生物神經(jīng)網(wǎng)絡(luò)的信息處理結(jié)構(gòu)，它的提出是為了解決一些非線性，非平穩(wěn)，復(fù)雜的實(shí)際問(wèn)題。那有哪些辦法能實(shí)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)呢？

2019-08-01 08:06:21

什么是LSTM神經(jīng)網(wǎng)絡(luò)

簡(jiǎn)單理解LSTM神經(jīng)網(wǎng)絡(luò)

2021-01-28 07:16:57

分享機(jī)器學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的工作流程和相關(guān)操作

機(jī)器學(xué)習(xí)算法篇--卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)（Convolutional Neural Network）

2019-02-14 16:37:29

卷積神經(jīng)網(wǎng)絡(luò)如何使用

卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么，鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史，您為什么還會(huì)在意它呢? 對(duì)于這些非常中肯的問(wèn)題，我們似乎可以給出相對(duì)簡(jiǎn)明的答案。

2019-07-17 07:21:50

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用轉(zhuǎn)載****地址：http://fcst.ceaj.org/CN/abstract/abstract2521.shtml深度學(xué)習(xí)是機(jī)器學(xué)習(xí)和人工智能研究的最新趨勢(shì)，作為一個(gè)

2022-08-02 10:39:39

卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)和常用框架

　　卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)　　卷積神經(jīng)網(wǎng)絡(luò)的常用框架

2020-12-29 06:16:44

卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介：什么是機(jī)器學(xué)習(xí)？

抽象人工智能（AI）的世界正在迅速發(fā)展，人工智能越來(lái)越多地支持以前無(wú)法實(shí)現(xiàn)或非常難以實(shí)現(xiàn)的應(yīng)用程序。本系列文章解釋了卷積神經(jīng)網(wǎng)絡(luò) （CNN）及其在 AI 系統(tǒng)中機(jī)器學(xué)習(xí)中的重要性。CNN 是從

2023-02-23 20:11:10

發(fā)布MCU上跑的輕量神經(jīng)網(wǎng)絡(luò)包 NNoM，讓MCU也神經(jīng)一把

Spotting）使用運(yùn)動(dòng)傳感器識(shí)別活動(dòng)狀態(tài) （Human Activity Recognition）神經(jīng)網(wǎng)絡(luò)控制系統(tǒng) （替代PID等傳統(tǒng)控制方法）圖像處理（帶專用加速器的 MCU）...它輕量但不低能，它支持

2019-05-01 19:03:01

基于 FPGA 的目標(biāo)檢測(cè)網(wǎng)絡(luò)加速電路設(shè)計(jì)

適合加速卷積神經(jīng)網(wǎng)絡(luò)，但與之對(duì) 應(yīng)的是 GPU 有著功耗高，空間占用大等缺點(diǎn)，很多場(chǎng)合對(duì)功耗有嚴(yán)格的限制，而 GPU 難以應(yīng)用于這類需求。近些年來(lái) FPGA 性能的不斷提升，同時(shí) FPGA 具有

2023-06-20 19:45:12

基于FPGA的神經(jīng)網(wǎng)絡(luò)的性能評(píng)估及局限性

FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)關(guān)鍵問(wèn)題分析基于FPGA的ANN實(shí)現(xiàn)方法基于FPGA的神經(jīng)網(wǎng)絡(luò)的性能評(píng)估及局限性

2021-04-30 06:58:13

基于BP神經(jīng)網(wǎng)絡(luò)的PID控制

最近在學(xué)習(xí)電機(jī)的智能控制，上周學(xué)習(xí)了基于單神經(jīng)元的PID控制，這周研究基于BP神經(jīng)網(wǎng)絡(luò)的PID控制。神經(jīng)網(wǎng)絡(luò)具有任意非線性表達(dá)能力，可以通過(guò)對(duì)系統(tǒng)性能的學(xué)習(xí)來(lái)實(shí)現(xiàn)具有最佳組合的PID控制。利用BP

2021-09-07 07:43:47

基于BP神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別系統(tǒng)

η ∈（0,1）代表學(xué)習(xí)速率?！　∮捎贐P 神經(jīng)網(wǎng)絡(luò)算法的收斂速度慢，優(yōu)化的目標(biāo)函數(shù)非常復(fù)雜，所以需要優(yōu)化學(xué)習(xí)速率。三層感知器的BP 學(xué)習(xí)算法權(quán)值調(diào)整計(jì)算公式為：　　　　將每個(gè)加速度傳感器中每個(gè)軸的數(shù)據(jù)

2018-11-13 16:04:45

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

FPGA 上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò)，在處理大規(guī)模圖像識(shí)別任務(wù)以及與機(jī)器學(xué)習(xí)類似的其他問(wèn)題方面已大獲成功。在當(dāng)前案例中,針對(duì)在 FPGA 上實(shí)現(xiàn) CNN 做一個(gè)可行性研究

2019-06-19 07:24:41

如何使用ECP5FPGA解決網(wǎng)絡(luò)邊緣應(yīng)用設(shè)計(jì)挑戰(zhàn)

開(kāi)發(fā)者提供了極具吸引力的優(yōu)勢(shì)。圖11展示了一個(gè)實(shí)例，其中ECP5 FPGA用于實(shí)現(xiàn)推理加速器，對(duì)來(lái)自攝像頭的數(shù)據(jù)運(yùn)行預(yù)先訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)（CNN）進(jìn)行處理。運(yùn)行在FPGA上的CNN引擎識(shí)別

2020-10-21 11:53:02

如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)？

如何用stm32cube.ai簡(jiǎn)化人工神經(jīng)網(wǎng)絡(luò)映射？如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)？

2021-10-11 08:05:42

如何構(gòu)建神經(jīng)網(wǎng)絡(luò)？

原文鏈接：http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)包括：輸入層：根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層：使用反向傳播優(yōu)化輸入變量權(quán)重的層，以提高模型的預(yù)測(cè)能力輸出層：基于輸入和隱藏層的數(shù)據(jù)輸出預(yù)測(cè)

2021-07-12 08:02:11

如何用ARM和FPGA搭建神經(jīng)網(wǎng)絡(luò)處理器通信方案？

某人工神經(jīng)網(wǎng)絡(luò)的FPGA處理器能夠?qū)?shù)據(jù)進(jìn)行運(yùn)算處理，為了實(shí)現(xiàn)集數(shù)據(jù)通信、操作控制和數(shù)據(jù)處理于一體的便攜式神經(jīng)網(wǎng)絡(luò)處理器，需要設(shè)計(jì)一種基于嵌入式ARM內(nèi)核及現(xiàn)場(chǎng)可編程門陣列FPGA的主從結(jié)構(gòu)處理系統(tǒng)滿足要求。

2021-05-21 06:35:27

如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問(wèn)題？

人工智能下面有哪些機(jī)器學(xué)習(xí)分支？如何用卷積神經(jīng)網(wǎng)絡(luò)（CNN）方法去解決機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問(wèn)題？

2021-06-16 08:09:03

如何移植一個(gè)CNN神經(jīng)網(wǎng)絡(luò)到FPGA中？

訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)并移植到Lattice FPGA上，通常需要開(kāi)發(fā)人員既要懂軟件又要懂?dāng)?shù)字電路設(shè)計(jì)，是個(gè)不容易的事。好在FPGA廠商為我們提供了許多工具和IP，我們可以在這些工具和IP的基礎(chǔ)上做

2020-11-26 07:46:03

如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

稱為BP神經(jīng)網(wǎng)絡(luò)。采用BP神經(jīng)網(wǎng)絡(luò)模型能完成圖像數(shù)據(jù)的壓縮處理。在圖像壓縮中，神經(jīng)網(wǎng)絡(luò)的處理優(yōu)勢(shì)在于：巨量并行性；信息處理和存儲(chǔ)單元結(jié)合在一起；自組織自學(xué)習(xí)功能。與傳統(tǒng)的數(shù)字信號(hào)處理器DSP

2019-08-08 06:11:30

嵌入式神經(jīng)網(wǎng)絡(luò)有哪些挑戰(zhàn)

能?！　∵@些挑戰(zhàn)如果處理不當(dāng)，將構(gòu)成重大威脅。一方面，必須要克服硬件限制條件，以在嵌入式平臺(tái)上執(zhí)行NN。另一方面，必須要克服挑戰(zhàn)的第二部分，以便快速達(dá)成解決方案，因?yàn)樯鲜袝r(shí)間是關(guān)鍵。還原至硬件解決方案以加速上市時(shí)間也不是一個(gè)明智選擇，因?yàn)樗鼰o(wú)法提供靈活性，并將快速成為發(fā)展進(jìn)化神經(jīng)網(wǎng)絡(luò)領(lǐng)域中的障礙。

2020-06-30 11:01:16

怎么設(shè)計(jì)ARM與神經(jīng)網(wǎng)絡(luò)處理器的通信方案？

FPGA的嵌入式應(yīng)用。某人工神經(jīng)網(wǎng)絡(luò)的FPGA處理器能夠?qū)?shù)據(jù)進(jìn)行運(yùn)算處理，為了實(shí)現(xiàn)集數(shù)據(jù)通信、操作控制和數(shù)據(jù)處理于一體的便攜式神經(jīng)網(wǎng)絡(luò)處理器，需要設(shè)計(jì)一種基于嵌入式ARM內(nèi)核及現(xiàn)場(chǎng)可編程門陣列FPGA的主從結(jié)構(gòu)處理系統(tǒng)滿足要求。

2019-09-20 06:15:20

恩智浦eIQ? Neutron神經(jīng)處理單元

可通過(guò)多種方式，其中最有效的是將專門構(gòu)建的專用神經(jīng)處理單元（NPU），或稱為機(jī)器學(xué)習(xí)加速器（MLA）或深度學(xué)習(xí)加速器（DLA）集成到器件中，以補(bǔ)充CPU計(jì)算核心。恩智浦提供廣泛的產(chǎn)品組合，從傳統(tǒng)

2023-02-17 13:51:16

求BP神經(jīng)網(wǎng)絡(luò)PID控制電機(jī)加速勻速減速運(yùn)動(dòng)的simulink的仿真模型

求一個(gè)simulink的蓄電池用BP神經(jīng)網(wǎng)絡(luò)PID控制電機(jī)加速勻速減速運(yùn)動(dòng)的模型仿真

2020-02-22 02:15:50

用FPGA去實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)

1、加速神經(jīng)網(wǎng)絡(luò)的必備開(kāi)源項(xiàng)目　　到底純FPGA適不適合這種大型神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)？這個(gè)問(wèn)題其實(shí)我們不適合回答，但是FPGA廠商是的實(shí)際操作是很有權(quán)威性的，現(xiàn)在不論是Intel還是Xilinx都沒(méi)有在

2022-10-24 16:10:50

脈沖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式有哪幾種？

脈沖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式有哪幾種？

2021-10-26 06:58:01

脈沖耦合神經(jīng)網(wǎng)絡(luò)在FPGA上的實(shí)現(xiàn)誰(shuí)會(huì)？

脈沖耦合神經(jīng)網(wǎng)絡(luò)（PCNN）在FPGA上的實(shí)現(xiàn)，實(shí)現(xiàn)數(shù)據(jù)分類功能，有報(bào)酬。QQ470345140.

2013-08-25 09:57:14

解析深度學(xué)習(xí)：卷積神經(jīng)網(wǎng)絡(luò)原理與視覺(jué)實(shí)踐

解析深度學(xué)習(xí)：卷積神經(jīng)網(wǎng)絡(luò)原理與視覺(jué)實(shí)踐

2020-06-14 22:21:12

請(qǐng)問(wèn)一下fpga加速神經(jīng)網(wǎng)絡(luò)為什么要用arm核呢

請(qǐng)問(wèn)一下fpga加速神經(jīng)網(wǎng)絡(luò)為什么要用arm核呢？用其他的不行嗎

2022-07-25 14:37:58

超低功耗FPGA解決方案助力機(jī)器學(xué)習(xí)

IoT應(yīng)用。通過(guò)提供結(jié)合了靈活、超低功耗FPGA硬件和軟件解決方案、功能全面的機(jī)器學(xué)習(xí)推理技術(shù)，Lattice sensAI將加速網(wǎng)絡(luò)邊緣設(shè)備上傳感器數(shù)據(jù)處理和分析的集成。這些新的網(wǎng)絡(luò)邊緣計(jì)算解決方案

2018-05-23 15:31:04

輕量化神經(jīng)網(wǎng)絡(luò)的相關(guān)資料下載

原文鏈接：【嵌入式AI部署&基礎(chǔ)網(wǎng)絡(luò)篇】輕量化神經(jīng)網(wǎng)絡(luò)精述--MobileNet V1-3、ShuffleNet V1-2、NasNet深度神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用在圖像分類、物體檢測(cè)等機(jī)器

2021-12-14 07:35:25

采用Xilinx FPGA加速機(jī)器學(xué)習(xí)應(yīng)用

平臺(tái)是專門針對(duì)圖像和語(yǔ)言識(shí)別等機(jī)器學(xué)習(xí)應(yīng)用而精心打造。此外，百度還計(jì)劃采用這些平臺(tái)來(lái)開(kāi)發(fā)商業(yè)可行的自動(dòng)駕駛汽車。百度數(shù)據(jù)中心采用的功能強(qiáng)大的集中式加速器群可根據(jù)用戶需要進(jìn)行快速配置，以滿足極為嚴(yán)苛

2016-12-15 17:15:52

隱藏技術(shù): 一種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器

隱藏技術(shù): 一種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器 Copy東京理工大學(xué)的研究人員開(kāi)發(fā)了一種名為“ Hiddenite”的新型加速器芯片，該芯片可以在計(jì)算稀疏“隱藏神經(jīng)網(wǎng)絡(luò)”時(shí)達(dá)到最高的精度

2022-03-17 19:15:13

云中的機(jī)器學(xué)習(xí)：FPGA上的深度神經(jīng)網(wǎng)絡(luò)

憑借出色的性能和功耗指標(biāo)，賽靈思 FPGA 成為設(shè)計(jì)人員構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)的首選。新的軟件工具可簡(jiǎn)化實(shí)現(xiàn)工作。人工智能正在經(jīng)歷一場(chǎng)變革，這要得益于機(jī)器學(xué)習(xí)的快速進(jìn)步。在機(jī)器學(xué)習(xí)領(lǐng)域，人們正對(duì)一類名為

2017-11-17 11:47:42

1268

優(yōu)化基于FPGA的深度卷積神經(jīng)網(wǎng)絡(luò)的加速器設(shè)計(jì)

CNN已經(jīng)廣泛用于圖像識(shí)別，因?yàn)樗苣７律镆曈X(jué)神經(jīng)的行為獲得很高識(shí)別準(zhǔn)確率。最近，基于深度學(xué)習(xí)算法的現(xiàn)代應(yīng)用高速增長(zhǎng)進(jìn)一步改善了研究和實(shí)現(xiàn)。特別地，多種基于FPGA平臺(tái)的深度CNN加速器被提出

2017-11-17 13:31:01

7686

PowerVR與神經(jīng)網(wǎng)絡(luò)加速器

近來(lái)，如果你對(duì)神經(jīng)網(wǎng)絡(luò)有所關(guān)注，那么你一定會(huì)發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的市場(chǎng)如日中天。實(shí)際上，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)已經(jīng)成為了人人所熟知的技術(shù)。如果你還對(duì)此很陌生，那么你可以看看我的另一篇博客，里面對(duì)相關(guān)概念進(jìn)行了

2018-04-25 16:18:00

1227

為什么使用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)以及需要了解的八種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

機(jī)器學(xué)習(xí)已經(jīng)在各個(gè)行業(yè)得到了大規(guī)模的廣泛應(yīng)用，并為提升業(yè)務(wù)流程的效率、提高生產(chǎn)率做出了極大的貢獻(xiàn)。這篇文章主要介紹了機(jī)器學(xué)習(xí)中最先進(jìn)的算法之一——神經(jīng)網(wǎng)絡(luò)的八種不同架構(gòu)，并從原理和適用范圍進(jìn)行了

2018-01-10 16:30:08

11405

Nallatech公司FPGA解決方案如何用于HPC、網(wǎng)絡(luò)加速和數(shù)據(jù)分析？

OpenCL 軟件開(kāi)發(fā)套件來(lái)編程的、獨(dú)立的英特爾 Arria 10 FPGA 加速器，從而展示對(duì)卷積神經(jīng)網(wǎng)絡(luò) （CNN）對(duì)象分類的 FPGA 加速能力。FPGA 接口和 IP 構(gòu)建在 BVLC

2018-07-31 09:04:00

1608

如何使用神經(jīng)網(wǎng)絡(luò)模型加速圖像數(shù)據(jù)集的分類

通過(guò)圖像分類示例，了解Xilinx FPGA如何加速機(jī)器學(xué)習(xí)，這是關(guān)鍵的數(shù)據(jù)中心工作負(fù)載。該演示使用Alexnet神經(jīng)網(wǎng)絡(luò)模型加速了ImageNet圖像數(shù)據(jù)集的分類。它已經(jīng)實(shí)施了

2018-11-21 06:08:00

2276

Imagination發(fā)布最新神經(jīng)網(wǎng)絡(luò)加速器

Imagination Technologies宣布推出其面向人工智能（AI）應(yīng)用的最新神經(jīng)網(wǎng)絡(luò)加速器（NNA）架構(gòu)PowerVR Series3NX。

2018-12-06 16:09:32

3256

了解深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的現(xiàn)狀,英特爾FPGA實(shí)施神經(jīng)網(wǎng)絡(luò)的必然之選

在英特爾公司，FPGA 當(dāng)稱實(shí)施神經(jīng)網(wǎng)絡(luò)的必然之選，它可在同一設(shè)備上處理計(jì)算、邏輯和存儲(chǔ)資源中的不同算法。與其它同行對(duì)手的裝置相比，其性能更快，用戶可通過(guò)硬件來(lái)完成核心部分運(yùn)算。加上軟件開(kāi)發(fā)者可使用 OpenCL?1 C 級(jí)編程標(biāo)準(zhǔn)，將 FPGA 作為標(biāo)準(zhǔn) CPU 的加速器，更加無(wú)需處理硬件級(jí)設(shè)計(jì)。

2018-12-17 16:03:16

3992

FPGA的深度學(xué)習(xí)加速器有怎樣的挑戰(zhàn)和機(jī)遇

FPGA 的神經(jīng)網(wǎng)絡(luò)加速器如今越來(lái)越受到 AI 社區(qū)的關(guān)注，本文對(duì)基于 FPGA 的深度學(xué)習(xí)加速器存在的機(jī)遇與挑戰(zhàn)進(jìn)行了概述。近年來(lái)，神經(jīng)網(wǎng)絡(luò)在各種領(lǐng)域相比于傳統(tǒng)算法有了極大的進(jìn)步。在圖像、視頻

2019-01-29 16:48:00

6092

多項(xiàng)第一!Imagination神經(jīng)網(wǎng)絡(luò)加速器通過(guò)AIIA DNN benchmark評(píng)估

基于端側(cè)推斷任務(wù)深度神經(jīng)網(wǎng)絡(luò)處理器基準(zhǔn)測(cè)試結(jié)果中，Imagination的神經(jīng)網(wǎng)絡(luò)加速器在多個(gè)框架測(cè)試中成績(jī)名列第一！

2019-07-12 15:23:47

5005

Imagination 的神經(jīng)網(wǎng)絡(luò)加速器在邊緣計(jì)算領(lǐng)域的應(yīng)用

神經(jīng)網(wǎng)絡(luò)加速賦能端側(cè)智能

2019-08-08 10:59:51

4316

嵌入式神經(jīng)網(wǎng)絡(luò)加速器的市場(chǎng)需求將持續(xù)增加

隨著許多嵌入式系開(kāi)始變得智能且自主，以人工智能（AI）神經(jīng)網(wǎng)絡(luò)為導(dǎo)向的嵌入式系統(tǒng)市場(chǎng)即將起飛，神經(jīng)網(wǎng)絡(luò)加速器大戰(zhàn)一觸發(fā)。

2019-11-22 11:40:06

902

圖神經(jīng)網(wǎng)絡(luò)逆勢(shì)而上，7日學(xué)懂入門圖

要問(wèn)這幾年一直在逆勢(shì)而上的技術(shù)有哪些？你一定不會(huì)忽略它圖神經(jīng)網(wǎng)絡(luò)。相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)，圖神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)非常明顯： 1、非順序排序的特征學(xué)習(xí)：GNN的輸出不以節(jié)點(diǎn)的輸入順序?yàn)檗D(zhuǎn)移的。 2、兩個(gè)節(jié)點(diǎn)之間

2020-11-26 13:54:57

1471

美信半導(dǎo)體新型神經(jīng)網(wǎng)絡(luò)加速器MAX78000 SoC

? ? 新型神經(jīng)網(wǎng)絡(luò)加速器 Maxim Integrated的新型MAX78000芯片，基于雙核MCU，結(jié)合了超低功耗深度神經(jīng)網(wǎng)絡(luò)加速器，為高性能人工智能 (AI) 應(yīng)用提供所需的算力，是機(jī)器視覺(jué)

2021-01-04 11:48:49

2589

神經(jīng)網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是神經(jīng)網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費(fèi)下載包括了:1生物神經(jīng)元模型，2人工神經(jīng)元模型，3人工神經(jīng)網(wǎng)絡(luò)模型，4神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法

2021-01-20 11:20:05

神經(jīng)網(wǎng)絡(luò)加速器簡(jiǎn)述

神經(jīng)網(wǎng)絡(luò)加速器基本概念。

2021-05-27 15:22:59

基于FPGA的SIMD卷積神經(jīng)網(wǎng)絡(luò)加速器

了一種基于FPGA的SIM卷積神經(jīng)網(wǎng)絡(luò)加速器架構(gòu)。以YOOV2目標(biāo)檢測(cè)算法為例，介紹了將卷積神經(jīng)網(wǎng)絡(luò)模型映射到FPGA上的完整流程;對(duì)加速器的性能和資源耗費(fèi)進(jìn)行深λ分析和建模，將實(shí)際傳輸延時(shí)考慮在內(nèi)，縮小了加速器理論時(shí)延與實(shí)際時(shí)延

2021-05-28 14:00:22

什么是AI加速器如何確需要AI加速器

AI加速器是一類專門的硬件加速器或計(jì)算機(jī)系統(tǒng)旨在加速人工智能的應(yīng)用，主要應(yīng)用于人工智能、人工神經(jīng)網(wǎng)絡(luò)、機(jī)器視覺(jué)和機(jī)器學(xué)習(xí)。

2022-02-06 12:47:00

3645

如何用圖神經(jīng)網(wǎng)絡(luò)（GNN）做CV的研究

用圖神經(jīng)網(wǎng)絡(luò)（GNN）做CV的研究有不少，但通常是圍繞點(diǎn)云數(shù)據(jù)做文章，少有直接處理圖像數(shù)據(jù)的。其實(shí)與CNN把一張圖片看成一個(gè)網(wǎng)格、Transformer把圖片拉直成一個(gè)序列相比，圖方法更適合學(xué)習(xí)不規(guī)則和復(fù)雜物體的特征。

2022-08-16 10:21:50

1098

什么是神經(jīng)網(wǎng)絡(luò)？什么是卷積神經(jīng)網(wǎng)絡(luò)？

在介紹卷積神經(jīng)網(wǎng)絡(luò)之前，我們先回顧一下神經(jīng)網(wǎng)絡(luò)的基本知識(shí)。就目前而言，神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)算法的核心，我們所熟知的很多深度學(xué)習(xí)算法的背后其實(shí)都是神經(jīng)網(wǎng)絡(luò)。

2023-02-23 09:14:44

2252

卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介：什么是機(jī)器學(xué)習(xí)？

隨著人工智能(AI)技術(shù)的快速發(fā)展，AI可以越來(lái)越多地支持以前無(wú)法實(shí)現(xiàn)或者難以實(shí)現(xiàn)的應(yīng)用。本文基于此解釋了卷積神經(jīng)網(wǎng)絡(luò)(CNN)及其對(duì)人工智能和機(jī)器學(xué)習(xí)的意義。CNN是一種能夠從復(fù)雜數(shù)據(jù)中提取特征

2023-03-11 23:10:04

523