0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于深度學習的人工智能(AI)應用

安富利 ? 來源:安富利 ? 作者:安富利 ? 2020-09-02 11:20 ? 次閱讀

如今,基于深度學習(DL)的人工智能AI)應用越來越廣泛,不論是在與個人消費者相關(guān)的智能家居智能駕駛等領(lǐng)域,還是在視頻監(jiān)控、智慧城市等公共管理領(lǐng)域,我們都能看到其身影。 眾所周知,實施一個完整的AI應用需要經(jīng)歷訓練和推理兩個過程。所謂“訓練”,就是我們要將大量的數(shù)據(jù)代入到神經(jīng)網(wǎng)絡模型中運算并反復迭代,“教會”算法模型如何正確的工作,訓練出一個DL模型。而接下來,我們就可以利用訓練出來的模型來在線響應用戶的需求,根據(jù)輸入的新數(shù)據(jù)做出正確而及時的決策判斷,這個過程就是“推理”。

通常來講,一個AI應用中“訓練”只需要做一次——有時這個工作會交給第三方專業(yè)的且有充沛算力資源的團隊去做,而應用開發(fā)工程師要做的則是將訓練好的模型部署到特定的硬件平臺上,滿足目標應用場景中推理過程的需要。由于推理過程會直接聯(lián)系最終用戶,推理的準確性和速度也會直接影響到用戶體驗的好壞,因此如何有效地為AI推理做加速,也就成了當下開發(fā)者普遍關(guān)心的一個熱門的話題。

AI推理加速,FPGA勝出! 從硬件架構(gòu)來看,可以支持AI推理加速的有四個可選方案,它們分別是:CPU、GPU、FPGA和ASIC,如果對這幾類器件的特性進行比較,會發(fā)現(xiàn)按照從左到右的順序,器件的靈活性/適應性是遞減的,而處理能力和性能功耗比則是遞增的。 CPU是基于馮?諾依曼架構(gòu),雖然其很靈活,但由于存儲器訪問往往要耗費幾個時鐘周期才能執(zhí)行一個簡單的任務,延遲會很長,應對神經(jīng)網(wǎng)絡(NN)這種計算密集型的任務,功耗也會比較大,顯然最不適合做AI推理。 GPU具有強大的數(shù)據(jù)并行處理能力,在做海量數(shù)據(jù)訓練方面優(yōu)勢明顯,而推理計算通常一次只對一個輸入項進行處理的應用,GPU并行計算的優(yōu)勢發(fā)揮不出來,再加上其功耗相對較大,所以在AI推理方面也不是最優(yōu)選擇。 從高性能和低功耗的角度來看,定制的ASIC似乎是一種理想的解決方案,但其開發(fā)周期長、費用高,對于總是處于快速演進和迭代中的DL和NN算法來說,靈活性嚴重受限,風險太大,在AI推理中人們通常不會考慮它。

所以我們的名單上只剩下FPGA了。這些年來大家對于FPGA快速、靈活和高效的優(yōu)點認識越來越深入,硬件可編程的特性使其能夠針對DL和NN處理的需要做針對性的優(yōu)化,提供充足的算力,而同時又保持了足夠的靈活性。今天基于FPGA的異構(gòu)計算平臺,除了可編程邏輯,還會集成多個Arm處理器內(nèi)核、DSP、片上存儲器等資源,DL所需的處理能力可以很好地映射到這些FPGA資源上,而且所有這些資源都可以并行工作 ,即每個時鐘周期可觸發(fā)多達數(shù)百萬個同時的操作,這對于AI推理是再合適不過了。 與CPU和GPU相比,F(xiàn)PGA在AI推理應用方面的優(yōu)勢還表現(xiàn)在:

不受數(shù)據(jù)類型的限制,比如它可以處理非標準的低精度數(shù)據(jù),從而提高數(shù)據(jù)處理的吞吐量。

功耗更低,針對相同的NN計算,F(xiàn)PGA與CPU/GPU相比平均功耗低5~10倍。

可通過重新編程以適應不同任務的需要,這種靈活性對于適應持續(xù)發(fā)展中的DL和NN算法尤為關(guān)鍵。

應用范圍廣,從云端到邊緣端的AI推理工作,都可勝任。

總之一句話,在AI推理計算的競爭中,F(xiàn)PGA的勝出沒有懸念。

GPU無縫對接,F(xiàn)PGA即插即用

不過,雖然FPGA看上去“真香”,但是很多AI應用的開發(fā)者還是對其“敬而遠之”,究其原因最重要的一點就是——FPGA上手使用太難了! 難點主要體現(xiàn)在兩個方面:

首先,對FPGA進行編程需要特定的技能和知識,要熟悉專門的硬件編程語言,還要熟練使用FPGA的特定工具,才能通過綜合、布局和布線等復雜的步驟來編譯設(shè)計。這對于很多嵌入式工程師來說,完全是一套他們所不熟悉的“語言”。

再有,因為很多DL模型是在GPU等計算架構(gòu)上訓練出來的,這些訓練好的模型移植、部署到FPGA上時,很可能會遇到需要重新訓練和調(diào)整參數(shù)等問題,這要求開發(fā)者有專門的AI相關(guān)的知識和技能。

如何能夠降低大家在AI推理中使用FPGA的門檻?在這方面,Mipsology公司給我們帶來了一個“驚喜”——該公司開發(fā)了一種基于FPGA的深度學習推理引擎Zebra,可以讓開發(fā)者在“零努力(Zero Effort)”的情況下,對GPU訓練的模型代碼進行轉(zhuǎn)換,使其能夠在FPGA上運行,而無需改寫任何代碼或者進行重新訓練。 這也就意味著,調(diào)整NN參數(shù)甚至改變神經(jīng)網(wǎng)絡并不需要強制重新編譯FPGA,而這些重新編譯工作可能需要花費數(shù)小時、數(shù)天,甚至更長時間??梢哉f,Zebra讓FPGA對于開發(fā)者成了“透明”的,他們可以在NN模型訓練好之后,無縫地從CPU或GPU切換到FPGA進行推理,而無需花費更多的時間! 目前,Zebra可以支持Caffe、Caffe2、MXNet和TensorFlow等主流NN框架。在硬件方面,Zebra已經(jīng)可以完美地支持Xilinx的系列加速卡,如Alveo U200、Alveo U250和Alveo U50等。對于開發(fā)者來說,“一旦將FPGA板插入PC,只需一個Linux命令”,F(xiàn)PGA就能夠代替CPU或GPU立即進行無縫的推斷,可以在更低的功耗下將計算速度提高一個數(shù)量級。對用戶來說,這無疑是一種即插即用的體驗。

圖1,Zebra可適應由GPU加速器訓練的NN,并無縫地在FPGA上部署

強強聯(lián)手,全生態(tài)支持 更好的消息是:為了能夠加速更多AI應用的落地,安富利亞洲和 Mipsology 達成了合作協(xié)議,將向其亞太區(qū)客戶推廣和銷售 Mipsology 這一獨特的 FPGA 深度學習推理加速軟件 —— Zebra。 這對于合作的雙方無疑是一個雙贏的局面:對于Mipsology來說,可以讓Zebra這個創(chuàng)新的工具以更快的速度覆蓋和惠及更多的開發(fā)者;對安富利來說,此舉也進一步擴展了自身強大的物聯(lián)網(wǎng)生態(tài)系統(tǒng),為客戶帶來更大的價值,為希望部署DL的客戶提供一整套全面的服務,包括硬件、軟件、系統(tǒng)集成、應用開發(fā)、設(shè)計鏈和專業(yè)技術(shù)。

安富利推理加速成功應用案例:智能網(wǎng)絡監(jiān)控平臺AI Bluebox 想學習更多Zebra 軟件的“神奇之處”,掌握如何基于Zebra 軟件、安富利服務器以及賽靈思的Alveo加速卡,方便有效地安裝正確的 CNN 神經(jīng)網(wǎng)絡推理加速器,深入地體驗基于Zebra 的解決方案如何無縫替代 GPU 板卡做AI 推理?立即報名參加9月3日(周四)下午1430【活動預告】安富利攜手 Mipsology 加速 AI 解決方案部署網(wǎng)絡研討會,技術(shù)大咖為您一一解答!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235029
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120593

原文標題:無縫替代GPU,讓FPGA加速你的AI推理!

文章出處:【微信號:AvnetAsia,微信公眾號:安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬
    發(fā)表于 09-09 15:36

    【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學家做了什么?
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度
    發(fā)表于 07-29 17:05

    Python中的人工智能框架與實例

    人工智能AI)領(lǐng)域,Python因其簡潔的語法、豐富的庫和強大的社區(qū)支持,成為了最受歡迎的編程語言之一。本文將詳細介紹Python中的人工智能框架,并通過具體實例展示如何使用這些框架來實現(xiàn)不同
    的頭像 發(fā)表于 07-15 14:54 ?665次閱讀

    基于AI深度學習的缺陷檢測系統(tǒng)

    在工業(yè)生產(chǎn)中,缺陷檢測是確保產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工檢測方法不僅效率低下,且易受人為因素影響,導致誤檢和漏檢問題頻發(fā)。隨著人工智能技術(shù)的飛速發(fā)展,特別是深度學習技術(shù)的崛起,基于
    的頭像 發(fā)表于 07-08 10:30 ?539次閱讀

    人工智能、機器學習深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度
    的頭像 發(fā)表于 07-03 18:22 ?673次閱讀

    人工智能深度學習的五大模型及其應用領(lǐng)域

    隨著科技的飛速發(fā)展,人工智能AI)技術(shù)特別是深度學習在各個領(lǐng)域展現(xiàn)出了強大的潛力和廣泛的應用價值。深度
    的頭像 發(fā)表于 07-03 18:20 ?2243次閱讀

    如何使用PyTorch構(gòu)建更高效的人工智能

    隨著人工智能技術(shù)的迅猛發(fā)展,深度學習作為其重要分支,已經(jīng)在各個領(lǐng)域展現(xiàn)出了強大的潛力和應用價值。PyTorch作為由Facebook研發(fā)和維護的開源深度
    的頭像 發(fā)表于 07-02 13:12 ?226次閱讀

    2024年十大頂尖的人工智能芯片制造供應商

    如下圖所示,神經(jīng)網(wǎng)絡的參數(shù)數(shù)量(即寬度和深度)以及模型大小都在增加。為了構(gòu)建更好的深度學習模型和強大的人工智能應用程序,組織需要增加計算能力和內(nèi)存帶寬。
    的頭像 發(fā)表于 05-19 14:27 ?2071次閱讀
    2024年十大頂尖<b class='flag-5'>的人工智能</b>芯片制造供應商

    機器學習怎么進入人工智能

    人工智能(Artificial Intelligence,AI)是一門涉及計算機、工程、數(shù)學、哲學和認知科學等多個領(lǐng)域的交叉學科,旨在構(gòu)建智能化計算機系統(tǒng),使之能夠自主感知、理解、學習
    的頭像 發(fā)表于 04-04 08:41 ?151次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    ://t.elecfans.com/v/25653.html 人工智能 初學者完整學習流程實現(xiàn)手寫數(shù)字識別案例 28分55秒 https://t.elecfans.com/v/27184.html
    發(fā)表于 04-01 10:40

    FPGA在深度學習應用中或?qū)⑷〈鶪PU

    ,這使得它比一般處理器更高效。但是,很難對 FPGA 進行編程,Larzul 希望通過自己公司開發(fā)的新平臺解決這個問題。 專業(yè)的人工智能硬件已經(jīng)成為了一個獨立的產(chǎn)業(yè),但對于什么是深度學習算法的最佳
    發(fā)表于 03-21 15:19

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國內(nèi)外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式
    發(fā)表于 02-26 10:17

    深度學習人工智能中的 8 種常見應用

    深度學習簡介深度學習人工智能AI)的一個分支,它教神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 12-01 08:27 ?2968次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在<b class='flag-5'>人工智能</b>中的 8 種常見應用