0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思Kria K26 SOM應(yīng)運(yùn)而生為ML邊緣應(yīng)用開(kāi)發(fā)提供了更加理想的選擇

Xilinx賽靈思官微 ? 來(lái)源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2021-07-01 11:52 ? 次閱讀

隨著人工智能機(jī)器學(xué)習(xí)算法取得一系列新進(jìn)展

眾多高計(jì)算強(qiáng)度的應(yīng)用正在被部署到邊緣設(shè)備上

當(dāng)下,業(yè)界迫切需要一種高效率的硬件

既能高效率地執(zhí)行復(fù)雜算法

又能適應(yīng)這種技術(shù)的快速演進(jìn)

在此背景下,賽靈思 Kria K26 SOM應(yīng)運(yùn)而生

為 ML 邊緣應(yīng)用開(kāi)發(fā)提供了更加理想的選擇

賽靈思的研究結(jié)果表明,K26 SOM 提供了比英偉達(dá) Jetson Nano 高出大約 3 倍的性能。此外,它的單位功耗性能較之英偉達(dá) Jetson TX2 提升了 2 倍。對(duì)于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò),K26 SOM 的低時(shí)延、高性能深度學(xué)習(xí)處理單元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

與未來(lái)兼容的 Kria K26 SOM

智能應(yīng)用除了要求亞微秒級(jí)的時(shí)延,還需要具備私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架構(gòu)為基礎(chǔ),Kria K26 SOM 提供了業(yè)界一流的單位功耗性能和更低的總體擁有成本,使之成為邊緣設(shè)備的理想選擇。

原始計(jì)算能力

就在邊緣設(shè)備上部署解決方案而言,硬件必須擁有充足的算力,才能處理先進(jìn) ML 算法工作負(fù)載。我們可以使用各種深度學(xué)習(xí)處理單元 (DPU) 配置對(duì) Kria K26 SOM 進(jìn)行配置,還能根據(jù)性能要求,將最適用的配置集成到設(shè)計(jì)內(nèi)。

支持更低精度的數(shù)據(jù)類型

深度學(xué)習(xí)算法正在以極快的速度演進(jìn)發(fā)展,各種更低精度的數(shù)據(jù)類型和定制數(shù)據(jù)正在進(jìn)入使用。傳統(tǒng)的 GPU 廠商已無(wú)法滿足當(dāng)前的市場(chǎng)需求,而 Kria K26 SOM 能夠支持全系列數(shù)據(jù)類型精度,如 PF32、INT8、二進(jìn)制和其他定制數(shù)據(jù)類型。

低時(shí)延與低功耗

為了改善軟件可編程能力,GPU 架構(gòu)需要頻繁訪問(wèn)外部 DDR。這種做法非常低效,有時(shí)候會(huì)對(duì)高帶寬設(shè)計(jì)要求構(gòu)成瓶頸。相反,Zynq MPSoC 架構(gòu)具有高能效,它的可重配置能

力便于開(kāi)發(fā)者設(shè)計(jì)的應(yīng)用減少或不必訪問(wèn)外部存儲(chǔ)器。這不僅有助于減少應(yīng)用的總功耗,也通過(guò)降低端到端時(shí)延改善了響應(yīng)能力。

靈活性

與數(shù)據(jù)流固定的 GPU 不同,賽靈思硬件提供了靈活性用來(lái)專門地重新配置數(shù)據(jù)路徑,從而實(shí)現(xiàn)最大吞吐量并降低時(shí)延。此外,可編程的數(shù)據(jù)路徑也降低了對(duì)批處理的需求,而批處理是 GPU 的一個(gè)重大不足,需要在降低時(shí)延或提高吞吐量之間做出權(quán)衡取舍。Kria SOM 靈活的架構(gòu)已在稀疏網(wǎng)絡(luò)中展示出巨大潛力。

02

與英偉達(dá) Jetson 性能比較

深度學(xué)習(xí)模型性能比較

根據(jù)測(cè)試數(shù)據(jù),所有模型在 K26 SOM 上的性能數(shù)值均優(yōu)于英偉達(dá) Jetson Nano。而且對(duì)于 SSD Mobilenet-V1 等部分模型,吞吐量則為 Jetson Nano 的四倍以上,為 Jetson Tx2 的兩倍左右,從下表可以很容易地看到顯著的吞吐量提升。

功耗測(cè)量

邊緣設(shè)備提供最佳性能這點(diǎn)非常重要,但同時(shí)必須降低能耗。賽靈思測(cè)量了英偉達(dá)和賽靈思 SOM 模塊在執(zhí)行具體模型時(shí)發(fā)生的峰值功率,結(jié)果很明顯,K26 SOM 優(yōu)于 Jetson Nano

3.5 倍,優(yōu)于 Jetson TX2 2.4 倍。

實(shí)際應(yīng)用性能比較

為了分析實(shí)際用例,我們選擇了一種準(zhǔn)確檢測(cè)和識(shí)別車輛牌照的基于機(jī)器學(xué)習(xí)的應(yīng)用。將 Uncanny Vision 行業(yè)領(lǐng)先的 ANPR 算法部署在 Kria SOM 上后,與英偉達(dá)用 Deepstream-SDK 完成的“車牌識(shí)別”的公開(kāi)數(shù)據(jù)進(jìn)行比較,結(jié)果說(shuō)明,Uncanny Vision 的 ANPR 流水線在針對(duì) KV260 入門套件進(jìn)行優(yōu)化后,實(shí)現(xiàn)了超過(guò) 33fps 的吞吐量,顯著優(yōu)于英偉達(dá)基準(zhǔn)測(cè)試中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。這種前所未有的性能水平為 ANPR 集成商和 OEM 廠商提供了優(yōu)于競(jìng)爭(zhēng)對(duì)手的開(kāi)發(fā)靈活性。

實(shí)際應(yīng)用測(cè)試顯示,K26 SOM 不僅在標(biāo)準(zhǔn)性能比較中表現(xiàn)極其優(yōu)異,并且在為開(kāi)發(fā)者提供加速整體 AI 和視覺(jué)流水線所需的原始性能時(shí),效率也更高。通過(guò)對(duì)比,在標(biāo)準(zhǔn)的基準(zhǔn)測(cè)試領(lǐng)域之外,競(jìng)爭(zhēng)解決方案傾向于提供較低效率水平,而且功耗較高。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4590

    瀏覽量

    128133
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234946
  • SOM
    SOM
    +關(guān)注

    關(guān)注

    0

    文章

    55

    瀏覽量

    15656

原文標(biāo)題:白皮書 | Kria K26:邊緣端視覺(jué) AI 理想平臺(tái)

文章出處:【微信號(hào):賽靈思,微信公眾號(hào):Xilinx賽靈思官微】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    智能安全帶是時(shí)代應(yīng)運(yùn)而生的產(chǎn)物

    面對(duì)傳統(tǒng)安全帶的種種不足,智能安全帶應(yīng)運(yùn)而生。它集成了現(xiàn)代傳感技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析等前沿科技,實(shí)現(xiàn)對(duì)高空作業(yè)工人安全的全方位、智能化監(jiān)控與管理。智能安全帶不僅能夠?qū)崟r(shí)監(jiān)測(cè)工人的身體狀態(tài)
    的頭像 發(fā)表于 08-05 11:07 ?72次閱讀

    快訊 | 發(fā)展新質(zhì)生產(chǎn)力問(wèn)道?如何下好“創(chuàng)新棋”?

    7月11日,南湖區(qū)委宣傳部、清華大學(xué)馬克主義學(xué)院共同帶隊(duì)一行蒞臨圍繞時(shí)頻新質(zhì)生產(chǎn)力創(chuàng)新層面進(jìn)行實(shí)地調(diào)研,副總經(jīng)理田永和、對(duì)外合作部
    的頭像 發(fā)表于 07-12 13:31 ?364次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 發(fā)展新質(zhì)生產(chǎn)力問(wèn)道<b class='flag-5'>賽</b><b class='flag-5'>思</b>?<b class='flag-5'>賽</b><b class='flag-5'>思</b>如何下好“創(chuàng)新棋”?

    貿(mào)澤開(kāi)售適用于工業(yè)、醫(yī)療和機(jī)器人應(yīng)用的AMD/Xilinx Kria K24 SOM

    機(jī)器人、工廠自動(dòng)化等)提供合適的功率、成本和性能。 ? 貿(mào)澤供應(yīng)的AMD/Xilinx Kria? K24 SOMKria?
    發(fā)表于 06-21 15:24 ?851次閱讀
    貿(mào)澤開(kāi)售適用于工業(yè)、醫(yī)療和機(jī)器人應(yīng)用的AMD/Xilinx <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>

    智能化加速,AI邊緣計(jì)算盒子提供強(qiáng)力支持!

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著數(shù)字化時(shí)代的到來(lái),數(shù)據(jù)量呈爆炸式增長(zhǎng),對(duì)數(shù)據(jù)處理的速度和效率提出了更高的要求。傳統(tǒng)的云計(jì)算模式已經(jīng)無(wú)法滿足一些場(chǎng)景的智能化需求。因此,邊緣計(jì)算應(yīng)運(yùn)而生,而邊緣計(jì)算
    的頭像 發(fā)表于 04-12 01:10 ?4925次閱讀
    智能化加速,AI<b class='flag-5'>邊緣</b>計(jì)算盒子<b class='flag-5'>提供</b>強(qiáng)力支持!

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發(fā)表于 04-09 15:03 ?806次閱讀

    AI+多模態(tài)驅(qū)動(dòng),全光交換方案應(yīng)運(yùn)而生

    人工智能(AI)和機(jī)器學(xué)習(xí)(ML)技術(shù)的蓬勃發(fā)展,對(duì)于高性能計(jì)算(HPC)和大規(guī)模數(shù)據(jù)處理的需求不斷攀升。
    的頭像 發(fā)表于 01-05 17:15 ?382次閱讀
    AI+多模態(tài)驅(qū)動(dòng),全光交換方案<b class='flag-5'>應(yīng)運(yùn)而生</b>

    AMD Kria K24 SOM:為邊緣應(yīng)用節(jié)約功耗、縮小尺寸

    作者:Karan Kantharia AMD Kria SOM 產(chǎn)品營(yíng)銷經(jīng)理 無(wú)論是電動(dòng)汽車( EV )充電站的逆變器控制,還是手持式醫(yī)療設(shè)備的傳感器融合,抑或是發(fā)電系統(tǒng)、公共交通、自動(dòng)化多軸工業(yè)
    的頭像 發(fā)表于 10-25 16:15 ?409次閱讀
    AMD <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>:為<b class='flag-5'>邊緣</b>應(yīng)用節(jié)約功耗、縮小尺寸

    【KV260視覺(jué)入門套件試用體驗(yàn)】三、開(kāi)發(fā)板性能評(píng)估

    登錄,SSH協(xié)議登錄是可以支持X11重定向的(也就是遠(yuǎn)程運(yùn)行的圖形化程序,在本地顯示界面): 五、參考鏈接 Xilinx官方的Kira K26 模組wiki: Kria K26SOM - Xilinx
    發(fā)表于 10-17 08:39

    【KV260視覺(jué)入門套件試用體驗(yàn)】四、KV260 視覺(jué)入門套件和固件更新

    入門套件旨在為客戶提供一個(gè)平臺(tái)來(lái)評(píng)估其目標(biāo)應(yīng)用,并最終使用 K26 SOM 設(shè)計(jì)自己的載卡。主要目標(biāo)應(yīng)用包括智慧城市、AI/ML 計(jì)算、安全和未來(lái)零售。 KV260入門套件框圖
    發(fā)表于 10-17 08:28

    淺析AMD Kria K24 SOM電機(jī)控制模塊化應(yīng)用方案

    AMD Kria K24 SOM是一款顛覆性的模塊化解決方案,為電機(jī)控制領(lǐng)域帶來(lái)了更多可能性。其先進(jìn)的特性、靈活的配置和易用的開(kāi)發(fā)環(huán)境使其成為控制平臺(tái)的
    發(fā)表于 10-10 12:43 ?590次閱讀
    淺析AMD <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>電機(jī)控制模塊化應(yīng)用方案

    如何快速部署邊緣就緒的機(jī)器學(xué)習(xí)應(yīng)用

    作者:Stephen Evanczuk 機(jī)器學(xué)習(xí) (ML) 為創(chuàng)造智能產(chǎn)品提供巨大的潛力,但神經(jīng)網(wǎng)絡(luò) (NN) 建模和為邊緣創(chuàng)建 ML應(yīng)用
    的頭像 發(fā)表于 10-03 14:29 ?483次閱讀
    如何快速部署<b class='flag-5'>邊緣</b>就緒的機(jī)器學(xué)習(xí)應(yīng)用

    AMD正式推出Kira K24系統(tǒng)模塊(SOM)

    近日,AMD正式推出了Kira K24系統(tǒng)模塊(SOM)、KD240驅(qū)動(dòng)器入門套件,尺寸極小,能效極高,非常適合對(duì)成本非常敏感的工業(yè)和商業(yè)邊緣應(yīng)用。
    發(fā)表于 09-27 11:04 ?528次閱讀
    AMD正式推出Kira <b class='flag-5'>K</b>24系統(tǒng)模塊(<b class='flag-5'>SOM</b>)

    【KV260視覺(jué)入門套件試用體驗(yàn)】三、缺陷檢測(cè)

    SDK 是一種構(gòu)建在開(kāi)源且被廣泛采用的 GStreamer 框架上的應(yīng)用框架。這種SDK 設(shè)計(jì)上支持跨 所有平臺(tái)的無(wú)縫開(kāi)發(fā),包括
    發(fā)表于 09-26 15:17

    AMD 以面向工業(yè)與商業(yè)應(yīng)用的 Kria K24 SOM 及入門套件加速邊緣創(chuàng)新

    推出 AMD Kria? K24 系統(tǒng)模塊( SOM )和 KD240 驅(qū)動(dòng)器入門套件,這是 Kria 自適應(yīng) SOM
    發(fā)表于 09-25 09:41 ?307次閱讀
    AMD 以面向工業(yè)與商業(yè)應(yīng)用的 <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b> 及入門套件加速<b class='flag-5'>邊緣</b>創(chuàng)新

    將電機(jī)驅(qū)動(dòng)化繁為簡(jiǎn),AMD Kria K24 SOM帶來(lái)更優(yōu)的尺寸、功耗和成本

    設(shè)計(jì),提供各種速度能力,而電機(jī)驅(qū)動(dòng)使得電機(jī)扭矩、轉(zhuǎn)速更大的同時(shí)功耗更低。專家表示,提高電機(jī)的效率將對(duì)全球用電量產(chǎn)生顯著的積極影響。 ? 最近,AMD推出K24 SOM擴(kuò)展Kria自適應(yīng)
    發(fā)表于 09-22 17:28 ?702次閱讀
    將電機(jī)驅(qū)動(dòng)化繁為簡(jiǎn),AMD <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>帶來(lái)更優(yōu)的尺寸、功耗和成本