0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm機(jī)器學(xué)習(xí)處理器助力邊緣設(shè)備機(jī)器學(xué)習(xí)

pmkA_arm_china ? 來源:未知 ? 作者:胡薇 ? 2018-06-26 10:57 ? 次閱讀

如果能夠擁有一部智能個(gè)人助理,它能聽懂我們說的話并做出智能反應(yīng),然后處理日常任務(wù),那感覺一定很棒。鑒于機(jī)器學(xué)習(xí)(ML)領(lǐng)域近期取得的進(jìn)展,Arm相信這一天很快就會(huì)到來。機(jī)器學(xué)習(xí)已經(jīng)遠(yuǎn)遠(yuǎn)越過移動(dòng)市場的邊界,延伸到醫(yī)療保健、零售、汽車和服務(wù)器等領(lǐng)域,從只能識(shí)別貓的圖片發(fā)展到可以解決現(xiàn)實(shí)問題的水平。

現(xiàn)在主要的難點(diǎn)是如何將這種能力轉(zhuǎn)移到邊緣,解決如今普遍存在的隱私、安全、帶寬和延遲問題,Arm 機(jī)器學(xué)習(xí)處理器朝這個(gè)方向邁出了一大步。

移動(dòng)性能

機(jī)器學(xué)習(xí)處理器是專門為移動(dòng)和相鄰市場(例如智能相機(jī)、AR/VR、無人機(jī)、醫(yī)療和消費(fèi)性電子產(chǎn)品等)推出的全新設(shè)計(jì),性能為 4.6 TOP/s,能效為 3 TOPs/W。計(jì)算能力和內(nèi)存的進(jìn)一步優(yōu)化大大提高了它們在不同網(wǎng)絡(luò)中的性能。

其架構(gòu)包括用于執(zhí)行卷積層的固定功能引擎以及用于執(zhí)行非卷積層和實(shí)現(xiàn)選定原語和算子的可編程層引擎。網(wǎng)絡(luò)控制單元管理網(wǎng)絡(luò)的整體執(zhí)行和網(wǎng)絡(luò)的遍歷,DMA 負(fù)責(zé)將數(shù)據(jù)移入、移出主內(nèi)存。板載內(nèi)存可以對(duì)重量和特征圖進(jìn)行中央存儲(chǔ),減少流入外部存儲(chǔ)器的流量,從而降低功耗。

有了固定功能和可編程引擎,機(jī)器學(xué)習(xí)處理器變得非常強(qiáng)大、高效和靈活,足以應(yīng)對(duì)未來的挑戰(zhàn),不僅保留了原始性能,還具備多功能性,能夠有效運(yùn)行各種神經(jīng)網(wǎng)絡(luò)。

主要特點(diǎn)

大幅提升 CPU、GPU、DSP 和加速器效率。

采用開源軟件,無鎖定。

與現(xiàn)有軟件框架緊密集成:TensorFlow、TensorFlow Lite、Caffe、Caffe 2。

經(jīng)優(yōu)化后適用于Arm Cortex CPU和Arm Mali GPU。

Arm 機(jī)器學(xué)習(xí)處理器架構(gòu)

為應(yīng)對(duì)多個(gè)市場帶來的挑戰(zhàn),滿足不同的性能需求,從物聯(lián)網(wǎng)的每秒幾 GOP 到服務(wù)器的每秒數(shù)十 TOP,機(jī)器學(xué)習(xí)處理器采用了全新的可擴(kuò)展架構(gòu)。

對(duì)于物聯(lián)網(wǎng)或嵌入式應(yīng)用,該架構(gòu)的性能可降低至約每秒 2 GOP,而對(duì)于 ADAS、5G 或服務(wù)器型應(yīng)用,性能可提高至每秒 150 TOP。這些多重配置的效率可達(dá)到現(xiàn)有解決方案的數(shù)倍。

由于與現(xiàn)有的 Arm CPU、GPU 和其他 IP 兼容,且能提供完整的異構(gòu)系統(tǒng),該架構(gòu)還可通過 TensorFlow、TensorFlow Lite、Caffe 和 Caffe 2 等常用的機(jī)器學(xué)習(xí)框架來獲取。

隨著機(jī)器學(xué)習(xí)的工作負(fù)載不斷增大,計(jì)算需求將呈現(xiàn)出多種形式。Arm 已經(jīng)開始采用擁有不同性能和效率等級(jí)的增強(qiáng)型 CPU 和 GPU,運(yùn)行多種機(jī)器學(xué)習(xí)用例。我們推出Arm 機(jī)器學(xué)習(xí)平臺(tái)的目的在于擴(kuò)大選擇范圍,提供異構(gòu)環(huán)境,滿足每種用例的選擇和靈活性需求,開發(fā)出邊緣智能系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18927

    瀏覽量

    227231
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    8967

    瀏覽量

    365038
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131843

原文標(biāo)題:助力邊緣設(shè)備機(jī)器學(xué)習(xí),Arm機(jī)器學(xué)習(xí)處理器來了!

文章出處:【微信號(hào):arm_china,微信公眾號(hào):Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ARM發(fā)布兩款針對(duì)移動(dòng)終端的AI芯片架構(gòu):物體檢測和機(jī)器學(xué)習(xí)處理器

    ARM發(fā)布了兩款針對(duì)移動(dòng)終端的AI芯片架構(gòu),物體檢測(Object Detection,簡稱OD)處理器機(jī)器學(xué)習(xí)(Machine Learning,簡稱ML)
    的頭像 發(fā)表于 02-23 11:59 ?7277次閱讀
    <b class='flag-5'>ARM</b>發(fā)布兩款針對(duì)移動(dòng)終端的AI芯片架構(gòu):物體檢測和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>處理器</b>

    超低功耗FPGA解決方案助力機(jī)器學(xué)習(xí)

    IoT應(yīng)用。通過提供結(jié)合了靈活、超低功耗FPGA硬件和軟件解決方案、功能全面的機(jī)器學(xué)習(xí)推理技術(shù),Lattice sensAI將加速網(wǎng)絡(luò)邊緣設(shè)備上傳感
    發(fā)表于 05-23 15:31

    Project Trillium-提供業(yè)界最具擴(kuò)展性、應(yīng)用范圍最廣的機(jī)器學(xué)習(xí)計(jì)算平臺(tái)

    的同時(shí),也要求保持出色的能效表現(xiàn)。 基于這樣的需求,Arm宣布推出全新機(jī)器學(xué)習(xí)平臺(tái)Project Trillium。 新的設(shè)備需要高性能的機(jī)器
    發(fā)表于 03-07 20:12

    高性能的機(jī)器學(xué)習(xí)邊緣計(jì)算更給力-iMX8M Plus為邊緣計(jì)算賦能

    、智能零售、智能工廠和智慧城市等應(yīng)用領(lǐng)域而言是必不可少的。以前,機(jī)器學(xué)習(xí)需要成本昂貴而又復(fù)雜的云計(jì)算,也就是“基于云的人工智能”。但現(xiàn)在,很多機(jī)器學(xué)習(xí)操作可在網(wǎng)絡(luò)
    發(fā)表于 09-07 13:49

    高性能的機(jī)器學(xué)習(xí)邊緣計(jì)算更給力-iMX8M Plus為邊緣計(jì)算賦能

    、智能零售、智能工廠和智慧城市等應(yīng)用領(lǐng)域而言是必不可少的。以前,機(jī)器學(xué)習(xí)需要成本昂貴而又復(fù)雜的云計(jì)算,也就是“基于云的人工智能”。但現(xiàn)在,很多機(jī)器學(xué)習(xí)操作可在網(wǎng)絡(luò)
    發(fā)表于 09-07 13:55

    微型機(jī)器學(xué)習(xí)

    人工智能 AI 正在加快速度從云端走向邊緣,進(jìn)入到越來越小的物聯(lián)網(wǎng)設(shè)備中。而這些物聯(lián)網(wǎng)設(shè)備往往體積很小,面臨著許多挑戰(zhàn),例如功耗、延時(shí)以及精度等問題,傳統(tǒng)的機(jī)器
    發(fā)表于 09-15 09:23

    高性能的機(jī)器學(xué)習(xí)邊緣計(jì)算更給力-iMX8M Plus為邊緣計(jì)算賦能

    、智能零售、智能工廠和智慧城市等應(yīng)用領(lǐng)域而言是必不可少的。以前,機(jī)器學(xué)習(xí)需要成本昂貴而又復(fù)雜的云計(jì)算,也就是“基于云的人工智能”。但現(xiàn)在,很多機(jī)器學(xué)習(xí)操作可在網(wǎng)絡(luò)
    發(fā)表于 09-24 09:09

    高性能的機(jī)器學(xué)習(xí)邊緣計(jì)算更給力

    、智能零售、智能工廠和智慧城市等應(yīng)用領(lǐng)域而言是必不可少的。以前,機(jī)器學(xué)習(xí)需要成本昂貴而又復(fù)雜的云計(jì)算,也就是“基于云的人工智能”。但現(xiàn)在,很多機(jī)器學(xué)習(xí)操作可在網(wǎng)絡(luò)
    發(fā)表于 10-15 13:58

    為什么需要將機(jī)器學(xué)習(xí)遷移到邊緣設(shè)備

    專注于邊緣計(jì)算。第一章:為什么需要將機(jī)器學(xué)習(xí)遷移到邊緣設(shè)備機(jī)器
    發(fā)表于 12-20 06:35

    機(jī)器人技術(shù)和機(jī)器學(xué)習(xí)

    機(jī)器人技術(shù)和機(jī)器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個(gè)重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)(IoT)來傳遞信息、共享資源。無論是智能,低能耗,邊緣
    發(fā)表于 12-20 06:03

    什么是TinyML?微型機(jī)器學(xué)習(xí)

    學(xué)習(xí)工具包的一個(gè)例子. 圖片由 Arduino 提供為了達(dá)到1兆瓦的目標(biāo),我們幾乎完全局限于計(jì)算能力較差的硬件,如微控制(mcu)和數(shù)字信號(hào)處理器(dsp)。這些設(shè)備通常是基于 C
    發(fā)表于 04-12 10:20

    什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門

    得它們能夠完美地在傳感旁邊運(yùn)行機(jī)器學(xué)習(xí)工作負(fù)載,而這正是數(shù)據(jù)收集的地方。對(duì)于嵌入式和物聯(lián)網(wǎng)工程師來說,現(xiàn)在是探索機(jī)器學(xué)習(xí)世界的最佳時(shí)機(jī),從
    發(fā)表于 06-21 11:06

    創(chuàng)建一個(gè)邊緣機(jī)器學(xué)習(xí)系統(tǒng)

    本指南適用于系統(tǒng)設(shè)計(jì)人員,可能使用Arm Flexible access程序。 本指南將幫助您開發(fā)可以執(zhí)行機(jī)器學(xué)習(xí)的片上系統(tǒng)(SoC)在邊緣。本指南中介紹的SoC可以
    發(fā)表于 08-02 11:02

    如何使用Arm CMSIS-DSP實(shí)現(xiàn)經(jīng)典機(jī)器學(xué)習(xí)

    的使用CMSIS-DSP開源庫中的其他技術(shù)。 CMSIS-DSP庫是Arm針對(duì)各種Arm優(yōu)化的豐富的DSP函數(shù)集合Cortex-M處理器,如Cortex-M4、Cortex-M7、Cortex-M33
    發(fā)表于 08-02 07:12

    面向工業(yè)邊緣機(jī)器學(xué)習(xí)和智能視覺

    恩智浦通過 i.MX 8M plus應(yīng)用幫助在邊緣實(shí)現(xiàn)基于視覺的應(yīng)用 處理器通過集成兩個(gè)MIPI CSI相機(jī)接口和雙相機(jī)圖像信號(hào)處理器 (ISP),支持高達(dá) 12 萬像素的分辨率,以及 2.3 TOPS 神經(jīng)
    的頭像 發(fā)表于 05-25 09:30 ?727次閱讀