0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣的超低功耗關鍵短語檢測

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Hussein Osman ? 2022-06-24 10:09 ? 次閱讀

本文將描述一種針對網(wǎng)絡邊緣設計的基于 NN 的關鍵短語檢測解決方案。這些二值化模型可在低功耗 UltraPlus? FPGA 上運行。本文將討論當使用包含嘈雜背景(如音樂或聊天噪聲)的數(shù)據(jù)集訓練 NN 時,如何在嘈雜環(huán)境中使用關鍵短語檢測。在這種情況下,神經(jīng)網(wǎng)絡使用公共數(shù)據(jù)集進行訓練,以檢測“七”這個詞。關鍵短語檢測可用于廣泛的應用,無需個人助理設備。可能的應用包括智能電燈開關、智能電視和 AVR,通過音量增大和減小等命令來管理設備。

一、引言

長期以來,使用語音命令來控制人機界面 (HMI) 一直是系統(tǒng)設計人員的目標。可以追溯到 20 世紀中葉的流行科幻電視節(jié)目和電影,例如《星際迷航》和《星球大戰(zhàn)》,向我們暗示了語音世界的樣子。但事實證明,為現(xiàn)實生活中的消費類應用開發(fā)低成本、高能效的解決方案是難以捉摸的。

然而,在過去幾年中,亞馬遜的 Alexa 和蘋果的 Siri 等流行的人工智能應用程序的出現(xiàn),以及它們將語音命令轉(zhuǎn)換為系統(tǒng)操作的能力,加速了向基于語音的 HMI 的遷移。這些快速進步為越來越多依賴關鍵短語檢測的智能家居解決方案打開了大門。如今,用戶可以要求 Alexa 在互聯(lián)網(wǎng)上訂購產(chǎn)品、開燈、鎖門、設置家庭恒溫器,甚至給草澆水。

通常,這些支持語音的 HMI 執(zhí)行識別云中的關鍵短語所需的計算。在許多情況下,設計師將他們的應用程序插入到預先存在的基礎設施中,比如亞馬遜的 Alexa。然而,這種發(fā)展戰(zhàn)略面臨著一些限制。首先最重要的是成本。在云中的服務器上運行關鍵短語檢測算法的解決方案必須在每次訪問云中的資源時按分鐘付費。此外,構建基于云的邊緣解決方案的開發(fā)人員必須向 NRE 支付費用,以針對特定設備訓練他們的解決方案,然后為他們交付的每個解決方案支付版稅。將他們的設計插入現(xiàn)有基礎設施的設計人員將看到他們的成本隨著他們轉(zhuǎn)向需要更強大的處理器來獲取數(shù)據(jù)、分析數(shù)據(jù)的 Wi-Fi 模型而增加,

此外,依賴互聯(lián)網(wǎng)連接會帶來額外的風險。如果連接中斷,使用互聯(lián)網(wǎng)連接將數(shù)據(jù)傳輸?shù)皆瓶赡軙е路罩袛?。通過互聯(lián)網(wǎng)傳輸數(shù)據(jù)也存在潛在的黑客攻擊風險。從用戶的角度來看,互聯(lián)網(wǎng)連接為侵犯隱私和安全問題打開了大門。依賴直接位于設備上的計算資源的邊緣解決方案避免了這些潛在問題。

二、新的方法

本文探討了一種不同的方法,可以為位于網(wǎng)絡邊緣的設備帶來成本更低的關鍵短語檢測。利用在開發(fā)高精度、緊湊和低成本的二值化神經(jīng)網(wǎng)絡 (NN) 模型方面取得的進展,以及對新一代極低功耗現(xiàn)場可編程門陣列 (FPGA) 的改進,設計人員現(xiàn)在可以構建關鍵短語檢測解決方案,以執(zhí)行所有計算都在邊緣,從而消除了與云連接的 NN 關鍵詞檢測實施相關的連接性、安全性和隱私問題。

通過在本地執(zhí)行關鍵短語檢測,與基于云的解決方案相比,此設計策略可顯著節(jié)省成本。它也不依賴其他生態(tài)系統(tǒng)來運行。如果基于云的解決方案中的 Internet 連接失敗,則系統(tǒng)將失敗。本地的、基于邊緣的解決方案不會冒這種風險。安全和隱私問題不是威脅。本地解決方案更易于用戶設置和運行。最后,使用萊迪思的超低功耗 iCE40 Ultra Plus FPGA,這種方法為設計人員提供了顯著的節(jié)能效果,這是電池供電設備的一個重要考慮因素。例如,本演示文稿中描述的解決方案僅消耗 7 mW。

將負擔得起的智能家居應用帶到邊緣的關鍵步驟是開發(fā)能夠在低密度、低功耗 FPGA 上運行的二值化 NN 模型。在云端使用浮點計算的深度學習技術對于邊緣的消費者應用程序是不切實際的。相反,設計人員必須開發(fā)計算效率高的解決方案,既要滿足精度目標,又要符合消費市場的成本、尺寸和功率限制。因此,在邊緣工作的設計人員必須使用盡可能少的數(shù)學運算。

設計人員可以簡化計算的一種方法是從浮點切換到定點甚至基本整數(shù)。通過補償浮點到定點整數(shù)的量化,使用二值化神經(jīng)網(wǎng)絡的設計人員可以開發(fā)出訓練更快、精度更高的解決方案,并將定點、低精度整數(shù)神經(jīng)網(wǎng)絡的性能提高到接近浮點版本的水平。 為了構建簡單的邊緣設備,訓練必須創(chuàng)建具有 1 位權重的 NN 模型。這些模型稱為二值化神經(jīng)網(wǎng)絡 (BNN)。

通過使用 1 位值而不是更大的數(shù)字,BNN 可以消除乘法和除法的使用。這允許使用 XOR 和彈出計數(shù)來計算卷積,從而導致顯著的成本和高達 16 倍的功耗節(jié)省。借助當今的 FPGA,設計人員擁有了一個高度靈活的平臺,可以提供他們所需的所有存儲器、邏輯和 DSP 資源。

三、神經(jīng)網(wǎng)絡實現(xiàn)

下面的討論描述了一個關鍵短語檢測解決方案的示例,該解決方案專為邊緣應用而設計,并在具有 BNN 軟核的 iCE40 UltraPlus FPGA 中實現(xiàn)。在正常操作期間,關鍵短語檢測實現(xiàn)會在消耗不到 1mW 的情況下偵聽聲音。一旦系統(tǒng)檢測到聲音,它就會激活 1 秒的緩沖并調(diào)用 BNN。BNN 直接對原始輸入進行操作,而不是傳統(tǒng)的頻譜圖和 MFCC 預處理。代表 1 秒音頻的 16K 原始樣本通過重疊的 1D 卷積層,變成 30 個 32x32x3 圖像,每個圖像代表一個 10ms 音頻樣本。然后將輸出傳遞到主 BNN 進行處理。

poYBAGK1HTKAfpnlAAJwxhNRDyk996.png

BNN 有四層深,每層執(zhí)行如下所示的功能:

poYBAGK1HUGABOQ8AAJaIJ7gxnU837.png

二進制卷積是輸入數(shù)據(jù)和 1 位權重的 1 位乘法。在這種情況下,乘法被 XOR 函數(shù)代替。Batch Normalization 和 Scale 在 BNN 訓練階段對激活進行歸一化并提供幫助。整流線性單元 (ReLu) 將低于特定閾值的數(shù)據(jù)設置為 0,高于相同閾值的數(shù)據(jù)設置為 1。對圖像的每個相鄰像素執(zhí)行池化,并選擇概率最高的有意義的像素。此功能減少了后續(xù)步驟所需的計算量。全連接層通常是最后一層,它占用前一層中的每個神經(jīng)元。它對下一層的神經(jīng)元也有一定的影響。這個函數(shù)通常計算量很大,因此它是作為最后一個操作執(zhí)行的,其中神經(jīng)元顯著減少。

BNN 使用 GPU 進行訓練,并運行 Café 和 TensorFlow 等標準訓練工具。使用的訓練數(shù)據(jù)集是一個公共訓練集,包含 65,000 個 1K+ 人 30 個短詞的 1 秒長的話語。這個階段被稱為訓練階段。然后,訓練工具的輸出通過萊迪思半導體的 NN 編譯器工具進行格式化,以供 FPGA 設計使用。您可以將權重視為邊緣硬件推理期間要使用的關鍵短語的模板。選擇的關鍵詞是“七”。

四。系統(tǒng)實施

為了演示系統(tǒng)的功能,工程師使用了帶有 iCE40 UltraPlus FPGA 的 HiMax HM01B0 UPduino 擴展板。這是一款低成本的 Arduino 外形板,旨在展示 FPGA 的功能。該板有兩個直接連接到 FPGA 的 I2S 麥克風、用于 FPGA 設計的外部閃存和權重激活存儲。它還具有用于指示檢測到關鍵短語的 LED。用戶可以直接對著麥克風講話。一旦檢測到關鍵短語,LED 就會亮起。

poYBAGK1HVaAMXEsAAFfdYv32YQ574.png

五、業(yè)績

在此應用中,F(xiàn)PGA 設計頻率和處理長度可以換取功耗。在 27MHz 時,16K 原始樣本,相當于 1 秒的音頻處理,可以在 25ms 內(nèi)處理,同時消耗 7.7mW。當頻率降至 13.5MHz 時,功耗降至 4.2mW,同樣的 1 秒音頻樣本在 50ms 內(nèi)處理完畢。

關鍵短語檢測通常必須在嘈雜的環(huán)境中運行,而無需添加額外的硬件來消除噪聲和回聲。該實現(xiàn)通過使用包含嘈雜背景的數(shù)據(jù)集訓練 NN 來實現(xiàn)這一目標,而無需定位和波束成形。訓練有素的 NN 像人類一樣檢測關鍵詞,但有類似的限制。帶有各種隨機人群噪音水平(咖啡廳、會議等)的數(shù)據(jù)集被添加到關鍵詞中。用較高噪聲水平訓練的 NN 對噪聲的魯棒性更強,但需要更響亮的關鍵短語。

BNN 可以檢測多達十個 1 秒的關鍵短語,非常適合通過語音進行 HMI。為了提高檢測精度,僅在連續(xù)檢測發(fā)生時才使用時域過濾器來報告關鍵短語檢測。該設計為單個關鍵短語提供高達 99% 的準確性,為多達 5 個關鍵短語提供高達 90% 的準確性。

結論

將人工智能帶到邊緣會帶來幾個重大挑戰(zhàn)。然而,它也提供了巨大的機會。正如該項目所展示的,使用 FPGA 實現(xiàn) BNN 而不是基于云的資源將 AI 構建到設備中可以顯著降低硬件成本,同時加快響應時間。同時,保持本地處理可以提高安全性并節(jié)省寶貴的帶寬和服務器使用成本。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1625

    文章

    21636

    瀏覽量

    601310
  • 服務器
    +關注

    關注

    12

    文章

    8976

    瀏覽量

    85100
  • AI
    AI
    +關注

    關注

    87

    文章

    29849

    瀏覽量

    268150
收藏 人收藏

    評論

    相關推薦

    使用MSP430F2013進行超低功耗運動檢測

    電子發(fā)燒友網(wǎng)站提供《使用MSP430F2013進行超低功耗運動檢測.pdf》資料免費下載
    發(fā)表于 10-22 09:29 ?0次下載
    使用MSP430F2013進行<b class='flag-5'>超低功耗</b>運動<b class='flag-5'>檢測</b>

    超低功耗和動態(tài)性能的線性電源

    電子發(fā)燒友網(wǎng)站提供《超低功耗和動態(tài)性能的線性電源.pdf》資料免費下載
    發(fā)表于 09-18 11:22 ?0次下載
    <b class='flag-5'>超低功耗</b>和動態(tài)性能的線性電源

    0.1mA!24GHz超低功耗人體存在毫米波雷達模組

    超低功耗 ,極簡化24GHz一發(fā)一收天線,天線波束窄、分辨率高、頻帶寬、抗干擾力強。 2、可檢測到 微動、運動狀態(tài)和靜止 狀態(tài)下的人體目標,識別精準。 3、超低功耗,持續(xù)工作時平均電流 0.1mA (1Hz上報頻率)。 4、提供
    的頭像 發(fā)表于 09-05 10:31 ?290次閱讀
    0.1mA!24GHz<b class='flag-5'>超低功耗</b>人體存在毫米波雷達模組

    適用于超低功耗低功耗應用的獨特高效隔離式DC/DC轉(zhuǎn)換器

    電子發(fā)燒友網(wǎng)站提供《適用于超低功耗低功耗應用的獨特高效隔離式DC/DC轉(zhuǎn)換器.pdf》資料免費下載
    發(fā)表于 08-31 09:41 ?0次下載
    適用于<b class='flag-5'>超低功耗</b>和<b class='flag-5'>低功耗</b>應用的獨特高效隔離式DC/DC轉(zhuǎn)換器

    DRV5032超低功耗數(shù)字開關霍爾效應傳感器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《DRV5032超低功耗數(shù)字開關霍爾效應傳感器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-09 10:45 ?0次下載
    DRV5032<b class='flag-5'>超低功耗</b>數(shù)字開關霍爾效應傳感器數(shù)據(jù)表

    ADS7056超低功耗、超小尺寸14位高速SAR ADC數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《ADS7056超低功耗、超小尺寸14位高速SAR ADC數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-30 09:59 ?0次下載
    ADS7056<b class='flag-5'>超低功耗</b>、超小尺寸14位高速SAR ADC數(shù)據(jù)表

    請問esp32的藍牙能不能保持超低功耗的監(jiān)聽?

    做一個低功耗的設備,需要進入深度睡眠,但是有需要空中喚醒,可以用外掛LORA去喚醒esp32。 那么esp32的低功耗藍牙,能不能像家用的藍牙溫度計那樣,手機app可以隨時連接,一節(jié)7號電也可以工作一年多,也相當于隨機連接,還超低功耗
    發(fā)表于 06-18 07:11

    DA16600 超低功耗 Wi-Fi + 藍牙低功耗模塊開發(fā)套件數(shù)據(jù)手冊

    電子發(fā)燒友網(wǎng)站提供《DA16600 超低功耗 Wi-Fi + 藍牙低功耗模塊開發(fā)套件數(shù)據(jù)手冊.rar》資料免費下載
    發(fā)表于 05-31 17:51 ?4次下載
    DA16600 <b class='flag-5'>超低功耗</b> Wi-Fi + 藍牙<b class='flag-5'>低功耗</b>模塊開發(fā)套件數(shù)據(jù)手冊

    芯品#MAX78002 新型AI MCU,能夠使神經(jīng)網(wǎng)絡以超低功耗運行

    人工智能(AI)需要超強的計算能力,而Maxim則大大降低了AI計算所需的功耗。MAX78002是一款新型的AI微控制器,使神經(jīng)網(wǎng)絡能夠在互聯(lián)網(wǎng)邊緣端以超低功耗運行,將高能效的AI處理與經(jīng)過驗證
    的頭像 發(fā)表于 05-07 17:47 ?7334次閱讀
    芯品#MAX78002 新型AI MCU,能夠使神經(jīng)網(wǎng)絡以<b class='flag-5'>超低功耗</b>運行

    安信可Rd-03L檢測使用—— 超低功耗實現(xiàn)人體存在檢測,上位機配置快速上手

    Rd-03L是安信可雷達系列的超低功耗人體存在毫米波傳感器,包含極簡化24 GHz雷達傳感器硬件和低功耗人體存在感應智能算法固件。 Rd-03L搭載AloT毫米波傳感器SoC ICL1112、高性能
    的頭像 發(fā)表于 03-29 11:02 ?568次閱讀
    安信可Rd-03L<b class='flag-5'>檢測</b>使用—— <b class='flag-5'>超低功耗</b>實現(xiàn)人體存在<b class='flag-5'>檢測</b>,上位機配置快速上手

    構建超低功耗精密高邊電流檢測電路,你的選擇是?

    精密微安級高邊電流測量需要一個小阻值檢測電阻和一個低失調(diào)電壓的放大器。LTC2063零漂移放大器的最大輸入失調(diào)電壓僅為5μV,僅需消耗1.4μA的電流,是構建完整的超低功耗精密高邊電流檢測電路的理想
    的頭像 發(fā)表于 03-19 08:22 ?914次閱讀
    構建<b class='flag-5'>超低功耗</b>精密高邊電流<b class='flag-5'>檢測</b>電路,你的選擇是?

    0.1毫安!超超超超超低功耗安信可雷達模組Rd-03L

    ,極簡化24GHz一發(fā)一收天線,天線波束窄、分辨率高、頻帶寬、抗干擾力強。 2、可檢測到微動、運動狀態(tài)和靜止狀態(tài)下的人體目標,識別精準。 3、超低功耗,持續(xù)工作時平均電流0.1mA(1Hz上報頻率)。 4、提供可視化工具,支持配置探測距離區(qū)間、目標消失延遲時
    的頭像 發(fā)表于 03-07 11:19 ?441次閱讀
    0.1毫安!超超超超<b class='flag-5'>超低功耗</b>安信可雷達模組Rd-03L

    PY32L020單片機,超低功耗,多種低功耗模式,休眠電流最低0.7uA

    定時器,以及 2 路比較器。PY32L020 單片機的工作溫度范圍為-40°C ~ 85°C,工作電壓范圍 1.7V ~ 5.5V。芯片提供sleep/stop/Deep Stop 低功耗工作模式,超低功耗
    發(fā)表于 12-20 16:02

    ADI超低功耗人工智能(AI)MCU MAX78002介紹

    相比于云端AI,邊緣AI具備實時性好、帶寬資源要求低、隱私性高等特點,特別適合物聯(lián)網(wǎng)應用。ADI的邊緣AI低功耗微處理器領域的最新款產(chǎn)品是MAX78002,具備更高頻率的MCU內(nèi)核、更大存儲空間
    的頭像 發(fā)表于 12-15 12:36 ?1171次閱讀

    MCU在低功耗時的靜態(tài)功耗解析

    隨著半導體技術和工藝的進步,MCU的功耗做的是越來越好。很多廠家都宣傳自家的MCU是低功耗(Low Power)或者超低功耗(Ultra Low Power)。
    的頭像 發(fā)表于 12-13 09:06 ?1516次閱讀
    MCU在<b class='flag-5'>低功耗</b>時的靜態(tài)<b class='flag-5'>功耗</b>解析