0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微型化是機器學習應用的一條出路

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-06-13 18:10 ? 次閱讀

數(shù)據(jù)科學家,Jetpac公司CTOPete Warden發(fā)表了一篇博文,詳細闡述了微型化是機器學習應用的一條出路,并且相信機器學習可以在微小的、低功耗的芯片上運行,利用深度學習可以做到非常高的能源利用率。谷歌大腦負責人Jeff Dean也轉(zhuǎn)發(fā)這篇博文,并且也強調(diào)了其技術可行性。

當Azeem邀請我到CogX做演講時,他希望我能把核心集中于引導用戶思考的某一個點上。前幾年,我的首要任務是讓人們相信,深度學習是一場真正的革命,而不僅僅是一時的風尚,目前已經(jīng)有足夠多的例子可以證明這個觀點。我之所以知道這個觀點是正確的,并不是因為我是一個預言家,而是因為我有機會可以花時間去親自動手操作這項技術。所以我非常相信深度學習的價值,因為我親眼見到了這些效果,并且知道,阻止它從實驗室走向工業(yè)界的唯一屏障,僅僅在于更廣泛的應用場景需要投入更多的研究時間。

今天,我將談論另一種鮮為人知的,但我確信無疑的趨勢。那就是我相信機器學習可以在微小的、低功耗的芯片上運行,這種技術將解決目前方案中的瓶頸問題,這就是我在CogX上要講的。

微型電腦已經(jīng)足夠便宜,且非常普及

因為市場過于分散,以至于很難得到確切的數(shù)字,但最好的估計是今年將有超過400億的微控制器售出,考慮到他們所使用的產(chǎn)品的持久性,可能會有數(shù)千億個微控制器在使用。微控制器(或MCUs)包含一個小CPU,僅僅只有幾千字節(jié)的RAM,并且被嵌入到消費者、醫(yī)療、汽車和工業(yè)設備中。它們的設計目的是為了得到低功耗、低成本的產(chǎn)品,預計這一產(chǎn)品今年的平均價格將低于50美分。

它們并沒有得到太多的關注,因為它們經(jīng)常被用來取代舊的電動機械系統(tǒng)在汽車、洗衣機或遙控器上的功能。這些設備的控制邏輯和以前使用的模擬電路和繼電器幾乎沒有什么區(qū)別,除了可能有一些可編程功能的微小改變。對于制造商來說,最大的好處是,標準的控制器可以用軟件來編程,而不是去定制電子設備,這樣可以降低制造過程的成本,也更容易生產(chǎn)。

能源是限制因素

任何需要電源的設備都面臨著布線問題的限制,而且一旦開始布線也有可能引來其他新的問題,例如,在手術室中與工廠的地板上。為了將電源電壓從輸電電壓轉(zhuǎn)換到設備可用電壓是非常昂貴且浪費的。甚至是像手機或筆記本電腦這種便攜式設備也需要非常頻繁的充電。

幾乎任何智能產(chǎn)品的終極目標都是為了讓設備可以部署在任何地方,而不需要什么維護手段。為了實現(xiàn)這一目標,最大的障礙是:大多數(shù)的電子系統(tǒng)都需要使用能源。下面是一些基于智能手機能耗數(shù)據(jù)的常見組件的粗略數(shù)字(更多細節(jié)請參閱我的以前的博文【1】):

一個顯示器可能需要400毫瓦。

有源電池收音機可能使用800毫瓦。

藍牙可能使用100毫瓦。

加速度計是21毫瓦。

陀螺儀是130毫瓦。

GPS是176毫瓦。

一個微控制器本身可能只使用1毫瓦或者更少,但外設可能會使用更多的電能,一枚硬幣電池可以提供2500焦耳的能量,所以電池即使要給1毫瓦的設備供電,也只能維持一個月左右,當然,目前大多數(shù)的產(chǎn)品都使用了輪轉(zhuǎn)和睡眠,以避免經(jīng)常開機,但即便如此,問題仍未的到解決。

CPU和傳感器幾乎不使用電源,而收音機和顯示器使用的電量很多

一般來說處理器、傳感器可以將電力成本降低到微瓦級別,但顯示器、無線電等設備需要更多的電力成本,甚至是低功耗、藍牙等設備也需要幾十毫瓦。數(shù)據(jù)移動的過程導致了更大的能量開銷,似乎有這樣一條規(guī)則,一個操作所需要的能量與發(fā)送數(shù)據(jù)的距離成正比。CPU和傳感器發(fā)送的距離只有幾毫米,而且非常便宜,而無線電發(fā)送的距離很遠,并且價格昂貴。我認為即使技術上有所改善,這種差距仍然會進一步擴大。

我們獲取的傳感器數(shù)據(jù)比我們使用的多

幾年前,我和一些研究衛(wèi)星攝像的工程師交談過。他們的問題是,他們使用手機攝像頭已經(jīng)可以拍攝高清的視頻,但衛(wèi)星上只有少量內(nèi)存來存儲結果,每幾個小時,需要通過有限的帶寬下載到地球上的基站中。我才突然發(fā)現(xiàn),幾乎所有的傳感器場景都面臨著同樣的問題。即使是家里的攝像頭也受到wifi和寬帶連接帶寬的限制。我的一個朋友,他12月份的ISP使用率大大超出今年的限額,當他逐層分析后,發(fā)現(xiàn)主要原因居然是因為屋里閃爍的圣誕燈導致視頻流壓縮比急劇下降。

還有很多這樣的例子,我們的可穿戴設備和手機上的所有加速器都只是用來檢測可能喚醒設備的事件,或者是基本的步驟計數(shù),所有可能的更復雜的活動檢測都無法涉及。

這對機器學習意味著什么?

如果你接受上面的所有觀點,那么很明顯,有一個巨大的尚未開發(fā)的市場等待著用正確的技術來開啟。我們需要一種能在廉價的微控制器上工作的東西,它只需要很少的能量,它依賴于計算而不是無線電,它能把我們所有浪費的傳感器數(shù)據(jù)變成有用的東西。這就是機器學習,尤其是深度學習所填補的空白。

深度學習在已有的微控制器上是計算密集且可用的

在深度學習實現(xiàn)方面,它們幾乎都是受計算限制的。這一點很重要,因為我所研究的其他問題幾乎都是受到訪問大量內(nèi)存的速度限制。相比之下,神經(jīng)網(wǎng)絡把大部分事件都花在了大矩陣相乘上,同樣的數(shù)字在不同的組合中可以重復使用,這意味著CPU大部分時間都花在計算兩個緩存的數(shù)字相乘上,而從內(nèi)存中獲取新值的時間要少得多。

這很重要,因為從內(nèi)存中獲取數(shù)據(jù)需要更大的能量開銷(這可能是距離-能量的一個明顯例子——因為內(nèi)存比寄存器更遠)。相對較低的內(nèi)存需求意味著低功耗的SRAM或閃存可以用于存儲,這使得深度學習應用程序非常適合于微控制器,尤其是當使用8位計算而不是浮點數(shù)時,因為MCUs通常已經(jīng)有類似dsp的指令,非常適合。這一想法并不是特別新穎,因為谷歌和蘋果已經(jīng)開始有所行動,在這些芯片上進行語音識別,但在ML或嵌入式世界中,似乎沒有多少人意識到深度學習和MCUs的結合價值。

深度學習可以做到非常高的能源利用率

我花了很多時間去思考焦耳/運算(picojoules per op.,CPU算數(shù)單元的能量開銷)的問題。因為這樣我可以得出一個大概的估計,知道一個神經(jīng)網(wǎng)絡大概要消耗多少能量。例如,MobileNetV2圖像分類網(wǎng)絡在最小的版本中要2200萬個操作,如果知道每個操作需要5微微焦的能量,那么他就需要110微瓦的能量,如果我們每秒分析一幀,那么只有110微瓦,一枚硬幣電池可以持續(xù)使用一年。這些數(shù)字在目前的dsp元件中是非常有競爭力的。

深度學習能夠感知傳感器的數(shù)據(jù)

在過去幾年,利用神經(jīng)網(wǎng)絡接收圖像、音頻、加速度等噪聲信號,并從中提取出價值這一難題,突然變得可能。因為我們可以在微控制器中運行這些模型,而傳感器本身只需要很少的電量,所以我們可以從傳感器數(shù)據(jù)中獲取更多的價值。例如,我希望讓所有設備都有一個簡單的語音交互能力。用于理解短語,或可以使用圖像傳感器完成目標檢測,這樣可以不依賴按鈕來完成很多操作。希望這種語音交互組件可以在50美分硬幣電池下運行一年,并且這在我們當前的技術上是可行的。

另一個例子是,我想要一個小型電池驅(qū)動的圖像傳感器,我可以對它進行編程,以查找特定的作物害蟲或雜草,并在被發(fā)現(xiàn)時發(fā)出警報。它們可以分散在農(nóng)田周圍,以一種更環(huán)保的方式指導諸如除草或殺蟲劑等干預措施。

讓我印象深刻的一個工業(yè)例子是一個工廠的經(jīng)營者對“Hans”的描述。他是一個資深工程師,每天都要沿著一排機器走,并把手放在每一個機器上,聽著,然后告訴工頭哪些機器需要離線維修,這些都是基于經(jīng)驗和直覺的。如果你能在每臺機器上安裝一個電池驅(qū)動的加速度計和麥克風(一個“Cyber-Hans”),倘若出現(xiàn)異常,這些機器將提前給工廠警告。

類似的想法還有很多,但最讓我興奮地是,我不知道這些設備將如何使用,但背后的技術是如此迷人,這將建立我無法想象的全新應用程序。對我來說,就像80年代家用電腦出現(xiàn)時的樣子。我不知道它們會變成什么,當時大多數(shù)人都用它來玩游戲或存儲地址簿,但我知道這種設備將為世界帶來太多的可能性。

召開會議而不是發(fā)送文件的唯一理由是為了傳達信息之外的情感。我想和CogX觀眾分享的是我對ML在小型設備上的應用前景。我不知道未來會出現(xiàn)什么細節(jié),但我知道可用于機器學習微型化、廉價化的電池驅(qū)動芯片即將問世,它將帶來一批無法想象的新應用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8357

    瀏覽量

    132327
  • 深度學習
    +關注

    關注

    73

    文章

    5471

    瀏覽量

    120904

原文標題:【Jeff Dean推薦】為什么說未來的深度學習是小、輕、快

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI 大模型行業(yè)應用:企業(yè)如何走出一條智能蛻變之路?

    隨著 chatGPT 的橫空問世,我們對于人工智能在日常生活中的應用場景逐漸了解,無論是搜索、問答、文生圖還是文生視頻都出現(xiàn)了很多創(chuàng)意,甚至 AI 還可以做詩,輸入一條指令,就可以讓它當場賦詩
    的頭像 發(fā)表于 09-27 18:16 ?509次閱讀

    微型化晶振技術:實現(xiàn)1.2mm x 1.0mm尺寸的關鍵與優(yōu)勢

    隨著現(xiàn)代電子設備的不斷小型和高性能,晶振(晶體振蕩器)也面臨著向更小尺寸發(fā)展的需求。1.2mm x 1.0mm這種微型化晶振的實現(xiàn)代表了當前晶體振蕩技術的前沿,它不僅在尺寸上突破了傳統(tǒng)限制,還在性能和可靠性上保持了高標準。本
    的頭像 發(fā)表于 08-22 17:25 ?316次閱讀
    <b class='flag-5'>微型化</b>晶振技術:實現(xiàn)1.2mm x 1.0mm尺寸的關鍵與優(yōu)勢

    OPA855輸入是正弦波,為什么輸出是一條直流線呢?

    IG1是幅值為1nA,頻率為100HZ的交流電。為什么VOUT波形沒有放大50K呢,反而是一條直流線,在2.23V附近震蕩
    發(fā)表于 07-26 06:06

    遲滯比較器的輸出為一條直線的原因

    ,如果遲滯比較器的輸出為一條直線,這可能是由于多種原因造成的。 遲滯比較器的工作原理 在討論遲滯比較器輸出為一條直線的原因之前,我們首先需要了解其工作原理。遲滯比較器通常由個運算放大器、兩個電阻和
    的頭像 發(fā)表于 07-11 09:36 ?483次閱讀

    如何給CyBootProgrammer.Img這個固件添加一條控制led狀態(tài)的指令?

    我想對CyBootProgrammer.Img這個固件添加一條控制led狀態(tài)的指令,我是小白,我想知道怎么寫配置能控制引腳的高低電平
    發(fā)表于 05-27 08:28

    STM8L執(zhí)行一條語句大概需要幾個時鐘周期?

    STM8L執(zhí)行一條語句大概需要幾個時鐘周期
    發(fā)表于 05-06 06:16

    深入探討機器學習的可視技術

    機器學習可視(簡稱ML可視般是指通過圖形或交互方式表示機器
    發(fā)表于 04-25 11:17 ?354次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視<b class='flag-5'>化</b>技術

    卓越性能與微型化技術的完美融合—高密度DDR4芯片

    在現(xiàn)代電子系統(tǒng)的核心組件中,內(nèi)存的性能與穩(wěn)定性至關重要。高密度DDR4芯片作為當前內(nèi)存技術的杰出代表,不僅憑借其卓越的性能表現(xiàn)和微型化技術贏得了廣泛認可,還在多個方面展現(xiàn)出了獨特的優(yōu)勢。
    的頭像 發(fā)表于 03-22 14:47 ?500次閱讀
    卓越性能與<b class='flag-5'>微型化</b>技術的完美融合—高密度DDR4芯片

    人工智能和機器學習的頂級開發(fā)板有哪些?

    機器學習(ML)和人工智能(AI)不再局限于高端服務器或云平臺。得益于集成電路(IC)和軟件技術的新發(fā)展,在微型控制器和微型計算機上實現(xiàn)機器
    的頭像 發(fā)表于 02-29 18:59 ?730次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的頂級開發(fā)板有哪些?

    小型微型化的邊緣計算盒子有哪些優(yōu)勢

    邊緣計算網(wǎng)關、邊緣計算盒子的小型微型化,是當前的大趨勢,小型微型化將賦予邊緣計算網(wǎng)盒更豐富的場景適用能力,同時還可以降低成本、控制
    的頭像 發(fā)表于 01-24 17:51 ?806次閱讀
    小型<b class='flag-5'>化</b><b class='flag-5'>微型化</b>的邊緣計算盒子有哪些優(yōu)勢

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效是為什么?

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效。 經(jīng)過實測發(fā)現(xiàn)配置是從下至上檢索,取最后一條有效配置,而不是從上至下檢索,取第
    發(fā)表于 01-24 08:31

    面朝歐洲,邁上“云橋”,走一條無憂絲路

    在云橋上走一條無憂絲路,去到歐羅巴的春天
    的頭像 發(fā)表于 01-10 09:44 ?1304次閱讀
    面朝歐洲,邁上“云橋”,走<b class='flag-5'>一條</b>無憂絲路

    數(shù)據(jù)庫編程大賽:一條SQL計算撲克牌24點

    參加NineData舉辦的數(shù)據(jù)庫編程大賽,展示你的技術才華!用一條SQL語句解決撲克牌24點的計算表達式。這場比賽面向數(shù)據(jù)庫愛好者、開發(fā)者、程序員、DBA等,展示你的編程技能,并有機會贏得豐厚獎勵。歡迎大家來挑戰(zhàn)!
    的頭像 發(fā)表于 12-21 15:24 ?698次閱讀
    數(shù)據(jù)庫編程大賽:<b class='flag-5'>一條</b>SQL計算撲克牌24點

    SMT加工技術對智能產(chǎn)品微型化輕量化的影響

    站式PCBA智造廠家今天為大家講講SMT加工技術對智能產(chǎn)品微型化有何影響?SMT貼片對電子產(chǎn)品小型的重要性。SMT貼片技術(Surface Mount Technology)是
    的頭像 發(fā)表于 12-14 09:21 ?372次閱讀

    Python怎么換行輸入另一條語句

    在Python中,換行輸入和輸入另一條語句可以有多種方式實現(xiàn)。下面列舉了幾種常用的方法: 方法:使用反斜杠()來換行輸入 在Python中,可以使用反斜杠字符來告訴解釋器下行是當前語句的延續(xù)
    的頭像 發(fā)表于 11-22 10:49 ?7006次閱讀