0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出新的移動框架MobileNetV2提高多種計算機視覺任務

zhKF_jqr_AI ? 2018-04-07 20:57 ? 次閱讀

當?shù)貢r間4月3日,谷歌推出了一款新的移動框架MobileNetV2,基于上一代MobileNet,這款模型能顯著提高多種計算機視覺任務。

去年我們推出了MobileNetV1,這是一款為移動設備而設計的通用計算機視覺神經(jīng)網(wǎng)絡模型,它有分類、檢測等功能。這種可以在個人移動設備上運行深度網(wǎng)絡的能力極大地提升了用戶體驗,不僅能隨時隨地訪問,還非常安全、私密、省電。隨著新應用的出現(xiàn),用戶可以與現(xiàn)實世界進行實時交互,同樣對更高效的深度網(wǎng)絡也有更多的需求。

今天,我們很高興宣布MobileNetV2已經(jīng)可以支持下一代移動視覺應用。MobileNetV2在MobileNetV1上做出了重大改進,并推動了目前移動設備的視覺識別技術的發(fā)展,包括圖像分類、檢測和語義分割。MobileNetV2作為TensorFlow-Slim圖像分類庫的一部分發(fā)布,或者您可以在Colaboratory中探索MobileNetV2。另外,您還可以利用Jupyter下載筆記本并進行使用。MobileNetV2也可以作為TF-Hub上的模塊使用,預訓練的檢查點可以在GitHub上找到。

MobileNetV2的創(chuàng)建基于MobileNetV1的思想,使用深度可分離卷積作為高效的構(gòu)建模塊。然而,V2在架構(gòu)中引入了兩種新特征:

圖層間的線性瓶頸層

瓶頸層之間的快捷連接

基本結(jié)構(gòu)如圖所示:

可以看到,瓶頸對模型的中間輸入和輸出進行編碼,而內(nèi)層包括了模型能將低級概念(如像素)轉(zhuǎn)換為高級描述符(如圖像類別)的能力。最后,剩余的連接和傳統(tǒng)一樣,快速連接可實現(xiàn)更快的訓練速度和更高的準確性。具體細節(jié)可以查看論文:MobileNetV2:Inverted Residuals and Linear Bottlenecks:https://arxiv.org/abs/1801.04381。

它與第一代MobileNets相比如何?

總體而言,在整個延遲頻譜中,MobileNetV2模型在相同精度下的速度更快。特別的是,新模型所用的操作次數(shù)減少了2次,參數(shù)減少了30%,在谷歌pixel手機上的速度比V1快了30%~40%,同時達到了更高的準確性。

MobileNetV2在目標物體檢測和分割時是一個非常高效的特征提取器。例如,當與新發(fā)布的SSDLite合作進行物體檢測時,新模型在做到與V1同樣準確的情況下,速度快了35%。我們已經(jīng)在TensorFlow目標物體檢測API中開源了此模型。

為支持移動設備的語義分割,我們將MobileNetV2當做特征提取器安裝在簡化版的DeepLabv3上。在語義分割的基準PASCAL VOC 2012中,我們的結(jié)果與將V1作為特征提取器實現(xiàn)了相似的性能,但是參數(shù)少了5.3倍,在乘加運算上操作次數(shù)減少了5.2倍。

由此可見,MobileNetV2作為許多視覺識別任務的基礎,是移動設備上高效的模型。我們希望與學術界和開源社區(qū)共享,以此幫助更多人的研究和應用發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6080

    瀏覽量

    104363
  • 計算機視覺
    +關注

    關注

    8

    文章

    1685

    瀏覽量

    45811

原文標題:谷歌推出MobileNetV2,為下一代移動設備CV網(wǎng)絡而生

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術依賴于
    的頭像 發(fā)表于 07-24 12:46 ?355次閱讀

    機器視覺計算機視覺有什么區(qū)別

    。機器視覺的研究目標是讓機器具有類似人類的視覺能力,能夠自動、準確地完成各種視覺任務。 計算機視覺
    的頭像 發(fā)表于 07-16 10:23 ?286次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數(shù)學算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、理解、分析和處理。其核心目標在于使
    的頭像 發(fā)表于 07-10 18:24 ?1069次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?306次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    ,旨在實現(xiàn)對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工業(yè)自動化領域。它利用計算機和圖像處理技術,實
    的頭像 發(fā)表于 07-09 09:22 ?289次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?560次閱讀

    深度學習在計算機視覺領域的應用

    深度學習技術的引入,極大地推動了計算機視覺領域的發(fā)展,使其能夠處理更加復雜和多樣化的視覺任務。本文將詳細介紹深度學習在計算機
    的頭像 發(fā)表于 07-01 11:38 ?433次閱讀

    機器視覺計算機視覺的區(qū)別

    很多方面有著相似之處,如基礎理論、技術框架等,但它們在學科分類、應用領域、側(cè)重點等方面存在明顯的區(qū)別。本文將對機器視覺計算機視覺進行詳細的對比分析,以便讀者更好地理解兩者的差異。
    的頭像 發(fā)表于 06-06 17:24 ?826次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數(shù)據(jù)等技術的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?521次閱讀

    計算機視覺的十大算法

    視覺技術的發(fā)展起到了重要的推動作用。一、圖像分割算法圖像分割算法是計算機視覺領域的基礎算法之一,它的主要任務是將圖像分割成不同的區(qū)域或?qū)ο?。常見的圖像分割算法包括基
    的頭像 發(fā)表于 02-19 13:26 ?1046次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計算機視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進行的工件的定位、測量、檢測等重復性勞動;計算機視覺的主要任務是賦予智能機器人視覺,利用測距、物體標定與識別等功
    發(fā)表于 01-16 10:06 ?453次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的區(qū)別

    最適合 AI 應用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺這一技術目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 12-18 13:09 ?7093次閱讀
    最適合 AI 應用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?

    什么是計算機視覺計算機視覺的三種方法

    計算機視覺是指通過為計算機賦予人類視覺這一技術目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-16 16:38 ?4164次閱讀
    什么是<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>?<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的三種方法

    最適合AI應用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺這一技術目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-15 16:38 ?346次閱讀
    最適合AI應用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?

    量子計算機軟件-量子計算編程框架QPanda

    讓量子計算機走出實驗室造中國自主可控量子計算機和傳統(tǒng)計算機類似,在量子計算領域,計算機硬件起著基礎的作用。然而,若缺乏相應的軟件支持,人們將
    的頭像 發(fā)表于 10-31 08:23 ?437次閱讀
    量子<b class='flag-5'>計算機</b>軟件-量子<b class='flag-5'>計算</b>編程<b class='flag-5'>框架</b>QPanda