0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook AI使用單一神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時完成實例分割和語義分割

電子工程師 ? 來源:lp ? 2019-04-22 11:46 ? 次閱讀

實例分割和語義分割長期以來都是運用不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)來完成的,雖然最近出現(xiàn)了將語義和實例分割進行結(jié)合的“全景分割”,但經(jīng)典方法仍將兩者視為獨立的任務(wù)。近日,F(xiàn)acebook AI 使用單一神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時完成實例分割(識別出圖片前景中的人或者動物)和語義分割(對圖片背景中的像素進行分類)。他們的研究則通過統(tǒng)一的神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時實現(xiàn)實例和語義分割,這一新架構(gòu)實現(xiàn)了對內(nèi)存和計算資源的高效利用,也可以作為全景分割任務(wù)的基準。

原理:這一新架構(gòu)“全景 FPN ”在 Facebook 2017 年發(fā)布的 Mask R-CNN 的基礎(chǔ)上添加了一個用于語義分割的分支。這一新架構(gòu)可以同時對圖像進行實例和語義分割,而且精確度與只進行實例或語義分割的神經(jīng)網(wǎng)絡(luò)相當,這相當于能將傳統(tǒng)方法所需要的計算資源減半。在 COCO 和 Cityscapes 數(shù)據(jù)集上的測試顯示在計算資源相同的條件下全景 FPN 的表現(xiàn)遠優(yōu)于使用兩個獨立的神經(jīng)網(wǎng)絡(luò)分別進行實例和語義分割。

重要性:全景 FPN 架構(gòu)統(tǒng)一,方便實現(xiàn)而且資源利用率高,為之后的全景分割研究設(shè)立了基準。對計算資源要求的降低以及對圖像理解的深入也會對需要進行復(fù)雜圖像實時處理的識別系統(tǒng)產(chǎn)生深遠的影響。將圖片前景中物體的分割與背景分割作為一個統(tǒng)一的任務(wù)對我們理解圖片中場景并據(jù)此完成進一步的操作至關(guān)重要。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    99998
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40267
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54475

原文標題:Facebook AI新架構(gòu):全景FPN,同時完成圖像實例與語義分割 | 極客頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    UNet模型屬于哪種神經(jīng)網(wǎng)絡(luò)

    U-Net模型屬于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的種特殊形式 。它最初由德國弗萊堡大學(xué)計算機科學(xué)系的研究人員在2015年提出,專為生物醫(yī)學(xué)圖像
    的頭像 發(fā)表于 07-24 10:59 ?939次閱讀

    圖像語義分割的實用性是什么

    圖像語義分割種重要的計算機視覺任務(wù),它旨在將圖像中的每個像素分配到相應(yīng)的語義類別中。這項技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)學(xué)圖像分析、機器人導(dǎo)航等。
    的頭像 發(fā)表于 07-17 09:56 ?227次閱讀

    圖像分割語義分割的區(qū)別與聯(lián)系

    圖像分割語義分割是計算機視覺領(lǐng)域中兩個重要的概念,它們在圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區(qū)
    的頭像 發(fā)表于 07-17 09:55 ?326次閱讀

    全卷積神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用

    全卷積神經(jīng)網(wǎng)絡(luò)(FCN)是深度學(xué)習(xí)領(lǐng)域中的種特殊類型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),尤其在計算機視覺領(lǐng)域表現(xiàn)出色。它通過全局平均池化或轉(zhuǎn)置卷積處理任意尺寸的輸入,特別適用于像素級別的任務(wù),如圖像分割
    的頭像 發(fā)表于 07-11 11:50 ?448次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個具有特定語義含義的區(qū)域或?qū)ο蟆>矸e神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的
    的頭像 發(fā)表于 07-09 11:51 ?330次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡(luò))是種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法
    的頭像 發(fā)表于 07-03 11:00 ?365次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    結(jié)構(gòu)、原理、應(yīng)用場景等方面都存在定的差異。以下是對這兩種神經(jīng)網(wǎng)絡(luò)的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)種多層前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和
    的頭像 發(fā)表于 07-03 10:12 ?516次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標檢測、語義分割等計算機視覺任務(wù)。本文將詳細介紹卷積
    的頭像 發(fā)表于 07-03 09:40 ?262次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類、目標檢測、語義分割等領(lǐng)域。本文將詳細介紹CNN在分類任務(wù)中的應(yīng)用,包括基本結(jié)構(gòu)、關(guān)鍵技術(shù)、常見
    的頭像 發(fā)表于 07-03 09:28 ?320次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機器學(xué)習(xí)的個分支,它通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實現(xiàn)對數(shù)據(jù)的自動學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的種重要模型,它通過卷積操作和池化操作,有效地提取
    的頭像 發(fā)表于 07-02 14:45 ?532次閱讀

    神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類型和應(yīng)用實例

    神經(jīng)網(wǎng)絡(luò)模型,作為深度學(xué)習(xí)領(lǐng)域的核心組成部分,近年來在圖像識別、自然語言處理、語音識別等多個領(lǐng)域取得了顯著進展。本文旨在深入解讀神經(jīng)網(wǎng)絡(luò)的基本原理、結(jié)構(gòu)類型、訓(xùn)練過程以及應(yīng)用實例,為初學(xué)者提供
    的頭像 發(fā)表于 07-02 11:33 ?201次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運作方式,通過復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)信息的處理、存儲和傳遞。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,各種
    的頭像 發(fā)表于 07-01 14:16 ?338次閱讀

    基于神經(jīng)網(wǎng)絡(luò)的柯氏音血壓計

    二元序列到序列的分類問題。為了解決由此產(chǎn)生的序列到序列分類問題,將維卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)相結(jié)合,開發(fā)了種算法。然后,與收縮壓和舒張壓相關(guān)的節(jié)段(SBP
    發(fā)表于 05-23 20:33

    深度學(xué)習(xí)圖像語義分割指標介紹

    深度學(xué)習(xí)在圖像語義分割上已經(jīng)取得了重大進展與明顯的效果,產(chǎn)生了很多專注于圖像語義分割的模型與基準數(shù)據(jù)集,這些基準數(shù)據(jù)集提供了套統(tǒng)
    發(fā)表于 10-09 15:26 ?329次閱讀
    深度學(xué)習(xí)圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>指標介紹

    只要MLP就能實現(xiàn)的三維實例分割

    實例分割問題,主要障礙在于點云本身是無序、非結(jié)構(gòu)化和非均勻的。廣泛使用的卷積神經(jīng)網(wǎng)絡(luò)需要對三維點云進行體素化處理,從而產(chǎn)生高昂的計算和內(nèi)存成本。
    發(fā)表于 09-26 10:13 ?393次閱讀
    只要MLP就能實現(xiàn)的三維<b class='flag-5'>實例</b><b class='flag-5'>分割</b>!