0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用圖神經(jīng)網(wǎng)絡(luò)(GNN)做CV的研究

新機(jī)器視覺(jué) ? 來(lái)源:新機(jī)器視覺(jué) ? 作者:新機(jī)器視覺(jué) ? 2022-08-16 10:21 ? 次閱讀

用圖神經(jīng)網(wǎng)絡(luò)(GNN)做CV的研究有不少,但通常是圍繞點(diǎn)云數(shù)據(jù)做文章,少有直接處理圖像數(shù)據(jù)的。其實(shí)與CNN把一張圖片看成一個(gè)網(wǎng)格、Transformer把圖片拉直成一個(gè)序列相比,圖方法更適合學(xué)習(xí)不規(guī)則和復(fù)雜物體的特征。

近期中科院與華為諾亞方舟實(shí)驗(yàn)室等提出一種全新的骨干網(wǎng)絡(luò),把圖片表示成圖結(jié)構(gòu)數(shù)據(jù),讓GNN也能完成經(jīng)典CV三大任務(wù)。

5f037a9e-1cec-11ed-ba43-dac502259ad0.png

該論文引起GNN學(xué)者廣泛關(guān)注。有人認(rèn)為GNN領(lǐng)域積累多年的技巧都將涌入這一新方向,帶來(lái)一波研究熱潮。

5f2e6100-1cec-11ed-ba43-dac502259ad0.png

在研究團(tuán)隊(duì)看來(lái),圖結(jié)構(gòu)是一種更通用的數(shù)據(jù)結(jié)構(gòu)。甚至網(wǎng)格和序列可以當(dāng)作圖結(jié)構(gòu)的特例,用圖結(jié)構(gòu)來(lái)做視覺(jué)感知會(huì)更加靈活。圖數(shù)據(jù)由節(jié)點(diǎn)和邊組成,如果把每個(gè)像素都看作節(jié)點(diǎn)計(jì)算難度過(guò)于大了,因此研究團(tuán)隊(duì)采用了切塊(patch)方法。

對(duì)于224x224分辨率的圖像,每16x16像素為一個(gè)Patch,也就是圖數(shù)據(jù)中的一個(gè)節(jié)點(diǎn),總共有196個(gè)節(jié)點(diǎn)。對(duì)每個(gè)節(jié)點(diǎn)搜索他們距離最近的節(jié)點(diǎn)構(gòu)成邊,邊的數(shù)量隨網(wǎng)絡(luò)深度而增加。接下來(lái),網(wǎng)絡(luò)架構(gòu)分為兩部分:一個(gè)圖卷積網(wǎng)絡(luò)(GCN),負(fù)責(zé)處理圖數(shù)據(jù)、聚合相鄰節(jié)點(diǎn)中的特征。一個(gè)前饋神經(jīng)網(wǎng)絡(luò)(FFN),結(jié)構(gòu)比較簡(jiǎn)單是兩個(gè)全連接層的MLP,負(fù)責(zé)特征的轉(zhuǎn)換。

5f4c674a-1cec-11ed-ba43-dac502259ad0.png

傳統(tǒng)GCN會(huì)出現(xiàn)過(guò)度平滑現(xiàn)象,為解決這個(gè)問(wèn)題,團(tuán)隊(duì)在圖卷積層前后各增加一個(gè)線性層,圖卷積層后再增加一個(gè)激活函數(shù)。

5f5f49d2-1cec-11ed-ba43-dac502259ad0.png

實(shí)驗(yàn)表明,用上新方法,當(dāng)層數(shù)較多時(shí)ViG學(xué)習(xí)到的特征會(huì)比傳統(tǒng)ResGCN更為多樣。

為了更準(zhǔn)確評(píng)估ViG的性能,研究團(tuán)隊(duì)設(shè)計(jì)了ViT常用的同質(zhì)結(jié)構(gòu)(isotropic)和CNN常用的金字塔結(jié)構(gòu)(Pyramid)兩種ViG網(wǎng)絡(luò),來(lái)分別做對(duì)比實(shí)驗(yàn)。同質(zhì)架構(gòu)ViG分為下面三種規(guī)格。

5f7a5ae2-1cec-11ed-ba43-dac502259ad0.png

與常見(jiàn)的同質(zhì)結(jié)構(gòu)CNN、ViT與MLP網(wǎng)絡(luò)相比,ViG在同等算力成本下ImageNet圖像分類的表現(xiàn)更好。金字塔結(jié)構(gòu)的ViG網(wǎng)絡(luò)具體設(shè)置如下。

5f8a7814-1cec-11ed-ba43-dac502259ad0.png

同等算力成本下,ViG也與最先進(jìn)的CNN、ViT和MLP相比,性能也能超越或表現(xiàn)相當(dāng)。

5f9c1128-1cec-11ed-ba43-dac502259ad0.png

在目標(biāo)檢測(cè)和實(shí)例分割測(cè)試上,ViG表現(xiàn)也與同等規(guī)模的Swin Transformer相當(dāng)。

5faac984-1cec-11ed-ba43-dac502259ad0.png

最后,研究團(tuán)隊(duì)希望這項(xiàng)工作能作為GNN在通用視覺(jué)任務(wù)上的基礎(chǔ)架構(gòu),Pytorch版本和Mindspore版本代碼都會(huì)分別開(kāi)源。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:?圖神經(jīng)網(wǎng)絡(luò)(GNN)直接處理圖像數(shù)據(jù)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)概述第三彈:來(lái)自IEEE Fellow的GNN綜述

    本文來(lái)源:機(jī)器之心編譯 作者:Zonghan Wu 神經(jīng)網(wǎng)絡(luò)GNN)熱度持續(xù)上升,之前我們?cè)榻B了清華兩篇綜述論文,參見(jiàn):深度學(xué)習(xí)時(shí)代的模型,清華發(fā)文綜述
    發(fā)表于 01-10 10:26 ?1.2w次閱讀
    <b class='flag-5'>圖</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>概述第三彈:來(lái)自IEEE Fellow的<b class='flag-5'>GNN</b>綜述

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本模型  2.
    發(fā)表于 03-20 11:32

    labview BP神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)

    請(qǐng)問(wèn):我在用labviewBP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)故障診斷,在NI官網(wǎng)找到了機(jī)器學(xué)習(xí)工具包(MLT),但是里面沒(méi)有關(guān)于這部分VI的幫助文檔,對(duì)于”BP神經(jīng)網(wǎng)絡(luò)分類“這個(gè)范例有很多不懂的地方,比如
    發(fā)表于 02-22 16:08

    【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

    今天學(xué)習(xí)了兩個(gè)神經(jīng)網(wǎng)絡(luò),分別是自適應(yīng)諧振(ART)神經(jīng)網(wǎng)絡(luò)與自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)。整體感覺(jué)不是很難,只不過(guò)一些最基礎(chǔ)的概念容易理解不清。首先ART神經(jīng)網(wǎng)絡(luò)是競(jìng)爭(zhēng)學(xué)習(xí)的一個(gè)代表,
    發(fā)表于 07-21 04:30

    GNN神經(jīng)網(wǎng)絡(luò))硬件加速的FPGA實(shí)戰(zhàn)解決方案

    ,對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)算法設(shè)計(jì)以及其實(shí)現(xiàn)技術(shù)帶來(lái)了嚴(yán)峻的挑戰(zhàn)。在此背景之下,諸多基于Graph的新型機(jī)器學(xué)習(xí)算法—GNN神經(jīng)網(wǎng)絡(luò)),在學(xué)術(shù)界和產(chǎn)業(yè)界不斷的涌現(xiàn)出來(lái)。GNN對(duì)算力和存儲(chǔ)器
    發(fā)表于 07-07 08:00

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反向傳播優(yōu)化輸入變量權(quán)重的層,以提高模型的預(yù)測(cè)
    發(fā)表于 07-12 08:02

    基于BP神經(jīng)網(wǎng)絡(luò)的PID控制

    最近在學(xué)習(xí)電機(jī)的智能控制,上周學(xué)習(xí)了基于單神經(jīng)元的PID控制,這周研究基于BP神經(jīng)網(wǎng)絡(luò)的PID控制。神經(jīng)網(wǎng)絡(luò)具有任意非線性表達(dá)能力,可以通過(guò)對(duì)系統(tǒng)性能的學(xué)習(xí)來(lái)實(shí)現(xiàn)具有最佳組合的PID控
    發(fā)表于 09-07 07:43

    如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)?

    何用stm32cube.ai簡(jiǎn)化人工神經(jīng)網(wǎng)絡(luò)映射?如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)?
    發(fā)表于 10-11 08:05

    卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過(guò)程

    以前的神經(jīng)網(wǎng)絡(luò)幾乎都是部署在云端(服務(wù)器上),設(shè)備端采集到數(shù)據(jù)通過(guò)網(wǎng)絡(luò)發(fā)送給服務(wù)器inference(推理),結(jié)果再通過(guò)網(wǎng)絡(luò)返回給設(shè)備端。如今越來(lái)越多的
    發(fā)表于 12-23 06:16

    神經(jīng)網(wǎng)絡(luò)移植到STM32的方法

    神經(jīng)網(wǎng)絡(luò)移植到STM32最近在做的一個(gè)項(xiàng)目需要用到網(wǎng)絡(luò)進(jìn)行擬合,并且將擬合得到的結(jié)果用作控制,就在想能不能直接在單片機(jī)上神經(jīng)網(wǎng)絡(luò)計(jì)算,這樣就可以實(shí)時(shí)計(jì)算,不依賴于上位機(jī)。所以要解決
    發(fā)表于 01-11 06:20

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用轉(zhuǎn)載****地址:http://fcst.ceaj.org/CN/abstract/abstract2521.shtml深度學(xué)習(xí)是機(jī)器學(xué)習(xí)和人工智能研究的最新趨勢(shì),作為一個(gè)
    發(fā)表于 08-02 10:39

    神經(jīng)網(wǎng)絡(luò)GNN的卷積操作流程

    2019年的時(shí)針開(kāi)始轉(zhuǎn)動(dòng),在CNN、RNN、LSTM、GAN、GNN、CAP的潮起潮落中,帶來(lái)了這篇博客。放上一篇 參考引用 。 其實(shí)個(gè)人認(rèn)為理解GNN的核心問(wèn)題就是理解怎么傅里葉
    的頭像 發(fā)表于 06-08 17:13 ?3361次閱讀
    <b class='flag-5'>圖</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>GNN</b>的卷積操作流程

    圖形神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)兩種較高級(jí)的算法

    神經(jīng)網(wǎng)絡(luò)是一種直接在結(jié)構(gòu)上運(yùn)行的神經(jīng)網(wǎng)絡(luò)GNN的一個(gè)典型應(yīng)用是節(jié)點(diǎn)分類。本質(zhì)上,圖中的每個(gè)節(jié)點(diǎn)都與一個(gè)標(biāo)簽相關(guān)聯(lián),我們希望預(yù)測(cè)未標(biāo)記節(jié)
    的頭像 發(fā)表于 04-17 14:19 ?2582次閱讀
    圖形<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的基礎(chǔ)知識(shí)兩種較高級(jí)的算法

    GNN解釋技術(shù)的總結(jié)和分析與神經(jīng)網(wǎng)絡(luò)的解釋性綜述

    神經(jīng)網(wǎng)絡(luò)的可解釋性是目前比較值得探索的方向,今天解讀的2021最新綜述,其針對(duì)近期提出的 GNN 解釋技術(shù)進(jìn)行了系統(tǒng)的總結(jié)和分析,歸納對(duì)比了該問(wèn)題的解決思路。
    的頭像 發(fā)表于 03-27 11:45 ?6026次閱讀
    <b class='flag-5'>GNN</b>解釋技術(shù)的總結(jié)和分析與<b class='flag-5'>圖</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的解釋性綜述

    基于神經(jīng)網(wǎng)絡(luò)異常值檢測(cè)庫(kù)介紹

    我們先簡(jiǎn)單了解一下現(xiàn)在熱門的神經(jīng)網(wǎng)絡(luò) (GNN),這已經(jīng)成為數(shù)據(jù)挖掘的一種主導(dǎo)且強(qiáng)大的工具。與圖像數(shù)據(jù)的 CNN 相似,GNN 是一種
    的頭像 發(fā)表于 12-08 10:34 ?1841次閱讀