0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖神經(jīng)網(wǎng)絡(luò)在處理基于圖數(shù)據(jù)問題方面取得了巨大的成功

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:朱美琪 ? 2020-10-10 10:47 ? 次閱讀

1 引言 圖神經(jīng)網(wǎng)絡(luò)在處理基于圖數(shù)據(jù)問題方面取得了巨大的成功,受到了廣泛的關(guān)注和應(yīng)用。GNNs通常是基于消息傳遞的方式設(shè)計(jì)的,本質(zhì)思想即迭代地聚合鄰居信息,而經(jīng)過次的迭代后, 層GNNs能夠捕獲節(jié)點(diǎn)的局部結(jié)構(gòu),學(xué)習(xí)來自跳鄰居的信息。因此更深層的GNN就能夠訪問更多的鄰居信息,學(xué)習(xí)與建模遠(yuǎn)距離的節(jié)點(diǎn)關(guān)系,從而獲得更好的表達(dá)能力與性能。而在實(shí)際在做深層GNN操作時(shí),往往會面臨著兩類問題:1. 隨著層數(shù)的增加,GNNs的性能會大幅下降;2. 隨著層數(shù)的增加,利用GNNs進(jìn)行訓(xùn)練與推斷時(shí)需要的計(jì)算量會指數(shù)上升。對于第一個(gè)問題來說,現(xiàn)有的很多工作分析出深層GNNs性能下降的原因是受到了過平滑問題的影響,并提出了緩解過平滑的解決方案;而對于第二個(gè)問題來說,設(shè)計(jì)方案模擬深層GNNs的表現(xiàn)能力并減少GNNs的計(jì)算消耗也成了亟待解決的需求,比如用于實(shí)時(shí)系統(tǒng)的推斷。針對這兩個(gè)問題,本文將分別介紹兩個(gè)在KDD 2020上的關(guān)于深度GNNs的最新工作。 第一個(gè)工作是Research Track的《Towards Deeper Graph Neural Networks》。該工作從另一個(gè)角度去解讀深度圖神經(jīng)網(wǎng)絡(luò)隨著層數(shù)增加性能下降的問題,認(rèn)為影響性能下降的主要原因是Transformation和Propagation兩個(gè)過程的糾纏影響作用,并且基于分析結(jié)果設(shè)計(jì)了深度自適應(yīng)圖神經(jīng)網(wǎng)絡(luò)(Deep Adaptive Graph Neural Networks) 模型,能夠有效地緩解深層模型的性能快速下降問題。 第二個(gè)工作是Research Track的《TinyGNN: Learning E?icient Graph Neural Networks》。該工作嘗試訓(xùn)練small GNN(淺層)去模擬Deep GNN(深層)的表達(dá)能力和表現(xiàn)效果,致力于應(yīng)用在實(shí)時(shí)系統(tǒng)推斷等對推斷速度有較高要求的場景。 2 Towards Deeper Graph Neural Networks 2.1 引言 1層的GCN只考慮了1跳鄰居的信息,而當(dāng)使用多層的圖卷積操作擴(kuò)大GCN的接受域之后,性能也會大幅下降。已有的一些工作[1,2]將這個(gè)性能大幅下降的原因歸根于圖神經(jīng)網(wǎng)絡(luò)的過平滑問題(over-smoothing)。然而這篇文章保持一個(gè)不同的觀點(diǎn),并且從另一個(gè)角度去解讀深度圖神經(jīng)網(wǎng)絡(luò)性能下降的問題。這篇文章認(rèn)為影響其性能快速下降的主要因素是表示變換(Transformation)和傳播(propagation)的糾纏作用,過平滑問題只有在使用了非常大的接受域,也就是疊加非常多層的時(shí)候才會影響圖神經(jīng)網(wǎng)絡(luò)的表現(xiàn)效果。在進(jìn)行了理論和實(shí)驗(yàn)分析的基礎(chǔ)上,該文章提出了深度自適應(yīng)圖形神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方案。代碼鏈接: https://github.com/mengliu1998/DeeperGNN 2.2實(shí)驗(yàn)與理論分析 2.2.1 圖卷積操作 通常圖卷積操作遵循一種鄰居聚合(或消息傳遞)的方式,通過傳播其鄰域的表示并在此之后進(jìn)行變化以學(xué)習(xí)節(jié)點(diǎn)表示。第層的操作一般可以描述為:

2.2.2 平滑度的定量度量 平滑度是反映節(jié)點(diǎn)表示相似程度的度量標(biāo)準(zhǔn)。通常兩個(gè)節(jié)點(diǎn)的歐氏距離值越小,兩個(gè)節(jié)點(diǎn)表示的相似性越高。本文作者提出了一種計(jì)算整張圖平滑度的指標(biāo):

它與圖中節(jié)點(diǎn)表示的整體平滑度呈負(fù)相關(guān),即越小,圖的平滑度越大。 2.2.3 深度GNN性能下降的原因 在評價(jià)指標(biāo)的基礎(chǔ)上,作者對GCN在cora數(shù)據(jù)集上進(jìn)行節(jié)點(diǎn)分類實(shí)驗(yàn)的準(zhǔn)確率、可視化以及指標(biāo)數(shù)值的變化情況進(jìn)行了統(tǒng)計(jì),結(jié)果如下:

并給出質(zhì)疑over-smoothing的兩點(diǎn)原因:(1) 過平滑問題僅會發(fā)生在節(jié)點(diǎn)表示傳播很多層之后,而實(shí)驗(yàn)中cora的分類結(jié)果在10層之內(nèi)就大幅下降。(2)評價(jià)指標(biāo)的值與初始相比只有輕微下降,證明平滑程度只有一定的上升,而不足以導(dǎo)致過平滑。 而作者進(jìn)一步指出,是轉(zhuǎn)換(Transformation)和傳播(propagation)的糾纏作用嚴(yán)重?fù)p害了深度圖神經(jīng)網(wǎng)絡(luò)的性能。并且為了驗(yàn)證該假設(shè),作者將兩個(gè)過程分解出來,設(shè)計(jì)了如下的一個(gè)簡單模型:

并同樣給出在cora上的實(shí)驗(yàn)結(jié)果:

當(dāng)兩個(gè)過程分解后,50層內(nèi)的GCN準(zhǔn)確率基本能夠在80%左右,當(dāng)層數(shù)達(dá)到100+后才會陸續(xù)下降,對應(yīng)的值也在300層以后變得很低,說明此時(shí)網(wǎng)絡(luò)受到過平滑的影響。以上兩個(gè)實(shí)驗(yàn)說明了在GNN受過平滑影響之前,轉(zhuǎn)換(Transformation)和傳播(propagation)的糾纏作用確實(shí)會損害深度圖神經(jīng)網(wǎng)絡(luò)的性能,導(dǎo)致性能大幅下降。也證實(shí)了解耦轉(zhuǎn)換和傳播可以幫助構(gòu)建更深層次的模型,從而利用更大的可接受域來學(xué)習(xí)更多的信息。 2.2.4 理論證明 經(jīng)過變換與傳播的解耦,作者的理論分析可以更嚴(yán)格且溫和地描述過平滑問題。在本節(jié)中,作者嚴(yán)格描述兩種典型傳播機(jī)制的過度平滑問題,并推導(dǎo)出當(dāng)層數(shù)趨近于無窮時(shí),兩種(, 的收斂情況。并證明該種傳播模式是線性不可分的,利用它們作為傳播機(jī)制將產(chǎn)生難以區(qū)分表征,從而導(dǎo)致over-smoothing問題。 2.3 模型

主要思想是將節(jié)點(diǎn)表示的變換與傳播過程解耦,并同時(shí)進(jìn)行至層傳播,最后利用學(xué)得的融合權(quán)重向量做一個(gè)自適應(yīng)調(diào)整融合。 2.4 實(shí)驗(yàn)

實(shí)驗(yàn)數(shù)據(jù)集

節(jié)點(diǎn)分類實(shí)驗(yàn)結(jié)果

cora數(shù)據(jù)集上不同訓(xùn)練集比例的分類準(zhǔn)確率 值得分析的有以下兩點(diǎn): (1)為什么低label rate的DAGNN表現(xiàn)要好?這些比較可觀的改進(jìn)主要?dú)w功于DAGNN的優(yōu)勢: 通過消除表示轉(zhuǎn)換和傳播的糾纏,同時(shí)擴(kuò)展接受域的范圍,使得利用信息更豐富。 (2)和APPNP SGC的區(qū)別是什么?APPNP和SGC實(shí)際上都解耦了轉(zhuǎn)換和傳播,并且APPNP也擴(kuò)展了k階接受域。DAGNN比APPNP好,是因?yàn)樵O(shè)計(jì)了自適應(yīng)調(diào)整每個(gè)節(jié)點(diǎn)來自不同接收域的信息權(quán)重。

DAGNN在不同數(shù)據(jù)集上隨層數(shù)變化的表現(xiàn) 3 TinyGNN: Learning E?icient Graph Neural Networks 3.1 引言 經(jīng)過k次迭代后,k層GNN可以捕獲來自k-hop節(jié)點(diǎn)結(jié)構(gòu)信息。通過這種方式,一個(gè)更深層的GNN就有獲取更多鄰居信息的能力,從而取得更好的性能。舉例來說,下圖隨著GAT層數(shù)的增加,兩個(gè)數(shù)據(jù)集的分類準(zhǔn)確率都有大幅提升。

而相對應(yīng)的,當(dāng)GNN進(jìn)一步擴(kuò)展層數(shù)時(shí),鄰域的指數(shù)擴(kuò)增會導(dǎo)致GNNs模型需要大量的訓(xùn)練和推理計(jì)算消耗。這使得許多應(yīng)用程序(如實(shí)時(shí)系統(tǒng))無法使用更深層的GNN作為解決方案。舉例來說,同樣的兩個(gè)數(shù)據(jù),4層GAT的計(jì)算時(shí)間以指數(shù)級增長,導(dǎo)致計(jì)算消耗十分巨大。

因此這里就存在著一個(gè)困境,即采用深層的GNN就越容易取得高性能,但是從效率的角度又往往傾向于開發(fā)一個(gè)小而推斷迅速的GNN。但是較小的GNN與較深的GNN之間存在較大的鄰域信息差距,這也是需要考慮的。因此這篇文章旨在訓(xùn)練一個(gè)較小的GNN,既能很好地刻畫了局部結(jié)構(gòu)信息,與較深的GNN相比可以獲得相似性能,同時(shí)也能夠進(jìn)行快速的推斷??偨Y(jié)來說,貢獻(xiàn)如下: (1)提出了一種小型、高效的TinyGNN,能夠在短時(shí)間內(nèi)實(shí)現(xiàn)推斷出高性能的節(jié)點(diǎn)表示。 (2)利用對等感知模塊(PAM)和鄰居蒸餾策略(NDS),以顯式和隱式兩種方式對局部結(jié)構(gòu)建模,并解決小GNN和較深GNN之間的鄰居信息差距。 (3)大量的實(shí)驗(yàn)結(jié)果表明,TinyGNN可以實(shí)現(xiàn)與更深層次的GNN相似甚至更好的性能,并且在實(shí)驗(yàn)數(shù)據(jù)集上,推理過程能夠有7.73到126.59倍的提速。 3.2 模型 3.2.1 對等感知模塊 對等節(jié)點(diǎn)(peer nodes)指的是同一層GNN從同一個(gè)點(diǎn)源點(diǎn)采樣出的所有鄰居集合,在下圖(b)用相同的顏色表示。對等節(jié)點(diǎn)之間沒有通信,所有對等節(jié)點(diǎn)都能夠通過上層節(jié)點(diǎn)在兩跳內(nèi)相連。大量的對等節(jié)點(diǎn)是鄰居,來自底層的鄰居信息可以被對等節(jié)點(diǎn)直接配置。

PAM建模對等節(jié)點(diǎn)的方式如下,以兩個(gè)節(jié)點(diǎn)隱層表示的相似度作為融合權(quán)重。PAM能夠幫助探索同一層中的節(jié)點(diǎn)之間的新關(guān)系,并幫助建模較小的GNN從而避免由較低層的鄰居迭代聚集而導(dǎo)致的大量計(jì)算。

PAM可以被用于任何圖網(wǎng)絡(luò)結(jié)構(gòu)中,作為一個(gè)基礎(chǔ)的模塊,1層GNN+1層PAM的計(jì)算量要小于兩層GNN。 3.2.2 鄰居蒸餾策略 作者利用知識蒸餾設(shè)計(jì)了鄰居信息蒸餾方案,teacher GNN是深層模型,能夠建模更廣泛的鄰域。而student GNN采用淺層模型,能夠有更快的推斷速度。并且利用teacher GNN 教student GNN隱式地捕捉全局深層結(jié)構(gòu)信息,使得student GNN有深層GNN的表現(xiàn)效果。

teacher GNN的損失函數(shù):

student GNN的損失函數(shù),同時(shí)利用來自teacher網(wǎng)絡(luò)的軟標(biāo)簽和真實(shí)標(biāo)簽進(jìn)行學(xué)習(xí),T表示蒸餾溫度。

3.3 實(shí)驗(yàn)

實(shí)驗(yàn)數(shù)據(jù)集

節(jié)點(diǎn)分類實(shí)驗(yàn)結(jié)果

速度提升情況

責(zé)任編輯:lq
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4749

    瀏覽量

    100435
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1201

    瀏覽量

    24622
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6325

原文標(biāo)題:【KDD20】深度圖神經(jīng)網(wǎng)絡(luò)專題

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度神經(jīng)網(wǎng)絡(luò)雷達(dá)系統(tǒng)中的應(yīng)用

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)雷達(dá)系統(tǒng)中的應(yīng)用近年來取得了顯著進(jìn)展,為雷達(dá)信號處理、目標(biāo)檢測、跟蹤以及識別等領(lǐng)域帶來了革命性的變化。以下將詳細(xì)探討深
    的頭像 發(fā)表于 07-15 11:09 ?578次閱讀

    Transformer能代替神經(jīng)網(wǎng)絡(luò)

    Transformer作為一種處理序列數(shù)據(jù)方面表現(xiàn)出色的深度學(xué)習(xí)模型,自其提出以來,已經(jīng)自然語言處理
    的頭像 發(fā)表于 07-12 14:07 ?359次閱讀

    殘差網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)

    殘差網(wǎng)絡(luò)(Residual Network,通常簡稱為ResNet) 是深度神經(jīng)網(wǎng)絡(luò)的一種 ,其獨(dú)特的結(jié)構(gòu)設(shè)計(jì)解決深層網(wǎng)絡(luò)訓(xùn)練中的梯度消失和梯度爆炸問題上
    的頭像 發(fā)表于 07-11 18:13 ?949次閱讀

    簡單認(rèn)識深度神經(jīng)網(wǎng)絡(luò)

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)作為機(jī)器學(xué)習(xí)領(lǐng)域中的一種重要技術(shù),特別是深度學(xué)習(xí)領(lǐng)域,已經(jīng)取得了顯著的成就。它們通過模擬人類大腦的處理方式,利用多
    的頭像 發(fā)表于 07-10 18:23 ?900次閱讀

    基于神經(jīng)網(wǎng)絡(luò)的全息生成算法

    全息生成技術(shù)作為光學(xué)與計(jì)算機(jī)科學(xué)交叉領(lǐng)域的重要研究方向,近年來隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,取得了顯著進(jìn)展?;?b class='flag-5'>神經(jīng)網(wǎng)絡(luò)的全息生成算法,以
    的頭像 發(fā)表于 07-09 15:54 ?349次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)視頻處理中的應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)作為深度學(xué)習(xí)的代表算法之一,計(jì)算機(jī)視覺領(lǐng)域取得了顯著成就,特別是視頻
    的頭像 發(fā)表于 07-09 15:53 ?499次閱讀

    神經(jīng)網(wǎng)絡(luò)的種類及舉例說明

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)領(lǐng)域的核心組成部分,近年來圖像識別、自然語言處理、語音識別等多個(gè)領(lǐng)域取得了顯著進(jìn)展。本文將從神經(jīng)網(wǎng)絡(luò)的基本原理出發(fā),深
    的頭像 發(fā)表于 07-08 11:06 ?615次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性不包括什么

    許多領(lǐng)域都取得了顯著的成果,如圖像識別、語音識別、自然語言處理等。然而,人工神經(jīng)網(wǎng)絡(luò)也存在一些局限性和不足之處,以下是對人工神經(jīng)網(wǎng)絡(luò)特點(diǎn)和
    的頭像 發(fā)表于 07-05 09:26 ?677次閱讀

    RNN神經(jīng)網(wǎng)絡(luò)適用于什么

    RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),它可以處理序列數(shù)據(jù),具有記憶功能。RNN
    的頭像 發(fā)表于 07-04 15:04 ?783次閱讀

    用于自然語言處理神經(jīng)網(wǎng)絡(luò)有哪些

    取得了顯著進(jìn)展,成為處理自然語言任務(wù)的主要工具。本文將詳細(xì)介紹幾種常用于NLP的神經(jīng)網(wǎng)絡(luò)模型,包括遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、長短時(shí)記憶網(wǎng)絡(luò)(L
    的頭像 發(fā)表于 07-03 16:17 ?766次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)建模的基本原理

    方面取得了顯著的成果。本文將詳細(xì)介紹BP神經(jīng)網(wǎng)絡(luò)的基本原理,包括網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)、損失函數(shù)、梯度下降算法、反向傳播算法等。 神經(jīng)網(wǎng)絡(luò)概述
    的頭像 發(fā)表于 07-02 14:05 ?246次閱讀

    神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類型和應(yīng)用實(shí)例

    神經(jīng)網(wǎng)絡(luò)模型,作為深度學(xué)習(xí)領(lǐng)域的核心組成部分,近年來圖像識別、自然語言處理、語音識別等多個(gè)領(lǐng)域取得了顯著進(jìn)展。本文旨在深入解讀神經(jīng)網(wǎng)絡(luò)的基
    的頭像 發(fā)表于 07-02 11:33 ?346次閱讀

    基于神經(jīng)網(wǎng)絡(luò)算法的模型構(gòu)建方法

    和應(yīng)用等方面。 1. 引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,由大量的節(jié)點(diǎn)(神經(jīng)元)和連接(突觸)組成。神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)能力,能
    的頭像 發(fā)表于 07-02 11:21 ?411次閱讀

    深度神經(jīng)網(wǎng)絡(luò)模型有哪些

    深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNNs)是一類具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),它們許多領(lǐng)域取得了顯著的成功,如計(jì)算機(jī)視
    的頭像 發(fā)表于 07-02 10:00 ?1059次閱讀

    利用深度循環(huán)神經(jīng)網(wǎng)絡(luò)對心電降噪

    進(jìn)行訓(xùn)練。我們還研究了使用合成數(shù)據(jù) 集如何影響網(wǎng)絡(luò)性能。 我們建議使用深度循環(huán)去噪神經(jīng)網(wǎng)絡(luò)(DRDNN) 對心電信號進(jìn)行去噪。它們是一種深度循環(huán)
    發(fā)表于 05-15 14:42