0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google AI的研究人員的最新研究提出一個(gè)全新概念:剛度(Stiffness)

DPVg_AI_era ? 來(lái)源:lp ? 2019-03-21 09:14 ? 次閱讀

Google AI的研究人員的最新研究提出一個(gè)全新概念:剛度(Stiffness),為探索神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問(wèn)題提供了一個(gè)新視角。

Google AI的研究人員最近在arxiv發(fā)表的一篇新論文,探索了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問(wèn)題的一個(gè)新視角。

論文題為“Stiffness: A New Perspective on Generalization in Neural Networks”,作者是谷歌 AI 蘇黎世研究中心的Stanislav Fort等人。

論文提出“剛度”(stiffness)這個(gè)概念,透過(guò)這個(gè)概念研究了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和泛化問(wèn)題。

研究人員通過(guò)分析一個(gè)示例中的小梯度步驟如何影響另一個(gè)示例的損失來(lái)測(cè)量網(wǎng)絡(luò)的“剛度”。

具體來(lái)說(shuō),他們?cè)?個(gè)分類(lèi)數(shù)據(jù)集(MNIST、FASHION MNIST、CIFAR-10、CIFAR-100)上分析了全連接卷積神經(jīng)網(wǎng)絡(luò)的剛度。他們關(guān)注的是剛度如何隨著1) 類(lèi)隸屬度(class membership),2)數(shù)據(jù)點(diǎn)之間的距離,3)訓(xùn)練迭代,和4)學(xué)習(xí)率而變化。

研究表明,當(dāng)在固定的驗(yàn)證集上計(jì)算時(shí),剛度與泛化(generalization)直接相關(guān)。剛度函數(shù)的靈活性較差,因此不太容易對(duì)數(shù)據(jù)集的特定細(xì)節(jié)進(jìn)行過(guò)擬合。

結(jié)果表明,“剛度”的概念有助于診斷和表征泛化。

學(xué)習(xí)率的選擇對(duì)學(xué)習(xí)函數(shù)的剛度特性有顯著影響。高學(xué)習(xí)率會(huì)導(dǎo)致函數(shù)逼近在更大的距離上“更剛”(stiffer),并且學(xué)習(xí)到的特征可以更好地泛化到來(lái)自不同類(lèi)的輸入。另一方面,較低的學(xué)習(xí)率似乎能學(xué)到更詳細(xì)、更具體的特征,即使在訓(xùn)練集上導(dǎo)致同樣的損失,也不能泛化到其他類(lèi)。

這表明,高學(xué)習(xí)率的優(yōu)勢(shì)不僅在于收斂所需的步驟更少,還在于它們傾向于學(xué)習(xí)的特性具有更高的泛化性,即高學(xué)習(xí)率充當(dāng)了有效的正則化器。

剛度(Stiffness)的定義

剛度的定義如下:

如果點(diǎn)處的損失相對(duì)于網(wǎng)絡(luò)權(quán)重的梯度是,并且點(diǎn)處的梯度是?,則我們定義“剛度”為。

圖1:“剛度”概念的圖示

如圖1所示,“剛度”可以看做是通過(guò)應(yīng)用基于另一個(gè)輸入的梯度更新引起的輸入損失的變化,相當(dāng)于兩個(gè)輸入的梯度之間的梯度對(duì)齊(gradient alignment)。

實(shí)驗(yàn)和結(jié)果

基于類(lèi)隸屬度關(guān)系的剛度特性

我們基于驗(yàn)證集數(shù)據(jù)點(diǎn)的類(lèi)隸屬度(class membership )作為訓(xùn)練迭代函數(shù),研究了驗(yàn)證集數(shù)據(jù)點(diǎn)的剛度特性。

對(duì)于帶有真實(shí)標(biāo)簽的MNIST、FASHION MNIST和CIFAR-10數(shù)據(jù)集,結(jié)果分別顯示為圖3、圖5、圖6,對(duì)于帶有隨機(jī)排列訓(xùn)練集標(biāo)簽的MNIST數(shù)據(jù)集,結(jié)果為圖4.

圖3:MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence

圖4:MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence,訓(xùn)練時(shí)使用隨機(jī)排列的標(biāo)簽。

圖5:FASHION MNIST上完全連接網(wǎng)絡(luò)剛度的Class-membership dependence

圖6:CIFAR-10上卷積神經(jīng)網(wǎng)絡(luò)剛度的Class-membership dependence

圖3、圖5和圖6都顯示了4個(gè)訓(xùn)練階段的剛度矩陣:初始化階段(任何梯度步驟之前)、優(yōu)化早期階段和兩個(gè)后期階段。

學(xué)習(xí)率對(duì)剛度的影響

圖8:在MNIST 和 FASHION MNIST上以不同學(xué)習(xí)率訓(xùn)練,不同類(lèi)別的剛度。

如圖8所示,這兩幅圖給出了三種不同訓(xùn)練損失的 class dependent剛度矩陣。較高的學(xué)習(xí)率導(dǎo)致來(lái)自不同類(lèi)的輸入之間的剛度更高,表明它們學(xué)習(xí)的特性在不同類(lèi)之間更加可泛化(generalizable)。

結(jié)論

我們探討了神經(jīng)網(wǎng)絡(luò)剛度的概念,并用它來(lái)診斷和表征泛化。我們研究了在真實(shí)數(shù)據(jù)集上訓(xùn)練的模型的剛度,并測(cè)量了其隨訓(xùn)練迭代、類(lèi)隸屬度、數(shù)據(jù)點(diǎn)之間的距離和學(xué)習(xí)率的選擇而變化的情況。為了探討泛化和過(guò)擬合,我們重點(diǎn)研究了驗(yàn)證集中數(shù)據(jù)點(diǎn)的剛度。

總結(jié)而言,本文定義了剛度的概念,證明了它的實(shí)用性,為更好地理解神經(jīng)網(wǎng)絡(luò)中的泛化特性提供了一個(gè)新的視角,并觀(guān)察了其隨學(xué)習(xí)率的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1748

    瀏覽量

    57187
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100010
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24538

原文標(biāo)題:你的模型剛不剛?谷歌提出“剛度”概念,探索神經(jīng)網(wǎng)絡(luò)泛化新視角

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    東京大學(xué)的研究人員:新開(kāi)發(fā)的電子皮膚有個(gè)LED顯示屏

    過(guò)去的幾年出現(xiàn)了很多柔性電子皮膚貼片概念,可以管理藥物或監(jiān)測(cè)健康狀況,但是東京大學(xué)的研究人員最新開(kāi)發(fā)的版本增加了個(gè)LED顯示屏。
    發(fā)表于 05-15 08:46 ?1420次閱讀

    Google研究人員開(kāi)發(fā)增強(qiáng)現(xiàn)實(shí)顯微鏡檢測(cè)癌細(xì)胞

    Google研究人員開(kāi)發(fā)了種增強(qiáng)現(xiàn)實(shí)顯微鏡(ARM),該顯微鏡可以從個(gè)經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中獲取實(shí)時(shí)數(shù)據(jù),以檢測(cè)癌細(xì)胞,并將其顯示在查看
    發(fā)表于 04-23 12:09 ?2198次閱讀

    帶你了解AI研究人員年薪百萬(wàn)背后的真相

    近期,紐約時(shí)報(bào)記者卡德梅茨爆料了條令人「震驚」的消息——AI 研究人員年薪百萬(wàn)(哪怕是在 OpenAI 這樣的非營(yíng)利機(jī)構(gòu)里),個(gè)個(gè)都是人生贏(yíng)家。
    的頭像 發(fā)表于 05-28 17:46 ?5594次閱讀

    深度學(xué)習(xí)全新打開(kāi)方式Google Brain提出概念激活向量新方法

    最近,Google Brain團(tuán)隊(duì)的研究人員發(fā)表了篇論文,提出種名為概念激活向量(Conc
    的頭像 發(fā)表于 07-31 14:11 ?2887次閱讀

    研究人員提出系列新的點(diǎn)云處理模塊

    為了探索這些問(wèn)題的解決辦法、來(lái)自倫敦大學(xué)學(xué)院的研究人員提出系列新的點(diǎn)云處理模塊,從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行了研究,得到了更寬、更深、更快效率更高的點(diǎn)云處理網(wǎng)絡(luò),讓更
    的頭像 發(fā)表于 08-02 14:44 ?2967次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出</b>了<b class='flag-5'>一</b>系列新的點(diǎn)云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標(biāo)是通過(guò)單張圖像輸入,對(duì)圖像中的物體進(jìn)行檢測(cè)、獲取不同物體的類(lèi)別、掩膜和對(duì)應(yīng)的三維網(wǎng)格,并對(duì)真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進(jìn)并提出了新
    的頭像 發(fā)表于 08-02 15:51 ?3780次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出</b>了Mesh R-CNN模型

    Google AI發(fā)布項(xiàng)新研究 可以“近乎即時(shí)”地預(yù)報(bào)天氣

    近日,據(jù)外媒報(bào)道,Google AI發(fā)布項(xiàng)新研究,稱(chēng)可以“近乎即時(shí)”地預(yù)報(bào)天氣。谷歌的研究人員描述了如何能夠以?xún)H數(shù)分鐘的計(jì)算,以1公里的分
    發(fā)表于 01-17 11:47 ?581次閱讀

    研究人員已經(jīng)使用機(jī)器學(xué)習(xí)來(lái)開(kāi)發(fā)血液測(cè)試

    這個(gè)由來(lái)自哈佛醫(yī)學(xué)院,克利夫蘭診所,梅奧診所等眾多研究人員研究人員組成的多機(jī)構(gòu)團(tuán)隊(duì)對(duì)來(lái)自3,052名參與者的數(shù)據(jù)進(jìn)行了AI訓(xùn)練。其中,1,531例患有癌癥,1,521例沒(méi)有。
    的頭像 發(fā)表于 05-21 10:17 ?1905次閱讀

    AI研究人員如何應(yīng)對(duì)透明AI

    許多現(xiàn)代的AI系統(tǒng)都在神經(jīng)網(wǎng)絡(luò)上運(yùn)行,而我們僅了解其基礎(chǔ)知識(shí),因?yàn)樗惴ū旧砗苌偬峁┙忉尫绞?。缺乏解釋性通常被稱(chēng)為AI系統(tǒng)的“黑匣子”。研究人員將注意力集中在神經(jīng)網(wǎng)絡(luò)如何工作的細(xì)節(jié)上
    的頭像 發(fā)表于 07-14 16:31 ?1816次閱讀

    研究人員發(fā)現(xiàn)個(gè)可竊取AWS憑證的加密貨幣蠕蟲(chóng)

    研究人員近期發(fā)現(xiàn)個(gè)可以竊取AWS憑證的加密貨幣蠕蟲(chóng)。這是首個(gè)含有AWS特定功能的蠕蟲(chóng),該蠕蟲(chóng)可以竊取本地憑證、掃描錯(cuò)誤配置的Docker平臺(tái)的網(wǎng)絡(luò)。研究人員發(fā)現(xiàn)黑客組織TeamTNT
    的頭像 發(fā)表于 08-26 14:04 ?1533次閱讀
    <b class='flag-5'>研究人員</b>發(fā)現(xiàn)<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>可竊取AWS憑證的加密貨幣蠕蟲(chóng)

    研究人員宣布了種新的AI機(jī)器學(xué)習(xí)工具

    南加州大學(xué)(USC)的Victor Martinez是AI研究的首席研究員該軟件將于本月在2020年自然語(yǔ)言處理經(jīng)驗(yàn)方法會(huì)議論文集上首次亮相。其他研究人員USC克里希納包括和Soman
    的頭像 發(fā)表于 11-23 15:10 ?1821次閱讀

    研究人員發(fā)明全新AI感應(yīng)設(shè)備

    12月23日消息,據(jù)國(guó)外媒體報(bào)道,加州大學(xué)伯克利分校的研究人員發(fā)明了種裝置,利用可穿戴傳感器和人工智能軟件來(lái)確定一個(gè)人想要做出的手勢(shì)。
    的頭像 發(fā)表于 12-23 16:51 ?2659次閱讀

    研究人員為鋰硫電池提出種新陰極設(shè)計(jì)概念

    研究團(tuán)隊(duì),為鋰硫電池(Li–S)提出種新穎的陰極設(shè)計(jì)概念,將可大幅提升此類(lèi)具有發(fā)展前景的下代電池的性能。
    發(fā)表于 12-29 10:48 ?503次閱讀

    研究人員制造出種復(fù)制人類(lèi)的行為下棋的AI

    我們這些凡人在國(guó)際象棋上已經(jīng)很久沒(méi)有真正與人工智能競(jìng)爭(zhēng)了。距人類(lèi)在國(guó)際象棋比賽中征服計(jì)算機(jī)已有15年了。但是,近日,研究人員開(kāi)發(fā)了AI國(guó)際象棋e(cuò)ngine,它的出現(xiàn)并不是打算碾
    的頭像 發(fā)表于 02-23 09:38 ?1483次閱讀

    小到個(gè)分子!研究人員開(kāi)發(fā)種微小的壓電電阻器

    使用壓阻的電子傳感器在許多設(shè)備中都很常見(jiàn),包括汽車(chē)、醫(yī)療可穿戴設(shè)備和智能手機(jī)?,F(xiàn)在,澳大利亞的研究人員開(kāi)發(fā)了種微小的壓電電阻器,小到個(gè)分子,可以實(shí)現(xiàn)
    的頭像 發(fā)表于 10-31 16:52 ?752次閱讀