電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程12.7之阿達(dá)格拉德

PyTorch教程12.7之阿達(dá)格拉德

2023-06-05 | pdf | 0.37 MB | 次下載 | 免費(fèi)

資料介紹

讓我們首先考慮具有不常出現(xiàn)的特征的學(xué)習(xí)問(wèn)題。

12.7.1。稀疏特征和學(xué)習(xí)率

想象一下,我們正在訓(xùn)練一個(gè)語(yǔ)言模型。為了獲得良好的準(zhǔn)確性,我們通常希望在繼續(xù)訓(xùn)練時(shí)降低學(xué)習(xí)率,通常為O(t?12)或更慢。現(xiàn)在考慮在稀疏特征(即不常出現(xiàn)的特征)上進(jìn)行模型訓(xùn)練。這在自然語(yǔ)言中很常見(jiàn),例如,我們看到preconditioning一詞的可能性要小于learning 。然而,它在計(jì)算廣告和個(gè)性化協(xié)同過(guò)濾等其他領(lǐng)域也很常見(jiàn)。畢竟,有很多東西只是少數(shù)人感興趣的。

與不常見(jiàn)特征關(guān)聯(lián)的參數(shù)只有在這些特征出現(xiàn)時(shí)才會(huì)收到有意義的更新。如果學(xué)習(xí)率下降,我們可能會(huì)遇到這樣一種情況,即常見(jiàn)特征的參數(shù)會(huì)很快收斂到它們的最優(yōu)值,而對(duì)于不常見(jiàn)的特征,在確定它們的最優(yōu)值之前,我們?nèi)匀粵](méi)有足夠頻繁地觀察它們。換句話說(shuō),學(xué)習(xí)率要么對(duì)于頻繁出現(xiàn)的特征下降得太慢,要么對(duì)于不頻繁出現(xiàn)的特征下降得太快。

解決此問(wèn)題的一種可能的破解方法是計(jì)算我們看到特定功能的次數(shù),并將其用作調(diào)整學(xué)習(xí)率的時(shí)鐘也就是說(shuō),而不是選擇形式的學(xué)習(xí)率η=η0t+c我們可以使用 ηi=η0s(i,t)+c. 這里s(i,t) 計(jì)算特征的非零數(shù)i我們觀察到時(shí)間t. 這實(shí)際上很容易實(shí)現(xiàn),而且沒(méi)有任何有意義的開(kāi)銷。然而,每當(dāng)我們不太具有稀疏性而只是梯度通常非常小且很少大的數(shù)據(jù)時(shí),它就會(huì)失敗。畢竟,尚不清楚人們會(huì)在哪里劃清是否符合觀察到的特征的界限。

Duchi等人Adagrad 。( 2011 )通過(guò)更換相當(dāng)粗糙的計(jì)數(shù)器來(lái)解決這個(gè)問(wèn)題s(i,t)通過(guò)先前觀察到的梯度的平方的集合。特別是,它使用 s(i,t+1)=s(i,t)+(?if(x))2作為調(diào)整學(xué)習(xí)率的手段。這有兩個(gè)好處:首先,我們不再需要決定梯度何時(shí)足夠大。其次,它會(huì)隨著梯度的大小自動(dòng)縮放。通常對(duì)應(yīng)于大梯度的坐標(biāo)會(huì)顯著縮小,而其他具有小梯度的坐標(biāo)會(huì)得到更溫和的處理。在實(shí)踐中,這導(dǎo)致了計(jì)算廣告和相關(guān)問(wèn)題的非常有效的優(yōu)化過(guò)程。但這隱藏了 Adagrad 固有的一些額外好處,這些好處最好在預(yù)處理的背景下理解。

12.7.2。預(yù)處理

凸優(yōu)化問(wèn)題有利于分析算法的特性。畢竟,對(duì)于大多數(shù)非凸問(wèn)題來(lái)說(shuō),很難得出有意義的理論保證,但直覺(jué)洞察力 往往會(huì)起作用。讓我們看看最小化問(wèn)題 f(x)=12x?Qx+c?x+b.

正如我們?cè)?/font>12.6 節(jié)中看到的,可以根據(jù)其特征分解來(lái)重寫這個(gè)問(wèn)題 Q=U?ΛU得出一個(gè)大大簡(jiǎn)化的問(wèn)題,其中每個(gè)坐標(biāo)都可以單獨(dú)求解:

(12.7.1)f(x)=fˉ(xˉ)=12xˉ?Λxˉ+cˉ?xˉ+b.

這里我們使用了xˉ=Ux因此cˉ=Uc. 修改后的問(wèn)題具有最小值 xˉ=?Λ?1cˉ 和最小值 ?12cˉ?Λ?1cˉ+b. 這更容易計(jì)算,因?yàn)?/font>Λ是包含特征值的對(duì)角矩陣Q.

如果我們擾亂cslightly 我們希望在最小化器中找到微小的變化f. 不幸的是,這種情況并非如此。雖然略有變化c導(dǎo)致同樣輕微的變化

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
  2. 1.06 MB  |  532次下載  |  免費(fèi)
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費(fèi)
  5. 3TC358743XBG評(píng)估板參考手冊(cè)
  6. 1.36 MB  |  330次下載  |  免費(fèi)
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費(fèi)
  9. 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費(fèi)
  11. 6迪文DGUS開(kāi)發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費(fèi)
  13. 7元宇宙底層硬件系列報(bào)告
  14. 13.42 MB  |  182次下載  |  免費(fèi)
  15. 8FP5207XR-G1中文應(yīng)用手冊(cè)
  16. 1.09 MB  |  178次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費(fèi)
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費(fèi)
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費(fèi)
  7. 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
  8. 未知  |  21549次下載  |  免費(fèi)
  9. 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費(fèi)
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費(fèi)
  13. 7電子制作實(shí)例集錦 下載
  14. 未知  |  8113次下載  |  免費(fèi)
  15. 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
  16. 0.00 MB  |  6656次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191187次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  14. 158M  |  183279次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138040次下載  |  免費(fèi)