0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)-會開發(fā)AI的AI:超網(wǎng)絡(luò)有望讓深度學(xué)習(xí)大眾化

恬靜簡樸1 ? 來源:恬靜簡樸1 ? 作者:恬靜簡樸1 ? 2022-10-13 09:30 ? 次閱讀

會開發(fā)AI的AI:超網(wǎng)絡(luò)有望讓深度學(xué)習(xí)大眾化

超網(wǎng)絡(luò)(hypernetwork)可以加快訓(xùn)練AI的過程。

編者按:在執(zhí)行特定類型任務(wù),如圖像識別、語音識別等方面,AI已經(jīng)可以與人類相媲美了,甚至有時候已經(jīng)超越了人類。但這些AI事先必須經(jīng)過訓(xùn)練,而訓(xùn)練是個既耗時又耗計算能力的過程,有上百萬甚至幾十億的參數(shù)需要優(yōu)化。但最近研究人員做出了能瞬時預(yù)測參數(shù)的超網(wǎng)絡(luò)。通過利用超網(wǎng)絡(luò)(hypernetwork),研究人員現(xiàn)在可以先下手為強,提前對人工神經(jīng)網(wǎng)絡(luò)進行調(diào)優(yōu),從而節(jié)省部分訓(xùn)練時間和費用。文章來自編譯。譯者:boxi。

劃重點:

人工智能是一場數(shù)字游戲,訓(xùn)練耗時耗力

網(wǎng)絡(luò)可以在幾分之一秒內(nèi)預(yù)測出新網(wǎng)絡(luò)的參數(shù)

超網(wǎng)絡(luò)的表現(xiàn)往往可以跟數(shù)千次 SGD 迭代的結(jié)果不相上下,有時甚至是更好

超網(wǎng)絡(luò)有望讓深度學(xué)習(xí)大眾化

人工智能在很大程度上是一場數(shù)字游戲。10 年前,深度神經(jīng)網(wǎng)絡(luò)(一種學(xué)習(xí)識別數(shù)據(jù)模式的 AI 形式)之所以開始超越傳統(tǒng)算法,那是因為我們終于有了足夠的數(shù)據(jù)和處理能力,可以充分利用這種AI。

現(xiàn)如今的神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)和處理能力更加渴望。訓(xùn)練它們需要對表征參數(shù)的值進行仔細(xì)的調(diào)整,那些參數(shù)代表人工神經(jīng)元之間連接的強度,有數(shù)百萬甚至數(shù)十億之巨。其目標(biāo)是為它們找到接近理想的值,而這個過程叫做優(yōu)化,但訓(xùn)練網(wǎng)絡(luò)達到這一點并不容易。 DeepMind研究科學(xué)家Petar Veli?kovi? 表示:“訓(xùn)練可能需要數(shù)天、數(shù)周甚至數(shù)月之久”。

但這種情況可能很快就會改變。加拿大安大略省圭爾夫大學(xué)(University of Guelph)的Boris Knyazev和他的同事設(shè)計并訓(xùn)練了一個“超網(wǎng)絡(luò)”——這有點像是凌駕于其他神經(jīng)網(wǎng)絡(luò)之上的最高統(tǒng)治者——用它可以加快訓(xùn)練的過程。給定一個為特定任務(wù)設(shè)計,未經(jīng)訓(xùn)練的新深度神經(jīng)網(wǎng)絡(luò),超網(wǎng)絡(luò)可以在幾分之一秒內(nèi)預(yù)測出該新網(wǎng)絡(luò)的參數(shù),理論上可以讓訓(xùn)練變得不必要。由于超網(wǎng)絡(luò)學(xué)習(xí)了深度神經(jīng)網(wǎng)絡(luò)設(shè)計當(dāng)中極其復(fù)雜的模式,因此這項工作也可能具有更深層次的理論意義。

目前為止,超網(wǎng)絡(luò)在某些環(huán)境下的表現(xiàn)出奇的好,但仍有增長空間——考慮到問題的量級,這是很自然的。如果他們能解決這個問題,Veli?kovi?說:“這將對機器學(xué)習(xí)產(chǎn)生很大的影響?!?。

變成“超網(wǎng)絡(luò)”

目前,訓(xùn)練和優(yōu)化深度神經(jīng)網(wǎng)絡(luò)最好的方法是隨機梯度下降(SGD) 技術(shù)的各種變種。訓(xùn)練涉及到將網(wǎng)絡(luò)在給定任務(wù)(例如圖像識別)中所犯的錯誤最小化。 SGD 算法通過大量標(biāo)記數(shù)據(jù)來調(diào)整網(wǎng)絡(luò)參數(shù),并減少錯誤或損失。梯度下降是從損失函數(shù)的高位值一級級向下降到某個最小值的迭代過程,代表的是足夠好的(或有時候甚至是可能的最好)參數(shù)值。

但是這種技術(shù)只有在你有需要優(yōu)化的網(wǎng)絡(luò)時才有效。為了搭建最開始的神經(jīng)網(wǎng)絡(luò)(一般由從輸入到輸出的多層人工神經(jīng)元組成),工程師必須依靠自己的直覺和經(jīng)驗法則。這些結(jié)構(gòu)在神經(jīng)元的層數(shù)、每層包含的神經(jīng)元數(shù)量等方面可能會有所不同。

pYYBAGNHajiAK8DyAAIZT-0JZkc571.jpg

梯度下降算法讓網(wǎng)絡(luò)沿著其“損失景觀”向下走,其中高位值表示較大錯誤或損失。算法旨在找到全局最小值,讓損失最小化。

理論上可以從多個結(jié)構(gòu)出發(fā),然后優(yōu)化每個結(jié)構(gòu)并選出最好的。但Google Brain 訪問學(xué)者 MengYe Ren 說:“訓(xùn)練需要花費相當(dāng)多的時間,要想訓(xùn)練和測試每以個候選網(wǎng)絡(luò)結(jié)構(gòu)是不可能的。這種做法擴展不好,尤其是如果要考慮到數(shù)百萬種可能設(shè)計的話。”

于是 2018 年,Ren 與自己在多倫多大學(xué)的前同事 Chris Zhang ,以及他們的指導(dǎo) Raquel Urtasun 開始嘗試一種不同的方法。他們設(shè)計出一種所謂的圖超網(wǎng)絡(luò)(Graph Hypernetwork, GHN),這種網(wǎng)絡(luò)可以在給出一組候選結(jié)構(gòu)的情況下,找出解決某個任務(wù)的最佳深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

顧名思義,“圖”指的是深度神經(jīng)網(wǎng)絡(luò)的架結(jié)構(gòu),可以認(rèn)為是數(shù)學(xué)意義的圖——由線或邊連接的點或節(jié)點組成的集合。此處節(jié)點代表計算單元(通常是神經(jīng)網(wǎng)絡(luò)的一整層),邊代表的是這些單元互連的方式。

原理是這樣的。圖超網(wǎng)絡(luò)從任何需要優(yōu)化的結(jié)構(gòu)(稱其為候選結(jié)構(gòu))開始,然后盡最大努力預(yù)測候選結(jié)構(gòu)的理想?yún)?shù)。接著將實際神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置為預(yù)測值,用給定任務(wù)對其進行測試。Ren 的團隊證明,這種方法可用于來對候選結(jié)構(gòu)進行排名,并選擇表現(xiàn)最佳的結(jié)構(gòu)。

當(dāng) Knyazev 和他的同事想出圖超網(wǎng)絡(luò)這個想法時,他們意識到可以在此基礎(chǔ)上進一步開發(fā)。在他們的新論文里,這支團隊展示了 GHN 的用法,不僅可以用來從一組樣本中找到最佳的結(jié)構(gòu),還可以預(yù)測最好網(wǎng)絡(luò)的參數(shù),讓網(wǎng)絡(luò)表現(xiàn)出絕對意義上的好。在其中的最好還沒有達到最好的情況下,還可以利用梯度下降進一步訓(xùn)練該網(wǎng)絡(luò)。

在談到這項新工作時,Ren 表示:“這篇論文非常扎實,里面包含的實驗比我們多得多。他們在非常努力地提升圖超網(wǎng)絡(luò)的絕對表現(xiàn),這是我們所樂見的?!?/p>

訓(xùn)練“訓(xùn)練師”

Knyazev和他的團隊將自己的超網(wǎng)絡(luò)稱為是 GHN -2,這種網(wǎng)絡(luò)從兩個重要方面改進了Ren及其同事構(gòu)建的圖超網(wǎng)絡(luò)。

首先,他們需要依賴 Ren 等人的技術(shù),用圖來表示神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該圖里面的每個節(jié)點都包含有關(guān)于執(zhí)行特定類型計算的神經(jīng)元子集的編碼信息。圖的邊則描述了信息是如何從一個節(jié)點轉(zhuǎn)到另一節(jié)點,如何從輸入轉(zhuǎn)到輸出的。

他們借鑒的第二個想法是一種方法,訓(xùn)練超網(wǎng)絡(luò)來預(yù)測新的候選結(jié)構(gòu)的方法。這需要用到另外兩個神經(jīng)網(wǎng)絡(luò)。第一個用來開啟對原始候選圖的計算,更新與每個節(jié)點相關(guān)的信息,第二個把更新過的節(jié)點作為輸入,然后預(yù)測候選神經(jīng)網(wǎng)絡(luò)相應(yīng)計算單元的參數(shù)。這兩個網(wǎng)絡(luò)也有自己的參數(shù),在超網(wǎng)絡(luò)能夠正確預(yù)測參數(shù)值之前,必須對這兩個網(wǎng)絡(luò)進行優(yōu)化。

poYBAGNHajmABYcmAALSvZf_Snw782.jpg

用圖來表示神經(jīng)網(wǎng)絡(luò)

為此,你得訓(xùn)練數(shù)據(jù)——在本案例中,數(shù)據(jù)就是可能的人工神經(jīng)網(wǎng)絡(luò)(ANN)結(jié)構(gòu)的隨機樣本。對于樣本的每一個結(jié)構(gòu),你都要從圖開始,然后用圖超網(wǎng)絡(luò)來預(yù)測參數(shù),并利用預(yù)測的參數(shù)對候選 ANN進行初始化。然后該ANN會執(zhí)行一些特定任務(wù),如識別一張圖像。通過計算該ANN的損失函數(shù)來更新做出預(yù)測的超網(wǎng)絡(luò)的參數(shù),而不是更新該ANN的參數(shù)以便做出更好的預(yù)測。這樣以來,該超網(wǎng)絡(luò)下一次就能做得更好。現(xiàn)在,通過遍歷部分標(biāo)記訓(xùn)練圖像數(shù)據(jù)集的每一張圖像,以及隨機樣本結(jié)構(gòu)里面的每一個ANN,一步步地減少損失,直至最優(yōu)。到了一定時候,你就可以得到一個訓(xùn)練好的超網(wǎng)絡(luò)。

由于Ren 的團隊沒有公開他們的源代碼,所以Knyazev 的團隊采用上述想法自己從頭開始寫軟件。然后Knyazev及其同事在此基礎(chǔ)上加以改進。首先,他們確定了 15 種類型的節(jié)點,這些節(jié)點混合搭配可構(gòu)建幾乎任何的現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)。在提高預(yù)測準(zhǔn)確性方面,他們也取得了一些進展。

最重要的是,為了確保 GHN-2 能學(xué)會預(yù)測各種目標(biāo)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù),Knyazev 及其同事創(chuàng)建了一個包含 100 萬種可能結(jié)構(gòu)的獨特數(shù)據(jù)集。Knyazev 說:“為了訓(xùn)練我們的模型,我們創(chuàng)建了盡量多樣化的隨機結(jié)構(gòu)”。

因此,GHN-2 的預(yù)測能力很有可能可以很好地泛化到未知的目標(biāo)結(jié)構(gòu)。Google Research的Brain Team研究科學(xué)家 Thomas Kipf 說:“比方說,人們使用的各種典型的最先進結(jié)構(gòu)他們都可以解釋,這是一大重大貢獻?!?/p>

結(jié)果令人印象深刻

當(dāng)然,真正的考驗是讓 GHN-2 能用起來。一旦 Knyazev 和他的團隊訓(xùn)練好這個網(wǎng)絡(luò),讓它可以預(yù)測給定任務(wù)(比方說對特定數(shù)據(jù)集的圖像進行分類)的參數(shù)之后,他們開始測試,讓這個網(wǎng)絡(luò)給隨機挑選的候選結(jié)構(gòu)預(yù)測參數(shù)。該新的候選結(jié)構(gòu)與訓(xùn)練數(shù)據(jù)集上百萬結(jié)構(gòu)當(dāng)中的某個也許具備相似的屬性,也可能并不相同——有點算是異類。在前一種情況下,目標(biāo)結(jié)構(gòu)可認(rèn)為屬于分布范圍內(nèi);若是后者,則屬于分布范圍外。深度神經(jīng)網(wǎng)絡(luò)在對后者進行預(yù)測時經(jīng)常會失敗,所以用這類數(shù)據(jù)測試 GHN-2 非常重要。

借助經(jīng)過全面訓(xùn)練的 GHN-2,該團隊預(yù)測了 500 個以前看不見的隨機目標(biāo)網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)。然后將這 500 個網(wǎng)絡(luò)(其參數(shù)設(shè)置為預(yù)測值)與使用隨機梯度下降訓(xùn)練的相同網(wǎng)絡(luò)進行對比。新的超網(wǎng)絡(luò)通??梢缘钟鶖?shù)千次 SGD 迭代,有時甚至做得更好,盡管有些結(jié)果更加復(fù)雜。

借助訓(xùn)練好的 GHN-2 模型,該團隊預(yù)測了 500 個之前未知的隨機目標(biāo)網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)。然后將這 500 個(參數(shù)設(shè)置為預(yù)測值的)網(wǎng)絡(luò)與利用隨機梯度下降訓(xùn)練的同一網(wǎng)絡(luò)進行對比。盡管部分結(jié)果有好有壞,但新的超網(wǎng)絡(luò)的表現(xiàn)往往可以跟數(shù)千次 SGD 迭代的結(jié)果不相上下,有時甚至是更好。

對于圖像數(shù)據(jù)集 CIFAR-10 ,GHN-2 用于分布范圍內(nèi)的結(jié)構(gòu)得到的平均準(zhǔn)確率為 66.9%,而用經(jīng)過近 2500 次 SGD 迭代訓(xùn)練出來的網(wǎng)絡(luò),其平均準(zhǔn)確率為 69.2%。對于不在分布范圍內(nèi)的結(jié)構(gòu),GHN-2 的表現(xiàn)則出人意料地好,準(zhǔn)確率達到了約 60%。尤其是,對一種知名的特定深度神經(jīng)網(wǎng)絡(luò)架構(gòu), ResNet-50, GHN2的準(zhǔn)確率達到了 58.6% 這是相當(dāng)可觀的。在本領(lǐng)域的頂級會議 NeurIPS 2021 上,Knyazev說:“鑒于 ResNet-50 比我們一般訓(xùn)練的結(jié)構(gòu)大了有大概 20 倍,可以說泛化到 ResNet-50 的效果出奇地好?!?。

不過GHN-2 應(yīng)用到 ImageNet 上卻表現(xiàn)不佳。ImageNet 這個數(shù)據(jù)集規(guī)模很大。平均而言,它的準(zhǔn)確率只有 27.2% 左右。盡管如此,跟經(jīng)過 5000SGD 迭代訓(xùn)練的同一網(wǎng)絡(luò)相比,GHN-2的表現(xiàn)也要好一些,后者的平均準(zhǔn)確度只有 25.6%。 (當(dāng)然,如果你繼續(xù)用 SGD 迭代的話,你最終可以實現(xiàn)95% 的準(zhǔn)確率,只是成本會非常高。)最關(guān)鍵的是,GHN-2 是在不到一秒的時間內(nèi)對ImageNet 做出了參數(shù)預(yù)測,而如果用 SGD 在GPU上預(yù)測參數(shù),要想達到同樣的表現(xiàn),花費的平均時間要比 GHN-2 要多 10000 倍。

Veli?kovi?說:“結(jié)果絕對是令人印象深刻?;旧纤麄円呀?jīng)極大地降低了能源成本。”

一旦GHN-2 從結(jié)果樣本中為特定任務(wù)選出了最佳的神經(jīng)網(wǎng)絡(luò),但這個網(wǎng)絡(luò)表現(xiàn)還不夠好時,至少該模型已經(jīng)過了部分訓(xùn)練,而且可以還進一步優(yōu)化了。與其對用隨機參數(shù)初始化的網(wǎng)絡(luò)進行 SGD,不如以 GHN-2 的預(yù)測作為起點。Knyazev 說:“基本上我們是在模仿預(yù)訓(xùn)練”。

超越 GHN-2

盡管取得了這些成功,但Knyazev 認(rèn)為剛開始的時候機器學(xué)習(xí)社區(qū)會抵制使用圖超網(wǎng)絡(luò)。他把這種阻力拿來跟 2012 年之前深度神經(jīng)網(wǎng)絡(luò)的遭遇相比擬。當(dāng)時,機器學(xué)習(xí)從業(yè)者更喜歡人工設(shè)計的算法,而不是神秘的深度網(wǎng)絡(luò)。但是,當(dāng)用大量數(shù)據(jù)訓(xùn)練出來的大型深度網(wǎng)絡(luò)開始超越傳統(tǒng)算法時,情況開始逆轉(zhuǎn)。Knyazev :“超網(wǎng)絡(luò)也可能會走上同樣的道路?!?/p>

與此同時,Knyazev 認(rèn)為還有很多的改進機會。比方說,GHN-2 只能訓(xùn)練來預(yù)測參數(shù),去解決給定的任務(wù),比如對 CIFAR-10 或 ImageNet 里面的圖像進行分類,但不能同時執(zhí)行不同的任務(wù)。將來,他設(shè)想可以用更加多樣化的結(jié)果以及不同類型的任務(wù)(如圖像識別、語音識別與自然語言處理)來訓(xùn)練圖超網(wǎng)絡(luò)。然后同時根據(jù)目標(biāo)結(jié)構(gòu)與手頭的特定任務(wù)來做出預(yù)測。

如果這些超網(wǎng)絡(luò)確實能成功的話,那么新的深度神經(jīng)網(wǎng)絡(luò)的設(shè)計和開發(fā),將不再是有錢和能夠訪問大數(shù)據(jù)的公司的專利了。任何人都可以參與其中。Knyazev 非常清楚這種“讓深度學(xué)習(xí)大眾化”的潛力,稱之為長期愿景。

然而,如果像GHN -2 這樣的超網(wǎng)絡(luò)真的成為優(yōu)化神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)方法, Veli?kovi?強調(diào)了一個潛在的大問題。他說,對于圖超網(wǎng)絡(luò),“你有一個神經(jīng)網(wǎng)絡(luò)——本質(zhì)上是一個黑盒子——預(yù)測另一個神經(jīng)網(wǎng)絡(luò)的參數(shù)。所以當(dāng)它出錯時,你無法解釋[它]?!?/p>

不過,Veli?kovi? 強調(diào),如果類似 GHN-2 這樣的超網(wǎng)絡(luò)真的成為優(yōu)化神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)方法的話,可能會有一個大問題。他說:“你會得到一個基本上是個黑箱的神經(jīng)網(wǎng)絡(luò),然后再用圖超網(wǎng)絡(luò)去預(yù)測另一個神經(jīng)網(wǎng)絡(luò)的參數(shù)。如果它出錯,你沒法解釋錯在哪里。”

當(dāng)然,神經(jīng)網(wǎng)絡(luò)基本上也是這樣。Veli?kovi?說:“我不會說這是弱點,我把這叫做告警信號。”

不過Kipf看到的卻是一線希望。 “讓我最為興奮的是其他東西。” GHN-2 展示了圖神經(jīng)網(wǎng)絡(luò)在復(fù)雜數(shù)據(jù)當(dāng)中尋找模式的能力。

通常,深度神經(jīng)網(wǎng)絡(luò)是在圖像、文本或音頻信號里面尋找模式,這類信息一般都比較結(jié)構(gòu)化。但 GHN-2 卻是在完全隨機的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖里面尋找模式。而圖是非常復(fù)雜的數(shù)據(jù)。

還有,GHN-2 可以泛化——這意味著它可以對未知、甚至不在分布范圍內(nèi)的網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)做出合理的預(yù)測。Kipf 說:“這項工作向我們表明,不同結(jié)構(gòu)的很多模式其實多少是優(yōu)點相似的,而且模型能學(xué)習(xí)如何將知識從一種結(jié)構(gòu)轉(zhuǎn)移到另一種結(jié)構(gòu),這可能會啟發(fā)神經(jīng)網(wǎng)絡(luò)新理論的誕生?!?/p>

如果是這樣的話,它可能會讓我們對這些黑箱有新的、更深入的理解。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266225
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120592
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?407次閱讀

    PyTorch深度學(xué)習(xí)開發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開發(fā)環(huán)境的搭建對于深度學(xué)習(xí)研究者和開發(fā)者來說至關(guān)重要
    的頭像 發(fā)表于 07-16 18:29 ?520次閱讀

    基于AI深度學(xué)習(xí)的缺陷檢測系統(tǒng)

    在工業(yè)生產(chǎn)中,缺陷檢測是確保產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工檢測方法不僅效率低下,且易受人為因素影響,導(dǎo)致誤檢和漏檢問題頻發(fā)。隨著人工智能技術(shù)的飛速發(fā)展,特別是深度學(xué)習(xí)技術(shù)的崛起,基于AI深度
    的頭像 發(fā)表于 07-08 10:30 ?539次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    深度學(xué)習(xí)和自然語言處理(NLP)是計算機科學(xué)領(lǐng)域中兩個非常重要的研究方向。它們之間既有聯(lián)系,也有區(qū)別。本文將介紹深度學(xué)習(xí)與NLP的區(qū)別。 深度
    的頭像 發(fā)表于 07-05 09:47 ?489次閱讀

    人工智能、機器學(xué)習(xí)深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning,
    的頭像 發(fā)表于 07-03 18:22 ?673次閱讀

    深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為其中的重要分支,已經(jīng)在多個領(lǐng)域取得了顯著的應(yīng)用成果。從圖像識別、語音識別
    的頭像 發(fā)表于 07-02 18:19 ?559次閱讀

    深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法

    深度學(xué)習(xí)模型在訓(xùn)練過程中,往往遇到各種問題和挑戰(zhàn),如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學(xué)習(xí)模型進行優(yōu)化與調(diào)試是確保其性能優(yōu)越的
    的頭像 發(fā)表于 07-01 11:41 ?457次閱讀

    泰禾智能攜AI智選深度學(xué)習(xí)系列新品亮相臨沂花生展

    6月28-29日,2024年第十一屆花生產(chǎn)業(yè)博覽會在臨沂國際會展中心盛大開幕。泰禾智能攜AI智選深度學(xué)習(xí)系列新品精彩亮相展會,以其卓越的技術(shù)實力和前沿的產(chǎn)品創(chuàng)新,為用戶帶來更加智能、高效、便捷
    的頭像 發(fā)表于 06-29 14:19 ?605次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    基礎(chǔ)設(shè)施,人們?nèi)匀粵]有定論。如果 Mipsology 成功完成了研究實驗,許多正受 GPU 折磨的 AI 開發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此
    發(fā)表于 03-21 15:19

    【技術(shù)科普】主流的深度學(xué)習(xí)模型有哪些?AI開發(fā)工程師必備!

    深度學(xué)習(xí)在科學(xué)計算中獲得了廣泛的普及,其算法被廣泛用于解決復(fù)雜問題的行業(yè)。所有深度學(xué)習(xí)算法都使用不同類型的神經(jīng)網(wǎng)絡(luò)來執(zhí)行特定任務(wù)。 什么是
    的頭像 發(fā)表于 01-30 15:26 ?505次閱讀
    【技術(shù)科普】主流的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型有哪些?<b class='flag-5'>AI</b><b class='flag-5'>開發(fā)</b>工程師必備!

    詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    在如今的網(wǎng)絡(luò)時代,錯綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境,傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年,深度
    的頭像 發(fā)表于 01-11 10:51 ?1604次閱讀
    詳解<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>、神經(jīng)<b class='flag-5'>網(wǎng)絡(luò)</b>與卷積神經(jīng)<b class='flag-5'>網(wǎng)絡(luò)</b>的應(yīng)用

    深度學(xué)習(xí)在人工智能中的 8 種常見應(yīng)用

    深度學(xué)習(xí)簡介深度學(xué)習(xí)是人工智能(AI)的一個分支,它教神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 12-01 08:27 ?2962次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在人工智能中的 8 種常見應(yīng)用

    深度學(xué)習(xí)技術(shù)與邊緣學(xué)習(xí)技術(shù)的不同之處

    如今,AI技術(shù)的廣泛應(yīng)用已經(jīng)成為推動制造和物流領(lǐng)域自動的核心驅(qū)動力??的鸵曀瞥龅?b class='flag-5'>深度學(xué)習(xí)和邊緣學(xué)習(xí)技術(shù),這兩種基于
    的頭像 發(fā)表于 11-17 10:44 ?476次閱讀

    深度學(xué)習(xí)在語音識別中的應(yīng)用及挑戰(zhàn)

    的挑戰(zhàn)。 二、深度學(xué)習(xí)在語音識別中的應(yīng)用 1.基于深度神經(jīng)網(wǎng)絡(luò)的語音識別:深度神經(jīng)網(wǎng)絡(luò)(DNN)
    的頭像 發(fā)表于 10-10 18:14 ?746次閱讀

    深度學(xué)習(xí)的由來 深度學(xué)習(xí)的經(jīng)典算法有哪些

    深度學(xué)習(xí)作為機器學(xué)習(xí)的一個分支,其學(xué)習(xí)方法可以分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。兩種方法都具有其獨特的
    發(fā)表于 10-09 10:23 ?483次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的由來 <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法有哪些