在2018年及其以后,深層神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)在更大的人工智能(AI)領(lǐng)域會如何發(fā)展?我們?nèi)绾文荛_發(fā)出越來越復(fù)雜的機器以在日常生活中幫助人類?
這些都是普渡大學(xué)機器學(xué)習(xí)硬件教授尤金尼奧·庫魯爾塞羅(Eugenio Culurciello)關(guān)注的問題。請注意,本文的重點并非有關(guān)AI的預(yù)測,而是對該領(lǐng)域發(fā)展軌跡、趨勢以及技術(shù)需求的詳細分析,以幫助創(chuàng)造更有用的AI。當然,并非所有的機器學(xué)習(xí)都是針對AI的,還有些其他容易實現(xiàn)的目標,下面我們就仔細審視下。
目標
AI領(lǐng)域的目標是通過機器上實現(xiàn)人類和超人的能力,以便讓它們在日常生活中幫助我們。自動駕駛車輛、智能家居、人工助理以及安全攝像頭將是植入AI技術(shù)的首批目標,家庭烹飪和清潔機器人、無人偵察機和機器人則是第二批目標。
其他目標還有移動設(shè)備上的助理,全職陪伴助理(可以聽到和看到我們的生活經(jīng)歷)。而AI領(lǐng)域的終極目標是打造完全自主的合成實體,它可以在日常工作中以相當于人類或超越人類的水平行事。
軟件
在這里,軟件被定義為通過優(yōu)化算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)構(gòu)架以解決特定的任務(wù)。今天,神經(jīng)網(wǎng)絡(luò)是用來學(xué)習(xí)解決問題的實際工具,其中涉及通過大數(shù)據(jù)集進行分類學(xué)習(xí)。但這并不是全部AI,它要求在現(xiàn)實世界中,在沒有監(jiān)督的情況下學(xué)習(xí),也要吸取以前從未見過的經(jīng)驗,常常需要把以前學(xué)到的知識結(jié)合起來以解決當前的挑戰(zhàn)。
如何讓目前的神經(jīng)網(wǎng)絡(luò)演變成AI?
神經(jīng)網(wǎng)絡(luò)架構(gòu):幾年前,當神經(jīng)網(wǎng)絡(luò)架構(gòu)發(fā)展起來的時候,我們經(jīng)常認為從數(shù)據(jù)中自動學(xué)習(xí)算法的參數(shù)擁有巨大優(yōu)勢,而且這比手工編寫的算法功能更強大。
我們必須嘗試從頭開始訓(xùn)練多個架構(gòu),并看看哪一個最有效。這就是我們今天使用的、非常耗時的試錯過程!我們應(yīng)該克服這一限制,并在這個非常重要的問題上多加思考。
無監(jiān)督學(xué)習(xí):我們不能總是干預(yù)神經(jīng)網(wǎng)絡(luò),引導(dǎo)它們的每一次體驗。我們不能在每個實例中都糾正它們,并提供它們的性能反饋。我們的生活也要持續(xù)下去!
但這正是我們今天利用受監(jiān)督神經(jīng)網(wǎng)絡(luò)所做的:我們?yōu)槊總€實例提供幫助,使它們能夠正確執(zhí)行。相反,人類只需從少數(shù)幾個例子中學(xué)習(xí),并且能夠以連續(xù)的方式自我校正和學(xué)習(xí)更復(fù)雜的數(shù)據(jù)。
預(yù)測神經(jīng)網(wǎng)絡(luò):目前神經(jīng)網(wǎng)絡(luò)的一個主要局限是它們沒有人類大腦最重要的特征之一,即預(yù)測能力。關(guān)于人腦如何工作的一個主要理論是它能不斷地預(yù)測,即擁有預(yù)測代碼。
如果你仔細想想,就會發(fā)現(xiàn)我們每天都在使用它。你提起一個自認為很輕的物體,但結(jié)果它卻很重。這會讓你感到驚訝,因為當你接近它的時候,你已經(jīng)預(yù)測它將如何影響你和你的身體,或者你的整體環(huán)境。
或者,在現(xiàn)代世界里,當我們匆忙出門時,我的手機落在哪里。構(gòu)建預(yù)測神經(jīng)網(wǎng)絡(luò)是我們與現(xiàn)實世界互動的核心,并能在復(fù)雜的環(huán)境中發(fā)揮作用。因此,這是任何強化學(xué)習(xí)的核心網(wǎng)絡(luò)。
當前神經(jīng)網(wǎng)絡(luò)的局限性:無法預(yù)測,無法解釋理由,以及暫時的不穩(wěn)定性,因此我們需要一種新的神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)膠囊(Neural Network Capsules)就是解決當前神經(jīng)網(wǎng)絡(luò)局限性的一種方法,但我們認為它必須有些額外的特點:
1、視頻幀操作:這很簡單,因為我們需要做的就是讓膠囊路由查看最近時間的多個數(shù)據(jù)點。這相當于在最近的重要數(shù)據(jù)點上建立起關(guān)聯(lián)內(nèi)存。請注意,這些不是最近幀的最新表達,而是它們最新的不同表達。
可以通過僅保存與預(yù)定義值不同的表達來獲得不同內(nèi)容的不同表達。這個重要的細節(jié)只允許保存最近歷史上的相關(guān)信息,而不是一系列無用的相關(guān)數(shù)據(jù)點。
2、預(yù)測神經(jīng)網(wǎng)絡(luò)能力:這已經(jīng)是動態(tài)路由的一部分,它迫使各層預(yù)測下一層表達。這是一種非常強大的自我學(xué)習(xí)技巧,在我們看來,它勝過了我們在社區(qū)中發(fā)展的所有其他非監(jiān)督表現(xiàn)學(xué)習(xí)。膠囊現(xiàn)在需要能夠預(yù)測長期的時空關(guān)系,但目前還沒有實現(xiàn)。
轉(zhuǎn)移學(xué)習(xí):或者稱我們?nèi)绾巫屵@些算法通過觀看視頻自學(xué),就像我們學(xué)習(xí)如何烹飪新的東西一樣。這是一種能力,需要我們上面列出的所有因素,而且對于加強學(xué)習(xí)也很重要。現(xiàn)在你可以通過舉例子的方式來訓(xùn)練你的機器去做你想讓它做的事情,就像我們?nèi)祟愐粯印?/p>
強化學(xué)習(xí):這是深神經(jīng)網(wǎng)絡(luò)研究的“圣杯”,即教機器如何在真實的世界環(huán)境中學(xué)習(xí)!這需要自學(xué)、持續(xù)學(xué)習(xí)、預(yù)測能力,還有很多我們不知道的東西。在強化學(xué)習(xí)領(lǐng)域有很多東西需要了解,但對作者們來說,這只觸及到問題的表面。
強化學(xué)習(xí)通常被稱為“蛋糕上的櫻桃”,意思是它只是塑料合成大腦上微不足道的訓(xùn)練。但是,我們?nèi)绾尾拍艿玫揭粋€“通用”大腦輕松地解決所有的問題呢?
這是個“先有雞還是先有蛋”的問題!今天,要想一個個地解決強化學(xué)習(xí)的問題,我們需要使用標準神經(jīng)網(wǎng)絡(luò):一個深度的神經(jīng)網(wǎng)絡(luò),它接收大量的數(shù)據(jù)輸入,如視頻或音頻,并將其壓縮成表示;一個序列學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),如RNN,以便了解任務(wù)。
這兩個部分都是問題的明顯解決方案,目前顯然是錯誤的,但這是每個人都在使用的,因為它們是當前可用的構(gòu)建塊。
不要更多的遞歸神經(jīng)網(wǎng)絡(luò)(RNN):因為它們在并行化方面表現(xiàn)特別糟糕,甚至在特殊的定制機器上也很慢,因為它們的內(nèi)存帶寬使用率很高,內(nèi)存帶寬存在限制?;谧⒁饬Φ纳窠?jīng)網(wǎng)絡(luò)更高效,可更快速地進行訓(xùn)練和部署,并且在訓(xùn)練和部署方面的可伸縮性更少。
在神經(jīng)網(wǎng)絡(luò)中,注意力有可能使許多架構(gòu)發(fā)生真正的改變,但它并沒有得到應(yīng)有的認可。聯(lián)想記憶和注意力的結(jié)合是下一波神經(jīng)網(wǎng)絡(luò)發(fā)展的核心。我們認識到,基于注意力的神經(jīng)網(wǎng)絡(luò)將逐漸取代基于RNN的語音識別,并在強化學(xué)習(xí)構(gòu)架和通用人工智能中找到它們的方法。
分類神經(jīng)網(wǎng)絡(luò)中信息的定位:實際上這是一個已經(jīng)解決的問題,將被嵌入到未來的神經(jīng)網(wǎng)絡(luò)架構(gòu)中。
硬件
深度學(xué)習(xí)硬件才是進步的核心。現(xiàn)在讓我們忘記2008-2012年深度學(xué)習(xí)的快速擴展,近年的進步主要取決于硬件:在社交媒體的幫助下,每部手機上的廉價圖像傳感器都可以收集巨大的數(shù)據(jù)集,但其只處于次級重要程度。GPU允許加速深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。在過去2年里,機器學(xué)習(xí)硬件蓬勃發(fā)展,尤其是針對深度神經(jīng)網(wǎng)絡(luò)的硬件。
有幾家公司正在這個領(lǐng)域努力,包括英偉達、英特爾、Nervana、Movidius、Bitmain、Cambricon、Cerebras、DeePhi、谷歌、Graphcore、Groq、華為、ARM以及Wave Computing等,他們都在開發(fā)定制的高性能微型芯片,能夠訓(xùn)練和運行深層神經(jīng)網(wǎng)絡(luò)。
關(guān)鍵是提供最低功耗和最高的可測量性能,同時計算最近有用的神經(jīng)網(wǎng)絡(luò)操作,而不是每秒鐘的原始理論操作。但是在這個領(lǐng)域很少有人了解硬件是如何真正改變機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和AI的,很少有人知道微型芯片的重要性以及如何開發(fā)它們。
培訓(xùn)或推理:許多公司都在制造能提供神經(jīng)網(wǎng)絡(luò)訓(xùn)練的微型芯片。這是為了獲得英偉達市場的一部分,它是迄今為止事實上的培訓(xùn)硬件。但這種訓(xùn)練只占深層神經(jīng)網(wǎng)絡(luò)應(yīng)用的很小部分。對于每個訓(xùn)練步驟,實際應(yīng)用程序中都有上百萬個部署。
例如,你現(xiàn)在可以在云端使用的一個目標檢測神經(jīng)網(wǎng)絡(luò),它曾經(jīng)被訓(xùn)練過一次,并且在很多圖像上都是可以使用的。但是一旦經(jīng)過訓(xùn)練,它就可以被數(shù)以百萬計的計算機用于數(shù)十億的數(shù)據(jù)。
我們在這里想說的是,訓(xùn)練硬件的重要性和你所使用的次數(shù)相比是微不足道的,而制作用于訓(xùn)練的芯片組需要額外的硬件和額外的技巧。
這將導(dǎo)致相同性能卻消耗更高的功率,因此不是當前部署的最佳狀態(tài)。訓(xùn)練硬件是很重要的,而對推理硬件進行修改卻很簡單,但它并不像許多人認為的那樣重要。
應(yīng)用程序:能夠更快、更低功率地提供培訓(xùn)的硬件在這個領(lǐng)域非常重要,因為它將允許更快地創(chuàng)建和測試新的模型和應(yīng)用程序。但真正重要的一步是應(yīng)用所需的硬件,主要是推理硬件。
今天有許多應(yīng)用之所以無法使用,主要是因為硬件而不是軟件。例如,我們的手機可以是基于語音的助手,目前是次優(yōu)的,因為它們不能一直運行。就連我們的家庭助理也離不開電源,除非我們在周圍安裝更多麥克風(fēng)或設(shè)備,否則就不能跟著我們。
但也許最大的應(yīng)用是將手機屏幕從我們的生活中移除,并將其嵌入到我們的視覺系統(tǒng)中。如果沒有超級高效的硬件,所有這些和更多的應(yīng)用將是不可能的。
贏家和輸家:在硬件方面,贏家將是那些能夠以最低功耗發(fā)揮更高性能、并能將設(shè)備迅速投入市場的公司。想象用手機代替SoC,這種情況每年都會發(fā)生?,F(xiàn)在想象下將神經(jīng)網(wǎng)絡(luò)加速器嵌入到內(nèi)存中。這可能會更快地征服市場,并快速滲透,這就是我們所說的贏家。
應(yīng)用程序
我們在上面的“目標”部分簡要地討論了應(yīng)用程序,但是我們需要詳細討論一下。AI和神經(jīng)網(wǎng)絡(luò)將如何進入我們的日常生活?這是我們的名單:
分類圖像和視頻:已經(jīng)存在于許多云服務(wù)中。下一步就是在智能攝像頭領(lǐng)域做同樣的事情,今天在這里也有許多供應(yīng)商。神經(jīng)網(wǎng)絡(luò)硬件將允許移除云并在本地處理越來越多的數(shù)據(jù),保護隱私和節(jié)省網(wǎng)絡(luò)帶寬將成為贏家。
語音助理:它們正在成為我們生活中的一部分,可以在我們的智能設(shè)備中播放音樂和控制基本設(shè)備。但是對話是一種基本的人類活動,我們常常認為它是理所當然的。
你可以對話的小型設(shè)備是一場正在發(fā)生的革命。語音助理正變得越來越好,可以更好地服務(wù)于我們。但它們?nèi)匀慌c電網(wǎng)相連,我們想要的真正助理應(yīng)該能隨時伴在我們身側(cè)。
手機怎么樣?硬件在這里再次勝出,因為它將使上述期望成為可能。Alexa、Cortana以及Siri可以始終陪伴著你。手機很快就會成為你的智能家居設(shè)備,這又是智能手機的又一次勝利。
但我們也希望它在我們的車里,并伴隨我們在城市中移動。我們需要本地處理語音,減少云端支持。更多的隱私和更少的帶寬成本。硬件有望在1-2年內(nèi)提供給我們。
烹飪機器人:下一個最大的設(shè)備將是烹飪和清潔機器人。在這里,我們可能很快就有硬件,但我們顯然缺乏軟件。我們需要轉(zhuǎn)移學(xué)習(xí)、持續(xù)學(xué)習(xí)和強化學(xué)習(xí)。
一切都像魔法那樣,因為你知道:每個食譜都是不同的,每種烹飪成分看起來都不一樣。我們不能硬編碼所有這些選項。我們真的需要一個可以學(xué)習(xí)和推廣的合成實體來做這個。
我們離它還很遠,但并非遙不可及。以目前的速度前進,可能只需要幾年就能實現(xiàn)。正如我在過去幾年所做的那樣,我感肯定這些都能實現(xiàn)。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4750瀏覽量
100443 -
AI
+關(guān)注
關(guān)注
87文章
29885瀏覽量
268173 -
智能家居
+關(guān)注
關(guān)注
1926文章
9488瀏覽量
183969 -
人工智能
+關(guān)注
關(guān)注
1791文章
46706瀏覽量
237221 -
自動駕駛
+關(guān)注
關(guān)注
782文章
13637瀏覽量
166008
原文標題:2018年以后的人工智能將如何發(fā)展?
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論