人類(lèi)正在慢慢接近世界的本質(zhì)——物質(zhì)只是承載信息模式的載體。人腦之外的器官都只是保障這一使命的給養(yǎng)艦隊(duì)。
自從去年 AlphaGo 完虐李世乭,深度學(xué)習(xí)火了。但似乎沒(méi)人說(shuō)得清它的原理,只是把它當(dāng)作一個(gè)黑箱來(lái)使。有人說(shuō),深度學(xué)習(xí)就是一個(gè)非線性分類(lèi)器?有人說(shuō),深度學(xué)習(xí)是對(duì)人腦的模擬……但我覺(jué)得都沒(méi)有捅透那層窗戶(hù)紙。
當(dāng)讀完 Jeff Hawkins 的《論智能》,「就是它了!」。而我驚奇地發(fā)現(xiàn),原書(shū)竟是 2004 年出版的!我怕自己讀了本假書(shū),或是某個(gè)美國(guó)民科的著作,特意到豆瓣、知乎上查了下,發(fā)現(xiàn)幾乎每個(gè)看過(guò)這本書(shū)的人都對(duì)其理論嘖嘖稱(chēng)贊。但奇怪的是,似乎沒(méi)人肯替它站臺(tái),這套理論的影響止步于此,好像大家都在刻意掩飾自己看過(guò)這本秘笈。它明明已經(jīng)完整解釋了人腦智能的運(yùn)作機(jī)制了啊!注意是 Real Intelligence ,而不僅僅是 Artificial Intelligence ?。?!
三個(gè)洞見(jiàn)
比起絕大多數(shù)腦科學(xué)論文,作者的洞見(jiàn)簡(jiǎn)單得多,也深刻得多:
長(zhǎng)久以來(lái),由于我們沒(méi)有能力從內(nèi)部去觀察思維,所以人們總是把「智能」等同為「表現(xiàn)出智能的行為」。但當(dāng)我們看書(shū)時(shí),在外人看來(lái)并沒(méi)有任何變化,而我們自己知道,這期間產(chǎn)生了無(wú)數(shù)的聯(lián)想、頓悟、回憶。所以,「理解」是無(wú)法通過(guò)外部行為來(lái)測(cè)量的,它是一個(gè)內(nèi)在度量的指標(biāo)。
從草履蟲(chóng)到人類(lèi),大自然會(huì)為每一種生物分別設(shè)計(jì)一套智能機(jī)制,還是沿用一套機(jī)制,亦或是從某一代開(kāi)始出現(xiàn)某種全新的智能機(jī)制,并沿用至今(那么,最先產(chǎn)生這套智能機(jī)制的又是什么物種呢?)?我們所說(shuō)的智能,是人類(lèi)所獨(dú)有,還是生物的普遍特征(只是多寡之別)?而作者相信,智能不可能是上帝專(zhuān)為人類(lèi)而設(shè)計(jì)的,它一定來(lái)自大自然的某種慣用伎倆。
大腦皮層,不管是結(jié)構(gòu)上還是功能上,都有著相同的構(gòu)造/機(jī)理(嚴(yán)格來(lái)說(shuō),這不算作者的洞見(jiàn),而是早在 1978 年由 Vernon Mountcastle 發(fā)現(xiàn)的)。
由這三個(gè)洞見(jiàn)出發(fā),自然而然地導(dǎo)向了以下疑問(wèn):
如果智能不是由行為定義的,那該如何定義它?
向前看,智能是如何演化而來(lái)的?
向內(nèi)看,大腦皮層的結(jié)構(gòu)是如何捕捉這個(gè)世界的結(jié)構(gòu)的?
簡(jiǎn)單地說(shuō),作者的結(jié)論是:
智能并沒(méi)有人們想象的那么玄乎,它不過(guò)是一種「預(yù)測(cè)未來(lái)的能力」罷了。
這些預(yù)測(cè)的實(shí)質(zhì),不過(guò)是「生物的應(yīng)激性」在「生物自平衡機(jī)制」&「環(huán)境壓力」下產(chǎn)生的副產(chǎn)品。
智能的核心是某種「穩(wěn)定不變的東西」。而這得益于大腦皮層同質(zhì)的層級(jí)結(jié)構(gòu)。
下面,我們就來(lái)看看作者是怎么從那三個(gè)簡(jiǎn)單的洞見(jiàn)一步步推測(cè)出智能的本質(zhì)的。
生命的秋千
小到人體,大到經(jīng)濟(jì)系統(tǒng),復(fù)雜系統(tǒng)內(nèi)都有著一種消減沖擊、使系統(tǒng)回歸穩(wěn)態(tài)的類(lèi)似機(jī)制。血糖濃度低了,胰高血糖素分泌會(huì)增加,拉高血糖;而血糖高了,胰島素分泌會(huì)增加,拉低血糖。通過(guò)調(diào)節(jié)這對(duì)激素,系統(tǒng)竭力讓血糖維持在某一范圍內(nèi)。這種自穩(wěn)態(tài)機(jī)制出現(xiàn)在生命的各個(gè)角落,保持著生命的自我平衡。
這就像一只「看不見(jiàn)的手」,總是想推開(kāi)擠壓,同時(shí)把「逃兵」抓回來(lái)。這只「看不見(jiàn)的手」在我們大腦中編織了無(wú)數(shù)「正確的位置」(用腦科學(xué)家的黑話說(shuō)就是「恒定表征」)。一旦偏離,我們就開(kāi)始警覺(jué)起來(lái),并調(diào)動(dòng)多個(gè)系統(tǒng)聯(lián)合應(yīng)對(duì)。舉個(gè)書(shū)中的例子,一個(gè)球飛過(guò)來(lái),我們并不是去計(jì)算它的彈道、落點(diǎn),而是指揮肢體相應(yīng)調(diào)整,直到抓住來(lái)球。這套調(diào)整算法就是「預(yù)測(cè)」。從這個(gè)事例看,人們?cè)诮忧蜻@件事上表現(xiàn)出的智能,和草履蟲(chóng)向著食物劃動(dòng)所展現(xiàn)的應(yīng)激性,又有什么本質(zhì)的分別呢?
為什么說(shuō)「預(yù)測(cè)」是智能的基礎(chǔ)?
平常,人們理解的「預(yù)測(cè)」步子邁得太大了,就好比從一發(fā)球就要精準(zhǔn)地算出其落點(diǎn),而人腦的「預(yù)測(cè)」更像是「應(yīng)激」,球動(dòng)我動(dòng),一點(diǎn)點(diǎn)微調(diào)?,F(xiàn)代社會(huì)發(fā)展得太快,讓我們看不清概念的歷史面貌,因而更容易被表象的迷霧困惑。當(dāng)我們走回歷史的起點(diǎn),迷霧自然散去。智能,于我們最大的益處是什么?并非創(chuàng)造什么,而是生存下去。人類(lèi)無(wú)時(shí)無(wú)刻不在「生存」還是「發(fā)展」之間糾結(jié)。但很少有人看到:發(fā)展,不過(guò)是為了應(yīng)對(duì)未知的生存挑戰(zhàn)。
我們應(yīng)該怎么去定義智能呢?也許演化的歷史能告訴我們更多。智能,是幫助人類(lèi)生存下去的一種能力:是讓我們可以在溪流中叉到游動(dòng)的魚(yú)兒的能力,是讓我們可以只靠一幅模糊的圖像就判斷出是朋友還是猛獸……我們應(yīng)該去研究那些「如何保持平衡」之類(lèi)的問(wèn)題,而不是什么彈道求解問(wèn)題,那不是大自然的進(jìn)化目標(biāo),自然也得不到什么大腦的機(jī)制。
所有生存問(wèn)題都可以歸結(jié)為一個(gè)元問(wèn)題:如何識(shí)別出這個(gè)問(wèn)題中的那些個(gè)恒定不變的東西。比如:溪流中的魚(yú)、回家的方向……如果說(shuō)智能中還存在別的成分,比如:想象、創(chuàng)造工具、解決問(wèn)題,都可以規(guī)約到某種抽象手段上。歸根結(jié)底,人類(lèi)解決一切問(wèn)題的方法只有一個(gè)——運(yùn)用抽象,在更高維度上調(diào)和矛盾。
一切繞不開(kāi)「恒定表征」(invariant representations)。
抽象的本質(zhì)
就如同人們?cè)谡J(rèn)可了「負(fù)數(shù)」這一概念之后,終于能將「加法」&「減法」這兩種表象上完全不同(一個(gè)增加,一個(gè)減少)的運(yùn)算,統(tǒng)一為「整數(shù)域上的加法」。從更高的維度調(diào)和矛盾,這正是大腦皮層的構(gòu)造方式,也是其工作原理。不斷在現(xiàn)象中找到共同點(diǎn),提取出來(lái),取個(gè)名字;這些名字又成為了上一層抽象的基石(或者叫「詞匯」)。這樣一層一層,直至得到那個(gè)智能的圣杯——恒定表征。
舉個(gè)例子,我們是如何識(shí)別邊緣的呢?
我們先來(lái)考察一小塊 3×3 的視網(wǎng)膜,分別標(biāo)記為 #1~#9 (如下圖所示)。當(dāng)一條豎線出現(xiàn)時(shí)(#1, #4, #7 均被激活),電信號(hào)傳遞到第二層。第二層的每一個(gè)神經(jīng)元,分別響應(yīng)視網(wǎng)膜上一組細(xì)胞被激活的情況。比如:第二層最左邊的那片神經(jīng)元,響應(yīng)的是單個(gè)視網(wǎng)膜細(xì)胞被激活的情況。再比如:第二層左二那片神經(jīng)元,響應(yīng)的是任意兩個(gè)視網(wǎng)膜細(xì)胞被激活的情況。以此類(lèi)推……
邊緣識(shí)別:最下層是視網(wǎng)膜細(xì)胞;當(dāng)某個(gè)視網(wǎng)膜細(xì)胞組合被激活后,會(huì)激活其上一層的相應(yīng)神經(jīng)元;而上一層神經(jīng)元的某個(gè)組合被激活后,又會(huì)鏈?zhǔn)降丶せ罡弦粚拥纳窠?jīng)元如果我們把時(shí)間的因素考慮進(jìn)去,假設(shè)信號(hào)并不會(huì)馬上消失,而是隨著時(shí)間衰減,那么只要時(shí)間夠短,輸入 (#1, #4, #7)、(#2, #5, #8)、(#3, #6, #9) 這三組刺激,就會(huì)在第三層激活某個(gè)神經(jīng)元,代表「發(fā)現(xiàn)一條豎線」。
看,其實(shí)每一個(gè)神經(jīng)元都是一個(gè)「單詞」(或是「概念」/「抽象」/「特征」)。只不過(guò)低層神經(jīng)元描述的「單詞」抽象程度更低。比如:第二層那個(gè) #(1, 4, 7) 神經(jīng)元代表的是「在視網(wǎng)膜的最左邊出現(xiàn)一條豎線」,而其上層那個(gè)則沒(méi)有「在視網(wǎng)膜的最左邊」這一約束。
記憶的角色
神經(jīng)元可以在 5 毫秒內(nèi)完成信息的收集-整合-輸出,相當(dāng)于運(yùn)算速度為每秒 200 次。人類(lèi)可以在半秒內(nèi)(相當(dāng)于 100 步)識(shí)別圖像、作出選擇…… 100 步,機(jī)器可做不到。在人類(lèi)已知的算法里面,也許只有「打表」(把答案事先存儲(chǔ)在記憶中,用時(shí)并不作計(jì)算,而只是提取)可以做到。所以,整個(gè)大腦皮層就是一個(gè)記憶系統(tǒng),而非什么計(jì)算機(jī)。
深度學(xué)習(xí)做對(duì)了什么?
多層網(wǎng)絡(luò),提供了逐層抽象的通道。如今,圖像識(shí)別系統(tǒng)正是這么做的:底層識(shí)別邊緣,而后識(shí)別特定形狀,再高層識(shí)別某種特征……
卷積,提供了獲得「恒定表征」的手段。
還有什么我們不知道?
當(dāng)我們想要提取某段記憶時(shí),往往只需要只言片語(yǔ)就行了。也就是說(shuō),記憶似乎是以一種全息的形式存儲(chǔ)的。任何片段都包含了全部。
還有,我們依然不知道大腦是怎么在 100 步內(nèi)完成決策的。我們也不知道為什么會(huì)有那么多反饋連接?軸突 v.s. 樹(shù)突在功能上有什么分別?……
現(xiàn)在讓我們回過(guò)頭來(lái)看作者的三個(gè)洞見(jiàn),用黑話再講一遍就是:
理解,是對(duì)「大腦如何形成記憶,并利用這些記憶作出預(yù)測(cè)」的一個(gè)內(nèi)部度量。
預(yù)測(cè),是某種自我調(diào)節(jié)機(jī)制的副產(chǎn)品。
大腦皮層在外表 & 結(jié)構(gòu)上存在著驚人的同質(zhì)性。也就是說(shuō),大腦皮層使用相同的計(jì)算方式來(lái)完成它的一切功能。人類(lèi)展現(xiàn)出來(lái)的所有智能(視覺(jué)、聽(tīng)覺(jué)、肢體運(yùn)動(dòng)……)都是基于一套統(tǒng)一的算法
-
智能
+關(guān)注
關(guān)注
8文章
1700瀏覽量
117365 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120890 -
邊緣
+關(guān)注
關(guān)注
0文章
25瀏覽量
1999
原文標(biāo)題:為什么大家都不戳破深度學(xué)習(xí)的本質(zhì)?!
文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論