您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

從AlphaGo談直覺學習到整體知識

大?。?/span>0.06 MB 人氣: 2017-10-12 需要積分:1
 谷歌AlphaGo最近戰(zhàn)勝了歐洲頂尖職業(yè)圍棋玩家,這一壯舉被廣泛認為是人工智能AI)的重大突破,因為AlphaGo所具有的功能(圍棋的復雜度是國際象棋的指數(shù)倍)以及出現(xiàn)的時間(比預期要早出現(xiàn)許多)。它的產(chǎn)生所帶來的飛躍就像是發(fā)達肌肉和大腦,前者在計算能力上大幅增加,后者創(chuàng)新組合建立好的算法。
  
  這項突破以及它實現(xiàn)的方式可能會對未來IA帶來對立的觀點:任一當前概念框架都是最好的選擇,隨著健壯的機器變得更聰明,它們遲早會超過它們的人類制造者;或者這是一種迷惑,可能讓更健壯的機器和無助的人類陷入其中。
  AlphaGo和DeepMind的開發(fā)人員可以在這困境中指出一條整體出路嗎?
  來源分類法
  借用斯賓諾莎的話,人們可以從考慮來源知識類別開始:
  第一類是通過我們的感官(視覺,聽覺,嗅覺,觸覺)或信念(通過我們共同的“感覺”作為培育)來實現(xiàn)。這一類天生容易受環(huán)境和偏見影響。第二類是通過內(nèi)置推理,即符號表示的心理過程。其目的是普及和開放分析,但它無法保證與實際現(xiàn)實的一致性。第三類是通過哲學實現(xiàn),它本質(zhì)上將認知,直覺和符號表示結合。
  然而對于第一點不會有太多的爭議,第三類對哲學原理有廣泛的空間,從宗教到科學,集體意識形態(tài),或精神超越。隨著今天的知識橫跨智能設備,并由群眾智慧驅(qū)動,哲學似乎更關注大數(shù)據(jù)而不是它原本關注的領域。
  盡管(或者是因為)它的重點是第二類,AlphaGo和它的創(chuàng)建者的壯舉仍然可以為整個人工智能的努力帶來一些經(jīng)驗。
  表示分類法
  如前所述,IA支持范式的有效性已經(jīng)由指數(shù)形式增長的數(shù)據(jù)和處理能力支撐著。毫不奇怪,那些范式在知識來源,隱式感覺,顯式推理上與兩種基本的表示形式有關:
  基于符號表示的設計可以處理顯式信息:數(shù)據(jù)被“解釋”成信息,然后當做知識使用,用來主導行為?;?a href='http://ttokpm.com/tags/神經(jīng)網(wǎng)絡/' target='_blank' class='arckwlink_none'>神經(jīng)網(wǎng)絡的設計具有處理隱式信息的特征:數(shù)據(jù)被“編譯”成神經(jīng)元連接,他們的權重(可以理解為知識)根據(jù)行為反饋迭代地進行調(diào)整。
  由于該二元性反映了人類的認知能力,建立在這些設計上的聰明機器是為了將合理性與有效性結合:
  符號表示支持兩端的透明性和方式的溯源性,可以對目的性,實際性或社會性進行分類。神經(jīng)網(wǎng)絡,在它們學習內(nèi)核的幫助下,可以直接在數(shù)據(jù)上操作,加快了具體目標的實現(xiàn),這基于支持知識,這些知識隱式地以加權連接呈現(xiàn)。
  這種方法的潛能已經(jīng)由基于互聯(lián)網(wǎng)的語言處理展現(xiàn)了:實際的關聯(lián)分析“觀察”了數(shù)以億計的話語,它們正在逐步補充甚至取代基于Web解析器的語法語義規(guī)則。
  在這一點上,AlphaGo有它的野心,因為它只處理非符號的輸入,即圍棋高手玩家落子的集合(共約3千萬)。但是,這個限制也可以成為一個優(yōu)勢,因為它帶來了同質(zhì)性和透明性,使得算法有了更高效的組合:健壯的組合用來進行實際行動,使用最好玩家的直覺知識,聰明的組合用來進行推斷行動、計劃和策略。
  教它們?nèi)绾螀f(xié)同工作,可以說是這項突破的關鍵因素。
  學習分類法
  對于智能機器,應該可以預料到,它們驕人的成就完全取決于它們的學習能力。而這些能力通常分別運用到隱式(或是非符號)和顯式(或是符號)內(nèi)容上,讓它們在同一個認知引擎的管控之下,就如人腦通常那樣,這也成為IA的長期首要目標。
  實際上,這已經(jīng)由神經(jīng)網(wǎng)絡實現(xiàn)了,它將監(jiān)督式和非監(jiān)督式學習結合:人類專家?guī)椭到y(tǒng)去其糟粕,然后通過系統(tǒng)自己百萬次的訓練來提高它們的專長。
  然而,領先的AI玩家的成就已經(jīng)揭露出了這些解決方案的局限性,即扮演最好人類玩家并打敗他們性質(zhì)上的差距。而前者的結果可以通過似然決策得出,后者需要原始方案的開發(fā),這就帶來了定量和定性的障礙:
  與實際動作相反,可能的動作沒有限制,因此在搜索樹中以指數(shù)形式增長。原始計劃根據(jù)估值和策略制定。
  通過單個方案克服這兩個挑戰(zhàn),可以說是DeepMind工程師的關鍵成就。
  掌握搜索樹的廣度和深度
  使用神經(jīng)網(wǎng)絡對實際狀態(tài)評估以及來自于搜索樹中以指數(shù)形式增長的廣度和深度的策略采樣。然而蒙特卡洛樹搜索(MCTS)算法可以用來解決這個問題,用有限的能力擴大處理性能仍然只能處理樹較淺的部分;直到DeepMind的工程師將MCTS運用到分層的估值和策略網(wǎng)絡上,成功解除了深度的障礙。
  AlphaGo無縫使用了分層的網(wǎng)絡(即深度卷積神經(jīng)網(wǎng)絡)進行直覺學習,強化,評估和策略,圍棋的棋盤和規(guī)則(與國際象棋一樣,無差異性移動和搜索陷阱)的同質(zhì)性使之成為可能。
  從直覺到知識
  人類是唯一能夠?qū)⒅庇X(隱式的)和符號(顯式的)知識結合起來的物種,人類具有這樣的雙重能力,將前者轉(zhuǎn)換成后者,然后通過后者的反饋反過來改善前者。
  用在機器學習方面的話需要監(jiān)督式和非監(jiān)督式學習的連續(xù)性,這應該可以通過神經(jīng)網(wǎng)絡達到,這種神經(jīng)網(wǎng)絡可以用來符號表示和處理原始數(shù)據(jù):
  從顯式到隱式:為特定情境和目的建立的符號描述將被輸入到神經(jīng)網(wǎng)絡之中,在目標環(huán)境的數(shù)據(jù)上進行測試和改善。從隱式到顯式:一旦通過百萬次在相關目標上運行對設計進行了測試和強化,將有可能對結果重新設計,用來改善符號描述。
  然而深度符號知識的非監(jiān)督式學習超出了智能機器的范圍,顯著的結果可以在“平坦”的語義環(huán)境下得到,比如,如果同一個語義可以用來評估網(wǎng)絡狀態(tài)和策略:
  在百萬次落子中由人類專家觀察到的直覺部分的監(jiān)督式學習。自我對弈中的非監(jiān)督式強化學習。使用蒙特卡洛樹搜索(MCTS)構建,評估和完善自我策略的規(guī)劃和決策。
  沒有圍棋整體性的性質(zhì),將不可能有這種深度和無縫的集成。
  美學評估和整體知識
  圍棋的特異性是雙重的,定量側(cè)的復雜性,定性側(cè)的簡單性,前者是后者的代價。
  與國際象棋相比,圍棋的實際位置和潛在落子方式只能由整個棋盤進行評估,它使用了一個最具美學的標準,不會簡化成任意度量和手工制作的專家規(guī)則。玩家不會在詳細分析當前位置和評估可供選擇方案后再落子,而是根據(jù)他們的對棋盤的直覺。
  因此,AlphaGo的行為會完全按照上面所說的第二層次的知識進行:
  作為游戲玩家,它可以從實際現(xiàn)實考慮中分離。作為圍棋玩家,不需要解決任何語義復雜性。
  給予足夠的計算能力,DeepMind工程師的主要挑戰(zhàn)是教AlphaGo將它的美學直覺轉(zhuǎn)換成整體知識,而不需要定義它們的實質(zhì)。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?