回想在校期間,很多同學(xué)會(huì)在課間休息時(shí)從書桌里掏出魔方或嫻熟或略顯笨拙地轉(zhuǎn)動(dòng)起來,甚至上課時(shí)有些同學(xué)也會(huì)悄悄地在桌下轉(zhuǎn)動(dòng)手中的魔方?,F(xiàn)在,“人工智能” 也對這款益智玩具產(chǎn)生了興趣,期待用更加智能的方式實(shí)現(xiàn)魔方的復(fù)原。
近日,諾丁漢大學(xué)(University of Nottingham)副教授 Colin G. Johnson 帶領(lǐng)的研究小組開發(fā)出一種深度學(xué)習(xí)技術(shù),可以從一套樣本解決方案中學(xué)習(xí) “適應(yīng)度函數(shù)” 并用它來解決魔方復(fù)原問題。該研究相關(guān)論文于 2 月 24 日發(fā)表在 Expert Systems 上,題目為《用逐級深度學(xué)習(xí)方法解決魔方問題》(Solving the Rubik's cube with stepwise deep learning)。
將打亂的魔方復(fù)原是一個(gè)相對復(fù)雜的問題,但研究人員決定將這一復(fù)雜的問題轉(zhuǎn)換為多個(gè)簡單的問題來解決,他們認(rèn)為 “解決任何難題最多需要 20 步”。因此,他們將逐級學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)作為本次設(shè)計(jì)方案的兩種主要方法。對應(yīng)到魔方復(fù)原中,該技術(shù)會(huì)一步步地去嘗試解決,而不是一次性學(xué)習(xí)復(fù)原魔方的整體方案。
換句話說,就是這種技術(shù)會(huì)通過嘗試轉(zhuǎn)動(dòng)一個(gè)部件使魔方呈現(xiàn)更簡單的形態(tài),也就是把一個(gè)復(fù)雜的問題拆解成若干個(gè)相對簡單的小問題,先學(xué)習(xí)解決一個(gè)小問題的方案,然后經(jīng)過對這一步驟的數(shù)次重復(fù),最終達(dá)到魔方復(fù)原的效果。其實(shí),該種方案也意味著,整體解決方案的每一步都要比上一步更加容易。
該技術(shù)會(huì) “反其道而行之”,從魔方一步步打亂的過程中學(xué)習(xí)怎樣將混亂的魔方復(fù)原。具體操作起來就是,將拼好的魔方標(biāo)記為 “0”,進(jìn)行一次旋轉(zhuǎn)后的魔方標(biāo)記為 “1”,再旋轉(zhuǎn)一次后標(biāo)記為 “2”…… 以此類推。每個(gè)狀態(tài)都與一個(gè)數(shù)字配對,該數(shù)字代表該狀態(tài)下距離目標(biāo)的步數(shù)。因此,學(xué)習(xí)的過程也是建立模型的過程,最終實(shí)現(xiàn)從數(shù)據(jù)庫中抽取任意一個(gè)狀態(tài),預(yù)測將需要多少步才能到達(dá)目標(biāo)狀態(tài),該步驟就與其被標(biāo)記的數(shù)字相對應(yīng)。
圖|計(jì)算機(jī)學(xué)習(xí)魔方復(fù)原的數(shù)據(jù)(來源:Expert Systems)
然后,用特定的深度學(xué)習(xí)網(wǎng)絡(luò)構(gòu)建魔方復(fù)原培訓(xùn)集,并在其中搜索出當(dāng)下的混亂狀態(tài)和已經(jīng)解決后的狀態(tài)。
接下來,通過模擬數(shù)千次轉(zhuǎn)動(dòng)來估算魔方的混亂程度。完成了魔方的混亂程度估計(jì)之后,Johnson 開發(fā)的技術(shù)將通過深度神經(jīng)網(wǎng)絡(luò)的方式識(shí)別魔方復(fù)原前的一步,接下來是復(fù)原前的第二步、第三步…… 把這些數(shù)據(jù)積累起來再去解決魔方的復(fù)原問題將會(huì)非常容易,最終可以通過這些準(zhǔn)備工作找出把混亂魔方復(fù)原的路徑。
Johnson 解釋道:"與其嘗試學(xué)習(xí)如何解決將整個(gè)魔方復(fù)原,不如學(xué)習(xí)怎樣把復(fù)原魔方這一較為復(fù)雜的問題轉(zhuǎn)換為更容易的問題,然后使用更簡單的方法來解決它。"
圖|深度學(xué)習(xí)框架解決魔方問題的步驟(來源:Expert Systems)
目前,Johnson 僅將該方案用于魔方的復(fù)原,但他也表示,這只是一個(gè)示例,其實(shí)該技術(shù)也可用于解決一些更加復(fù)雜的問題?!氨热缦袈暀C(jī)、早期唱片中舊錄音的噪音?!?具體而言是,如果他設(shè)計(jì)的技術(shù)能學(xué)到一個(gè) “原始的聲音”、一個(gè)比 “原始的聲音” 多一點(diǎn)噪音的聲音以及一個(gè)比 “原始的聲音” 多一點(diǎn)再多一點(diǎn)的聲音…… 那么最終將通過這種循序漸進(jìn)的方式還原最 “純凈的聲音”。
Johnson 表示,相比其他方式,他設(shè)計(jì)的這種逐級學(xué)習(xí)更加有效,也更能凸顯分步處理的優(yōu)勢。不過,他也表示,該種訓(xùn)練框架將需要比傳統(tǒng)方案更多的對特定領(lǐng)域的知識(shí)。以本文為例,訓(xùn)練解決魔方的框架就需要復(fù)原魔方的能力。
未來該技術(shù)將可能用于解決科學(xué)工程的很多其他問題,如用來學(xué)習(xí)和更好地理解蛋白質(zhì)在細(xì)胞內(nèi)折疊的方式,從蛋白質(zhì)呈現(xiàn)的三維結(jié)構(gòu)點(diǎn)序列可以倒推其是怎樣折疊成最終形態(tài)的。
原文標(biāo)題:復(fù)原混亂的魔方需要幾步?諾丁漢大學(xué)團(tuán)隊(duì)用深度學(xué)習(xí)告訴你
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
人工智能
+關(guān)注
關(guān)注
1791文章
46671瀏覽量
237121 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5466瀏覽量
120892
原文標(biāo)題:復(fù)原混亂的魔方需要幾步?諾丁漢大學(xué)團(tuán)隊(duì)用深度學(xué)習(xí)告訴你
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論