德國伯恩大學(xué)的研究人員設(shè)計了一個軟件,能夠看視頻并預(yù)測未來5分鐘會發(fā)生的事件,準(zhǔn)確率在15%到40%之間。研究人員表示,對于具有大量不同動作的長視頻,他們的方法也能夠準(zhǔn)確預(yù)測未來,甚至可以處理嘈雜或錯誤的輸入信息。
從幾百萬年前起,第一個原始人類仰望星空,對宇宙產(chǎn)生好奇開始,我們?nèi)祟悓χ茉馐澜绲睦斫夂桶芽兀呀?jīng)達(dá)到了相當(dāng)嫻熟的程度。
我們已經(jīng)可以超音速飛行,可以轉(zhuǎn)基因,還能治療癌癥。但是,有一件事情是我們一直沒有做得很好的,那就是對“時間”的感知——如何從當(dāng)下推斷未來,如何最大限度的利用這種推測?
現(xiàn)在看,機(jī)器似乎可以幫助我們做到這一點(diǎn)。
德國波恩大學(xué)的計算機(jī)科學(xué)家設(shè)計出了一種軟件,能夠預(yù)測未來5分鐘的序列事件,準(zhǔn)確率在15%到40%之間。
雖然從數(shù)值上看,這個精度并不高,但研究人員Juergen Gall表示,這代表了機(jī)器學(xué)習(xí)超越了單步預(yù)測(single-step prediction),向新的領(lǐng)域邁進(jìn)了一步。相關(guān)的研究論文已經(jīng)被CVPR 2018接收。
Juergen Gall團(tuán)隊展示他們的預(yù)測未來系統(tǒng)
超越單步預(yù)測
Gall和他同事們的研究目標(biāo)——教會計算機(jī)預(yù)測未來——并不是現(xiàn)在才有,實際上,這是機(jī)器學(xué)習(xí)和計算機(jī)視覺領(lǐng)域的一個主要課題,有大量的研究人員都在從事相關(guān)的工作。
但是,這項工作特殊的地方在于其方法:到目前為止,這些領(lǐng)域的研究集中在對當(dāng)前行動的解釋,或者對預(yù)期的下一步行動進(jìn)行預(yù)測上面,也即前面提到的“單步預(yù)測”。
單步預(yù)測,也就是預(yù)測未來往前一步的結(jié)果。這是預(yù)測未來模式的基礎(chǔ),歸結(jié)為一個回歸問題,輸入變量,預(yù)測結(jié)果。
在進(jìn)行這樣的預(yù)測時,目前的研究已經(jīng)取得了比較好的結(jié)果。其中一個例子是,斯坦福大學(xué)吳恩達(dá)團(tuán)隊設(shè)計了一種深度學(xué)習(xí)算法,在對臨終關(guān)懷的預(yù)測中,實現(xiàn)了高達(dá)90%的準(zhǔn)確性。
在他們的實驗中,斯坦福的研究人員使用了200萬份病歷對他們設(shè)計的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過這些數(shù)據(jù),網(wǎng)絡(luò)能夠發(fā)現(xiàn)醫(yī)生發(fā)現(xiàn)不了的模式和規(guī)律,并以此為基礎(chǔ),對新的病人的情況(患者在接下來3~12個月內(nèi)的死亡率)進(jìn)行預(yù)測。
這項研究面臨的變量十分復(fù)雜,而且取得了很高的精度,論文也獲得了IEEE生物信息學(xué)和生物醫(yī)學(xué)組最佳學(xué)生論文獎。但是,這樣的算法是基于過往(retrospective),而且只進(jìn)行單步預(yù)測。
多步預(yù)測:用CNN和RNN預(yù)測未來的兩種結(jié)構(gòu)
在Gall和他團(tuán)隊的最新研究中,他們提出了兩種方法,對相當(dāng)長時間的未來發(fā)生的大量行動進(jìn)行預(yù)測。他們訓(xùn)練了一個CNN和一個RNN,根據(jù)之前看過的視頻內(nèi)容,學(xué)習(xí)未來視頻的“標(biāo)簽”。
“我們表明,即使對于具有大量不同動作的長視頻,我們的方法也能夠準(zhǔn)確預(yù)測未來,甚至可以處理嘈雜或錯誤的輸入信息?!弊髡咴谡撐闹羞@樣寫道。
下面的圖例展示了研究人員設(shè)計的兩個方法。首先來看RNN的設(shè)計。
在RNN系統(tǒng)的結(jié)構(gòu)中,輸入是一個序列,網(wǎng)絡(luò)預(yù)測最近觀察到的動作的剩余長度,以及下一個動作的標(biāo)簽和長度。將預(yù)測結(jié)果附加到原始輸入,就可以預(yù)測下一個動作片段。
而在CNN系統(tǒng)的結(jié)構(gòu)中,輸入序列和輸出序列都被轉(zhuǎn)換成矩陣的形式。其中,C表示類(class)的數(shù)量,S則對應(yīng)于特定長度的視頻片段的數(shù)量。矩陣的二進(jìn)制值表示每個視頻片段的標(biāo)簽。
讓機(jī)器預(yù)測長時間的未來,有望實現(xiàn)真正的人機(jī)協(xié)作
在他們的實驗中,Gall和他的團(tuán)隊使用數(shù)小時的視頻數(shù)據(jù)來演示不同的烹飪動作(例如煎雞蛋、拌沙拉等),并僅向軟件展示其中的一部分動作。軟件根據(jù)“已經(jīng)學(xué)到的”來預(yù)測接下來的動作步驟。通過這種方法,Gall希望該領(lǐng)域能夠向真正的人機(jī)共生邁進(jìn)一步。
“[業(yè)界]人們談?wù)撊祟惡?a target="_blank">機(jī)器人協(xié)作,但最終人和機(jī)器之間仍存在分離; 他們并沒有真正密切地合作,”Gall說。
Gall建議說,通過使用適當(dāng)?shù)?a href="http://ttokpm.com/v/tag/1751/" target="_blank">硬件,這個軟件可以通過直觀地了解任務(wù)來幫助人類完成任務(wù),進(jìn)而在工業(yè)環(huán)境中幫助人類工作。
Gall說:“老年人越來越多,值得努力在家庭中推廣這種機(jī)器人來照顧老年人,”Gall說: “我相信10年后服務(wù)機(jī)器人將能夠在家照顧老年人?!?/p>
根據(jù)人口統(tǒng)計局的報告,今天65歲以上的美國人的數(shù)量約為4600萬,預(yù)計到2060年將翻一番。根據(jù)2014年美國疾病控制與預(yù)防中心(CDC)的報告,這些老年人中約140萬將生活在養(yǎng)老院。日本已經(jīng)探索過使用這樣的軟件帶來的影響。例如用于療愈的海豹型機(jī)器然PARO,軟銀的伴侶機(jī)器人Pepper等。在日本,四分之一人口是老年人。
隨著這類技術(shù)的進(jìn)步,或許會在人類代際之間造成進(jìn)一步的分化——把愛和關(guān)懷外包給一臺機(jī)器。對于一個尚未成熟的行業(yè)來說,很難說這條路將通向何方,但最終決定權(quán)掌握在開發(fā)人員手中,而不是掌握在他們開發(fā)的軟件或機(jī)器人手中。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28109瀏覽量
205861 -
計算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1694瀏覽量
45901 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315
原文標(biāo)題:機(jī)器也能感知時間,AI系統(tǒng)可預(yù)測5分鐘內(nèi)的未來!
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論