對(duì)于通常的機(jī)器學(xué)習(xí)問題來說,我們會(huì)通過給定的提前收集好的數(shù)據(jù)來解答。但對(duì)于某些任務(wù),我們需要自己去收集數(shù)據(jù)來解答問題。雖然我們可以集中收集與問題最相關(guān)的數(shù)據(jù)收集,但要確認(rèn)哪個(gè)數(shù)據(jù)源可以獲取有效的測(cè)量卻十分困難。此外,當(dāng)我們使用機(jī)器人、無人機(jī)、衛(wèi)星等收集數(shù)據(jù)時(shí),還需要考慮如何結(jié)合主體的運(yùn)動(dòng)來規(guī)劃測(cè)量問題,這個(gè)問題通常被抽象為具象自適應(yīng)感知問題。
自適應(yīng)感知在機(jī)器人領(lǐng)域有著廣泛的研究,包括快速識(shí)別污染泄露和放射源、救援搜索等任務(wù)。這些任務(wù)的關(guān)鍵在于規(guī)劃出一條感知路徑,盡可能快的得到正確的結(jié)果。為了進(jìn)一步提高這一問題的解決效率,伯克利的研究人員以放射源檢測(cè)問題為例子,利用無人機(jī)來進(jìn)行搜索。這一任務(wù)不僅要面臨各異的背景噪聲、以及建立一個(gè)符合統(tǒng)計(jì)置信區(qū)間的傳感器模型。
在這一研究中,研究者提出了一個(gè)用于自適應(yīng)感知問題的連續(xù)剔除框架AdaSearch( successive-elimination framework for general adaptive sensing problems)來解決這一問題。它可以清晰的根據(jù)放射源的發(fā)射率來建立一個(gè)置信度區(qū)間,并通過這一區(qū)間來識(shí)別并保留最具可能性的放射源,同時(shí)剔除其他點(diǎn)。
搜索與假設(shè)測(cè)試
機(jī)器人研究領(lǐng)域一般將具象搜索問題看做是連續(xù)的運(yùn)動(dòng)規(guī)劃問題,機(jī)器人必須平衡好探索環(huán)境和路徑選擇效率之間的關(guān)系。這使得軌跡優(yōu)化和探索融合到了同一目標(biāo)函數(shù)中來優(yōu)化。在這一研究中,伯克利的研究人員將這一問題通過假設(shè)檢驗(yàn)的方式轉(zhuǎn)換為了一個(gè)“序列最佳行動(dòng)識(shí)別的問題”。
通過迭代的收集數(shù)據(jù),序列假設(shè)可以從多個(gè)不同的問題中得到綜合結(jié)論。那么可以將機(jī)器人的搜索測(cè)量過程看做是N個(gè)測(cè)量行為,每個(gè)觀測(cè)都符合不同的但確定的分布。
例如在A/B測(cè)試中N=2,兩個(gè)產(chǎn)品對(duì)應(yīng)著兩個(gè)測(cè)量行為,需要解決的問題是消費(fèi)者更喜歡哪個(gè)產(chǎn)品。為了解決這個(gè)問題,我們可以不斷的追蹤A、B產(chǎn)品受喜好的均值,并不斷通過最低/最高置信度邊界來更新置信度區(qū)間。隨著測(cè)量數(shù)據(jù)的增加,我們對(duì)于產(chǎn)品的估計(jì)就會(huì)變得越來越準(zhǔn)確。當(dāng)產(chǎn)品A的上界小于產(chǎn)品B的下界時(shí),我們就可以以很高的概率得出B比A更好的結(jié)論。
在環(huán)境感知中,每個(gè)測(cè)量行為對(duì)應(yīng)著利用傳感器以特定的方向和位姿讀取數(shù)據(jù)。主體希望得知哪次測(cè)量或者哪k次測(cè)量是最有意義的觀測(cè)結(jié)果。這時(shí)候就可以通過先前的觀測(cè)結(jié)果來確定下一步要怎樣走才能獲取最多的信息。為了使用精確的統(tǒng)計(jì)語言描述搜索問題,研究人員提出了行為置信區(qū)間來描述與感知行為相關(guān)的觀測(cè)均值,這就決定了在確定目標(biāo)被確信地檢測(cè)到之前需要進(jìn)行一系列的感知行為。
放射源搜索
這一工作中,研究人員們展示了如何在一個(gè)柵格平面環(huán)境中搜索一個(gè)高強(qiáng)度的放射源。定位這個(gè)放射源的困難在于測(cè)量面臨著背景輻射的干擾。放射信號(hào)是通過四旋翼無人機(jī)上的傳感器進(jìn)行測(cè)量的。這一任務(wù)的目標(biāo)是規(guī)劃出一條測(cè)量線路,把隱藏在背景噪聲中的放射源盡可能快的找出來。下面我們就來具體看看AdaSearch是如何工作的。
AdaSearch結(jié)合了全局規(guī)劃和基于假設(shè)測(cè)試的自適應(yīng)感知規(guī)則來定義飛行軌跡。在首次測(cè)量時(shí)無人機(jī)需要對(duì)整個(gè)空間進(jìn)行如下圖所示的均勻采樣:
在第一次測(cè)量后可以通過觀測(cè)結(jié)果來剔除某些點(diǎn)。如果某個(gè)點(diǎn)置信區(qū)間估計(jì)的上界小于最大值置信區(qū)間的下界,這在很大概率上意味著它不是期望搜索的射線源,將它剔除。
接下來在剩下的點(diǎn)中進(jìn)行更為仔細(xì)的測(cè)量(飛行速度變慢),它們是放射源的可能性更高。
隨著這一過程的迭代,放射源可能的位置不斷收縮直到只剩下一個(gè)點(diǎn)。Ada算法將會(huì)返回這個(gè)點(diǎn)作為搜索結(jié)果。
由于統(tǒng)計(jì)學(xué)的置信概率保證我們可以在很高精度上確定算法返回的結(jié)果的正確性,并可以通過置信區(qū)間(例如±σ)的大小來獲得固定大小的置信度。
研究人員將這一算法與通用的自適應(yīng)搜索方法——最大化信息法和樸素搜索法做了比較,在一個(gè)64*64m柵格4m分辨率的環(huán)境對(duì)單一放射源進(jìn)行搜索下得到了下面的結(jié)果。
我們可以從上面左圖中看到自適應(yīng)方法所帶來的優(yōu)勢(shì),本文的方法耗時(shí)短且置信度更高。Ada方法在全局覆蓋的前提下保證了精度和速度。
未來,研究人員希望將這一算法應(yīng)用于更多領(lǐng)域。Ada算法在收集數(shù)據(jù)時(shí)應(yīng)對(duì)多源噪聲環(huán)境有著很好的表現(xiàn),它可以適應(yīng)不同的噪聲模型。在不同的置信區(qū)間下計(jì)算出可靠的邊界將有助于提高測(cè)量的精度與效率,更快更準(zhǔn)確地搜尋到目標(biāo)所在的位置。
-
傳感器
+關(guān)注
關(guān)注
2541文章
49963瀏覽量
747527 -
機(jī)器人
+關(guān)注
關(guān)注
210文章
27839瀏覽量
204604 -
無人機(jī)
+關(guān)注
關(guān)注
226文章
10199瀏覽量
177534
原文標(biāo)題:伯克利大學(xué)提出新感知技術(shù)AdaSearch,幫助機(jī)器人實(shí)現(xiàn)高效自適應(yīng)感知
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論