0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI和VR在機(jī)器人控制的實(shí)在應(yīng)用匯總

h1654155972.5709 ? 2018-06-03 10:20 ? 次閱讀

復(fù)雜機(jī)器人的運(yùn)動(dòng)控制,一直阻擋機(jī)器人產(chǎn)業(yè)發(fā)展的老大難問題,遲遲沒有得到很好的解決。即便是代表機(jī)器人最高水平的波士頓動(dòng)力,其機(jī)器人離實(shí)用也還遠(yuǎn)。近兩年發(fā)展迅猛的AI,儼然如萬金油般,被用在各種地方,自然也包括機(jī)器人控制領(lǐng)域,而且似乎取得了不錯(cuò)的效果。前端時(shí)間,UCberkely的強(qiáng)化學(xué)習(xí)專家Pieter Abbeel創(chuàng)辦了Embodied Intelligence,業(yè)務(wù)更是直接涵蓋了VR、AI、機(jī)器人三大熱點(diǎn)。

為了搞清楚VR、AI等新技術(shù)如何在機(jī)器人控制領(lǐng)域應(yīng)用,本文根據(jù)一些相關(guān)論文和公開資料,包括Pieter Abbeel的演講,對VR和AI在機(jī)器人控制方面的應(yīng)用進(jìn)行了簡單梳理,發(fā)現(xiàn)AI和VR等在機(jī)器人控制等方面還是有實(shí)在的應(yīng)用,只不過離取得實(shí)質(zhì)性突破,還有相當(dāng)長的距離。

機(jī)器人控制的幾種類型

很多機(jī)器人的研究目標(biāo)很多是模擬人的智能,所以研究人的控制系統(tǒng),對于機(jī)器人有很大的借鑒意義。人體的神經(jīng)系統(tǒng)由大腦、小腦、腦干、脊髓、神經(jīng)元等共同構(gòu)成,復(fù)雜而又完善。人體神經(jīng)系統(tǒng)包括中樞神經(jīng)系統(tǒng)和周圍神經(jīng)系統(tǒng)。中樞神經(jīng)系統(tǒng)由腦和脊髓組成,是人體神經(jīng)系統(tǒng)的最主體部分。周圍神經(jīng)系統(tǒng)是從腦和脊髓發(fā)出的分布到全身各處的神經(jīng)。無數(shù)的神經(jīng)元存在于神經(jīng)系統(tǒng)各處,構(gòu)成神經(jīng)網(wǎng)絡(luò)。

中樞神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)運(yùn)動(dòng)控制,主要分成三層:

大腦:居于最高層,負(fù)責(zé)運(yùn)動(dòng)的總體策劃,各種任務(wù)的下達(dá)。

小腦:居于中間層,負(fù)責(zé)運(yùn)動(dòng)的協(xié)調(diào)組織和實(shí)施。人體平衡由小腦控制。

腦干和脊髓:屬于最低層,負(fù)責(zé)運(yùn)動(dòng)的執(zhí)行,具體控制肌肉的骨骼的運(yùn)動(dòng),由腦干和脊髓完成。

三層對運(yùn)動(dòng)的調(diào)控作用不同,由高到低,低層接收高層的下行控制指令并具體實(shí)現(xiàn)。大腦可直接也可間接的通過腦干控制脊髓運(yùn)動(dòng)神經(jīng)。

如果把機(jī)器人與人進(jìn)行類比,機(jī)械控制器就類似于人的脊髓,負(fù)責(zé)控制電機(jī)(肌肉)和機(jī)械機(jī)構(gòu)(骨骼)的具體運(yùn)動(dòng),多足機(jī)器人的運(yùn)動(dòng)控制器,就類似于人的小腦,負(fù)責(zé)控制平衡和協(xié)調(diào)。而機(jī)器人的操作系統(tǒng)層,則類似于人的大腦,感知和認(rèn)知世界,并下達(dá)各種復(fù)雜的運(yùn)動(dòng)目標(biāo)。

基于以上類比,參照目前的各類機(jī)器人的情況,機(jī)器人的運(yùn)動(dòng)控制大概可以分成4種任務(wù):

脊髓控制——機(jī)械臂運(yùn)動(dòng)的基礎(chǔ)控制。工業(yè)機(jī)器人,各類機(jī)械臂,無人機(jī)的底層運(yùn)動(dòng)控制等面臨的主要是這類問題。

小腦控制——多足機(jī)器人的平衡和運(yùn)動(dòng)協(xié)調(diào)控制。這塊目前是機(jī)器人控制仍未突破的難點(diǎn),目前做的最好的顯然是波士頓動(dòng)力。

大腦控制——環(huán)境的感知。主要是掃地機(jī)器人、無人機(jī)等底層運(yùn)動(dòng)控制已經(jīng)封裝好的機(jī)器人的導(dǎo)航和路徑規(guī)劃。需要通過環(huán)境感知,對自身和目標(biāo)進(jìn)行定位、導(dǎo)航和運(yùn)動(dòng)規(guī)劃。

大腦控制——環(huán)境的認(rèn)知和交互,也就是機(jī)器人具體執(zhí)行交互任務(wù),如控制機(jī)械臂抓取物體,執(zhí)行操作等。這是服務(wù)機(jī)器人需要突破的重要問題。

幾種具體控制的AI應(yīng)用情況

1.脊髓控制類

脊髓控制的兩種典型的應(yīng)用是機(jī)械臂路徑規(guī)劃和無人機(jī)的飛行控制。這類問題屬于傳統(tǒng)自動(dòng)控制理論,以數(shù)學(xué)和動(dòng)力學(xué)建模為基礎(chǔ),發(fā)展了很多年,已經(jīng)有了非常完備的理論和實(shí)踐基礎(chǔ),也取得了很好的效果。雖然深度學(xué)習(xí)在最近很熱,理論上也可以用于這類控制。但目前在這類基礎(chǔ)控制領(lǐng)域,并沒有應(yīng)用。主要原因可能有:

1)工業(yè)機(jī)器人高精度重復(fù)特定動(dòng)作等,基于自動(dòng)控制理論已經(jīng)能從數(shù)學(xué)上很好的解決,且由于了解原理,屬于白盒系統(tǒng)。既然有可靠的白盒方案,沒必要換成黑盒的神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)。

2)工業(yè)機(jī)器人等應(yīng)用領(lǐng)域,對控制算法穩(wěn)定性要求很高。而作為黑盒方案的神經(jīng)網(wǎng)絡(luò)控制系統(tǒng),數(shù)據(jù)上還無法證明其穩(wěn)定性。神經(jīng)網(wǎng)絡(luò)控制器一旦發(fā)生問題,難以進(jìn)行解釋和改進(jìn)。

3)神經(jīng)網(wǎng)絡(luò)算法基于大量數(shù)據(jù)訓(xùn)練,而現(xiàn)有的運(yùn)動(dòng)控制中,比如飛控,拿到實(shí)際實(shí)驗(yàn)數(shù)據(jù)的成本高,大量數(shù)據(jù)的獲取非常困難。

2.小腦控制類

小腦控制典型問題是類人型雙足和多足機(jī)器人的平衡和運(yùn)動(dòng)協(xié)調(diào)控制問題。這方面一直是基于傳統(tǒng)控制理論在進(jìn)行研究,不過由于相比于機(jī)械臂或無人機(jī),其運(yùn)動(dòng)的自由度高很多,難度很大。雙足類人機(jī)器人給人大多數(shù)的印象還是運(yùn)動(dòng)遲緩、僵硬、站不穩(wěn)。波士頓動(dòng)力的Altas、大狗等已經(jīng)是在這方面最先進(jìn)的,波士頓動(dòng)力學(xué)公司并未公布他們使用的技術(shù),但谷歌工程師Eric Jang表示,根據(jù)從演講得來的信息,BD的機(jī)器人控制策略使用基于模型的控制器,并不涉及神經(jīng)網(wǎng)絡(luò)相關(guān)算法。

3.環(huán)境感知類

主要的場景是服務(wù)機(jī)器人的路徑規(guī)劃、無人機(jī)目標(biāo)追蹤、工業(yè)機(jī)器人的視覺定位等,通過感知環(huán)境,給封裝好的運(yùn)動(dòng)控制系統(tǒng)下達(dá)目標(biāo)運(yùn)動(dòng)指令。

目標(biāo)識別

環(huán)境感知過程中的目標(biāo)識別,如無人機(jī)目標(biāo)的識別和追蹤等,有神經(jīng)網(wǎng)絡(luò)的幫助,可以識別的更準(zhǔn)確,已經(jīng)在大疆等無人機(jī)上應(yīng)用。

定位導(dǎo)航和路徑規(guī)劃

目前機(jī)器人的定位導(dǎo)航,主要基于流行的vSLAM或激光雷達(dá)SLAM技術(shù)。主流的激光雷達(dá)方案大概可以分三步,中間部分環(huán)節(jié)可能涉及到一些深度學(xué)習(xí),大部分內(nèi)容并不涉及深度學(xué)習(xí)相關(guān)。

第一步:SLAM,構(gòu)建場景地圖,用激光雷達(dá)構(gòu)建場景的2D或3D點(diǎn)云,或者重建出3D場景。

第二步:構(gòu)建語義地圖,可能會(huì)對物體進(jìn)行識別和分割,對場景中的物體進(jìn)行標(biāo)記。(有的可能略過這一步)

第三步:基于算法進(jìn)行路徑規(guī)劃,并驅(qū)動(dòng)機(jī)器人的運(yùn)動(dòng)。

4.環(huán)境交互

典型應(yīng)用場景:機(jī)械臂抓取目標(biāo)物體等。與環(huán)境的交互,一直是傳統(tǒng)自動(dòng)控制難以解決的問題。近年來,以強(qiáng)化學(xué)習(xí)為基礎(chǔ),AI相關(guān)技術(shù)用在了這類問題上,取得了一定的研究進(jìn)展,但是否是未來的主流方向,仍存在很大爭議。

1)強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)框架中,有一個(gè)包含神經(jīng)網(wǎng)絡(luò)的Agent負(fù)責(zé)決策。Agent以當(dāng)前機(jī)器人傳感器所采集到的環(huán)境為輸入,輸出控制機(jī)器人的行動(dòng)命令action,機(jī)器人行動(dòng)后,再觀察新的環(huán)境狀態(tài)和行動(dòng)帶來的結(jié)果Reward,決定下一步新的行動(dòng)action。Reward根據(jù)控制目標(biāo)進(jìn)行設(shè)置,并有正反向之分。例如,如果以自動(dòng)駕駛為目標(biāo),正向的Reward的就是到達(dá)目的地,反向就是不能達(dá)到目的地,更不好的Reward就是出車禍。然后重復(fù)這個(gè)過程,目標(biāo)是最大化Reward。

強(qiáng)化學(xué)習(xí)的控制過程,本來就是個(gè)正向反饋的控制過程,是AI用于機(jī)器人控制的基礎(chǔ)。以此為基礎(chǔ),強(qiáng)化學(xué)習(xí)在機(jī)器人控制方面出現(xiàn)了一些研究成果。

2)環(huán)境中尋找目標(biāo)

16年,李飛飛組放出了一篇論文,基于深度強(qiáng)化學(xué)習(xí),在以目標(biāo)圖像為輸入的情況下,不建圖去找東西。大致思路是:根據(jù)機(jī)器看到的圖,決定怎么走,然后再看圖,再?zèng)Q定新走的一步,直到找到東西。論文將目標(biāo)圖像作為輸入,訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)具有通用性。

這種方式找東西更接近人的思維。訓(xùn)練出的控制器并沒有記住物體的位置,更不知道房屋的結(jié)構(gòu)。但它記住了在每一個(gè)位置,通向各個(gè)物體應(yīng)該怎么走。

3)機(jī)器人抓取

傳統(tǒng)的機(jī)器人學(xué)研究認(rèn)為,需要非常清楚要抓取的物體的三維幾何形狀,分析受力位置和力的大小,再反向計(jì)算機(jī)器手如何一步步移動(dòng)到這些位置。但這種方式抓取不規(guī)則形狀和柔性物體會(huì)很困難。例如毛巾,可能需要看成一系列剛體的鏈接,再進(jìn)行動(dòng)力學(xué)建模分析,但是計(jì)算量比較大。而小黃鴨那樣的橡膠,外部并不能看出彈性程度,難以計(jì)算出需要施加的正確的力。

Pieter Abbeel、DeepMind和OpenAI關(guān)于機(jī)器人控制的研究,都以此深度強(qiáng)化學(xué)習(xí)為基礎(chǔ)?;趶?qiáng)化學(xué)習(xí)進(jìn)行機(jī)器人抓取,以機(jī)器視角看到的圖像為輸入,以機(jī)器最終抓到物體為目標(biāo),不斷對機(jī)器進(jìn)行訓(xùn)練,從而在不建模和不做受力分析的情況下,實(shí)現(xiàn)對物體的抓取。Pieter Abbeel已經(jīng)展示過機(jī)器人疊毛巾,開瓶蓋,裝玩具等復(fù)雜的動(dòng)作。

不過基于強(qiáng)化學(xué)習(xí)也仍有很多問題,如效率低、推理過程長、任務(wù)難以描述、不能終身學(xué)習(xí)、不能最大限度從真實(shí)世界獲取信息等。其中一些通過meta學(xué)習(xí),one-shot學(xué)習(xí),遷移學(xué)習(xí),VR示教等方法的引入得到了改善,有些則還暫時(shí)難以解決。

5.Dexterity Network

鑒于深度強(qiáng)化學(xué)習(xí)的各種問題,Pieter Abbeel在UCBerkeley的同事Ken Goldberg,則采用了叫做Dexterity Network(Dex-Net)的研究思路。首先通過傳統(tǒng)機(jī)器人學(xué)中分析受力和建模的思路,建立一個(gè)包含大量數(shù)據(jù)的數(shù)據(jù)集,這個(gè)數(shù)據(jù)集里的每一項(xiàng)數(shù)據(jù)包含一個(gè)物體的模型和這個(gè)物體在不同姿態(tài)下可以被穩(wěn)定抓起來的施力方式,這些施力方式是通過物體模型計(jì)算出來的。有了數(shù)據(jù)之后,用這些數(shù)據(jù)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)。然后給出一個(gè)新物體,通過神經(jīng)網(wǎng)絡(luò)判斷這個(gè)物體和數(shù)據(jù)集里哪個(gè)物體最相似,然后根據(jù)最相似的物體的數(shù)據(jù)集里包含的施力方式計(jì)算出這個(gè)新物體的最穩(wěn)定施力方式。

Ken Goldberg的方案的一個(gè)重要弊端,是計(jì)算量過于龐大。整個(gè)算法占用了Google云服務(wù)器上的1500臺(tái)虛擬機(jī)的計(jì)算量。此方法也讓“云機(jī)器人”這個(gè)概念受到了關(guān)注。

目前Pieter Abbeel和Ken Goldberg的兩種方法還處于學(xué)術(shù)爭議階段,新的研究成果還在不斷出現(xiàn),也還有很多問題沒有解決,尤其是穩(wěn)定性和魯棒性是各方爭議的焦點(diǎn)。不同于語音識別音箱出了錯(cuò),無非是鬧個(gè)笑話,機(jī)器人系統(tǒng)對穩(wěn)定性和可靠性的要求非常高,系統(tǒng)一旦出錯(cuò),輕則毀物,重則造成人類的生命危險(xiǎn)。Pieter Abbeel也承認(rèn)目前還沒考慮魯棒性和穩(wěn)定性問題,似乎整體還沒達(dá)到商用產(chǎn)品級。

總結(jié)

總體而言,以強(qiáng)化學(xué)習(xí)為代表,AI在機(jī)器人控制領(lǐng)域近兩年取得了一些進(jìn)展,尤其是在過去研究方法難以突破的環(huán)境交互問題方面取得了進(jìn)展。但基于神經(jīng)網(wǎng)絡(luò)的控制系統(tǒng),在魯棒性等方面短期似乎難以得到解決,因此離實(shí)際應(yīng)用還有很遠(yuǎn)的距離。在多種研究方法的共同努力下,我們也期待機(jī)器人控制問題能夠早日有所突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28103

    瀏覽量

    205852
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268106
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9630

    瀏覽量

    149966

原文標(biāo)題:資訊 | AI在機(jī)器人運(yùn)動(dòng)控制領(lǐng)域應(yīng)用盤點(diǎn)

文章出處:【微信號:SRA2009,微信公眾號:深圳市機(jī)器人協(xié)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    LPC2106足球機(jī)器人控制中的應(yīng)用設(shè)計(jì)

    LPC2106足球機(jī)器人控制中的應(yīng)用設(shè)計(jì)足球機(jī)器人融合了計(jì)算機(jī)視覺、模式識別、決策對策、自動(dòng)控制、無線通信、多智能體合作等多項(xiàng)摘要 技術(shù),
    發(fā)表于 03-28 14:03

    基于Matlab和VR技術(shù)的移動(dòng)機(jī)器人建模及仿真

    基于Matlab和VR技術(shù)的移動(dòng)機(jī)器人建模及仿真 
    發(fā)表于 11-18 23:05

    如何遠(yuǎn)程控制機(jī)器人?

    簡單的類似于”基站“的東西接入互聯(lián)網(wǎng),通過手機(jī)app或電腦軟件接入互聯(lián)網(wǎng)的形式遠(yuǎn)程或異地都可以對機(jī)器人控制,實(shí)現(xiàn)基站對于機(jī)器人可進(jìn)行1000米的通訊,而我的手機(jī)或電腦可以在任何有網(wǎng)絡(luò)
    發(fā)表于 10-25 13:31

    什么是工業(yè)機(jī)器人

    自動(dòng)存入程序存儲(chǔ)器中機(jī)器人自動(dòng)工作時(shí),控制系統(tǒng)從程序存儲(chǔ)器中檢出相應(yīng)信息,將指令信號傳給驅(qū)動(dòng)機(jī)構(gòu),使執(zhí)行機(jī)構(gòu)再現(xiàn)示教的各種動(dòng)作。示教輸入程序的工業(yè)機(jī)器人稱為示教再現(xiàn)型工業(yè)
    發(fā)表于 01-19 10:58

    先進(jìn)機(jī)器人控制

    《先進(jìn)機(jī)器人控制》從控制的角度系統(tǒng)地介紹了機(jī)器人學(xué)的基礎(chǔ)知識和當(dāng)前的發(fā)展?fàn)顩r。全書共分為12章,由基礎(chǔ)篇、控制結(jié)構(gòu)篇和先進(jìn)
    發(fā)表于 09-19 15:30

    海西智能下棋機(jī)器人

    深圳市海西機(jī)器人有限公司是一家集研發(fā)、生產(chǎn)、銷售于一體的高科技新能源公司,公司主打研發(fā)運(yùn)動(dòng)控制、AI、通訊模塊等智能化設(shè)備。 海西機(jī)器人專注于為工業(yè)
    發(fā)表于 08-07 09:03

    AI語音智能機(jī)器人開發(fā)實(shí)戰(zhàn)

    ) "AI語音識別機(jī)器人"網(wǎng)絡(luò)通信編碼與實(shí)現(xiàn)(7)AI語音識別解析的軟硬件實(shí)現(xiàn)現(xiàn)在凡報(bào)名本次直播課程,掃下方二維碼進(jìn)群,朋友圈轉(zhuǎn)發(fā)本次直播的海報(bào),保留四小時(shí)以上,便可獲取以下福利:1
    發(fā)表于 01-04 11:48

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機(jī)器人開發(fā)

    迭代開發(fā),和電機(jī)驅(qū)動(dòng)板進(jìn)行串口或者無線通信,可以對機(jī)器人遠(yuǎn)程精確控制,進(jìn)行視覺算法處理,完成安防AI應(yīng)用
    發(fā)表于 11-18 18:15

    【HarmonyOS HiSpark AI Camera】廳堂機(jī)器人

    項(xiàng)目名稱:廳堂機(jī)器人試用計(jì)劃:申請理由:機(jī)器人項(xiàng)目集成攝像頭實(shí)現(xiàn)人臉識別跟隨,熟悉鴻蒙系統(tǒng)。項(xiàng)目名稱:廳堂機(jī)器人項(xiàng)目計(jì)劃:一個(gè)月內(nèi)實(shí)現(xiàn)機(jī)器人集成攝像頭,整合人臉識別功能,識別客戶信息,
    發(fā)表于 11-19 20:49

    ZN-1AI工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)介紹

    ZN-1AI工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)一、產(chǎn)品概述 ZN-1AI以工業(yè)機(jī)器人機(jī)器視覺為核心,將機(jī)械、氣動(dòng)、運(yùn)動(dòng)
    發(fā)表于 07-01 10:07

    關(guān)于工業(yè)機(jī)器人的知識匯總

    工業(yè)機(jī)器人的四大特征是哪些?工業(yè)機(jī)器人是由哪些部分組成的?工業(yè)機(jī)器人是怎樣進(jìn)行劃分的?
    發(fā)表于 10-11 09:10

    機(jī)器人是什么?

    需要人工干預(yù)。真的嗎?是的。.沒有人類的控制,他們無法完成任務(wù)。這就是為什么這些機(jī)器人更有效率。控制可以通過“線路”或“無線”來完成。無線控制
    發(fā)表于 03-31 10:31

    通過多軸工業(yè)機(jī)器人來聊聊機(jī)器人控制系統(tǒng)以及控制器的實(shí)現(xiàn)

    ,年均增長31%,預(yù)計(jì)2023年我國工業(yè)機(jī)器人市場增速將在20%至25%左右,仍會(huì)維持較快的增速?! ★w凌嵌入式作為一家專注嵌入式核心控制系統(tǒng)研發(fā)與制造的高新技術(shù)企業(yè),經(jīng)過多年的研發(fā)與積累,產(chǎn)品已廣泛應(yīng)用
    發(fā)表于 02-24 17:05

    基于Matlab和VR技術(shù)的移動(dòng)機(jī)器人建模及仿真

    利用 Matlab 建立移動(dòng)機(jī)器人的動(dòng)力學(xué)模型 ,虛擬現(xiàn)實(shí) (VR )環(huán)境下 ,實(shí)時(shí)仿真移動(dòng)機(jī)器人路徑跟蹤的運(yùn)動(dòng)特性 ,為基于 Internet 的
    發(fā)表于 09-20 06:24

    ABB機(jī)器人程序指令匯總

    ABB機(jī)器人程序指令匯總.........
    發(fā)表于 12-23 14:50 ?79次下載