0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一篇關(guān)于CVPR‘21使用RL做點(diǎn)云圖像配準(zhǔn)

新機(jī)器視覺 ? 來(lái)源:強(qiáng)化學(xué)習(xí)技術(shù)前沿 ? 作者:東林鐘聲 ? 2021-07-02 08:57 ? 次閱讀

深度強(qiáng)化學(xué)習(xí)(Deep RL)可以通過序列決策式的方式,在很多方面得到應(yīng)用。這里我們主要介紹一篇CVPR‘21使用RL做點(diǎn)云圖像配準(zhǔn)的文章:ReAgent: Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

總體上而言,ReAgent是通過訓(xùn)練了一個(gè)Policy網(wǎng)絡(luò),狀態(tài)是Source點(diǎn)云和Target點(diǎn)云,輸出一系列動(dòng)作(旋轉(zhuǎn)、平移Source點(diǎn)云),使得Source點(diǎn)云最終和Target點(diǎn)云在相同的地方重合。那么我們現(xiàn)在深入其中的細(xì)節(jié),其實(shí)針對(duì)RL的應(yīng)用文章,最需要關(guān)注的點(diǎn)是以下4個(gè)方面:

狀態(tài)(State)設(shè)計(jì)

動(dòng)作(Action)設(shè)計(jì)

獎(jiǎng)勵(lì)(Reward)設(shè)計(jì)

算法實(shí)現(xiàn)

一般來(lái)說(shuō)RL的應(yīng)用文章在算法上無(wú)非使用的是較為廣泛使用的算法模型,如DQN、PPO、SAC等。

State

這里的State是將Source和Targe點(diǎn)云通過一個(gè)PointNet類似的結(jié)構(gòu),從高維點(diǎn)云信息Embedding到一個(gè)特征空間后,兩者Concatenate得到State的表征信息。這里從上圖中可以比較好的理解。

Action

這里Action的選擇就比較直觀,我們需要通過一些操作來(lái)旋轉(zhuǎn)、平移Source點(diǎn)云。那么Action就直接設(shè)置為旋轉(zhuǎn)、平移相關(guān)的動(dòng)作。這篇文章在實(shí)現(xiàn)上,使用離散的動(dòng)作集,比如x方向的平移為[0.0033,0.01,0.03,0.09,0.27],當(dāng)然是有正有負(fù)。

Reward

Reward的設(shè)計(jì)就更為直觀,就是在執(zhí)行動(dòng)作后,看是否Source和Target之間更加接近了。這里使用的是Chamfer Distance(CD)來(lái)衡量,下面給出Reward的設(shè)計(jì):

4982f126-dacc-11eb-9e57-12bb97331649.png

這里的Reward也很直觀,就是加入執(zhí)行動(dòng)作之后,是否變得更好?如果變好了就給一個(gè)正的獎(jiǎng)勵(lì),如果變差了就給一個(gè)負(fù)的獎(jiǎng)勵(lì)。

算法實(shí)現(xiàn)

文章采用了PPO。那么ReAgent的總體框架就如下圖:

49a7c88e-dacc-11eb-9e57-12bb97331649.png

如果理解了這個(gè)問題中的State、Action的設(shè)計(jì),還是相當(dāng)直觀的框架。同時(shí)筆者也跑通了ReAgent的代碼,實(shí)際看下其效果如何,主要是觀察其序列動(dòng)作過程

可以看到ReAgent的動(dòng)作還是相當(dāng)“絲滑“”且準(zhǔn)確的。也希望更多的讀者能夠探索RL的各種應(yīng)用,做到像人一樣“絲滑”~

—版權(quán)聲明—

來(lái)源:強(qiáng)化學(xué)習(xí)技術(shù)前沿

僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。

若有侵權(quán),請(qǐng)聯(lián)系微信號(hào): 刪除或修改!

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:深度強(qiáng)化學(xué)習(xí)點(diǎn)云配準(zhǔn)——ReAgent技術(shù)詳解

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OpenCV攜Orbbec 3D相機(jī)亮相CVPR 2024,加速AI視覺創(chuàng)新

    在科技發(fā)展的浪潮中,一年一度的IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)無(wú)疑是視覺技術(shù)領(lǐng)域的大盛事。今年的CVPR 2024于6月17日至2
    的頭像 發(fā)表于 06-21 10:15 ?460次閱讀

    OpenCV攜奧比中光3D相機(jī)亮相CVPR 2024

    6月17日-21日,奧比中光合作伙伴OpenCV攜Orbbec 3D相機(jī)參展在美國(guó)西雅圖舉辦的CVPR 2024(即IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議),讓開發(fā)者親身體驗(yàn)Orbbec 3D相機(jī)
    的頭像 發(fā)表于 06-21 09:38 ?371次閱讀

    機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

    通過自主開發(fā)的3D掃描儀可獲準(zhǔn)確并且快速地獲取場(chǎng)景的點(diǎn)云圖像,通過3D識(shí)別算法,可實(shí)現(xiàn)在對(duì)點(diǎn)云圖中的多種目標(biāo)物體進(jìn)行識(shí)別和位姿估計(jì)。
    發(fā)表于 04-29 09:31 ?255次閱讀
    機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

    如何提取、匹配圖像特征點(diǎn)

    我們習(xí)慣從圖像中選取比較有代表性的點(diǎn),然后,在此基礎(chǔ)上,討論相機(jī)位姿估計(jì)問題,以及這些點(diǎn)的定位問題。 在經(jīng)典 SLAM 模型中,把它們稱為路標(biāo),而在視覺 SLAM 中,路標(biāo)則是指圖像
    的頭像 發(fā)表于 04-19 11:41 ?484次閱讀

    圖像處理怎么入門?

    總之圖像處理的基本思想還是要立足于圖像本身,要深度到圖像內(nèi)部結(jié)構(gòu)中,思維要靈活。我當(dāng)時(shí)本科畢設(shè)時(shí),怎么也不知道圖像和高維空間中的
    的頭像 發(fā)表于 01-08 09:51 ?323次閱讀

    RL究竟是如何與LLM結(jié)合的?

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)的核心概念可簡(jiǎn)單概括為:個(gè)機(jī)器人(Agent)在看到了些信息(Observation)后,自己做出個(gè)決策(Acti
    的頭像 發(fā)表于 01-03 16:34 ?994次閱讀
    <b class='flag-5'>RL</b>究竟是如何與LLM<b class='flag-5'>做</b>結(jié)合的?

    PCL濾波準(zhǔn)常用的濾波方式

    最近在看PCL濾波準(zhǔn)等操作,之前在自動(dòng)駕駛-激光雷達(dá)預(yù)處理/特征提取和提到了些濾除點(diǎn)云等操作,但是最近作者發(fā)現(xiàn)里面還有
    的頭像 發(fā)表于 11-28 11:24 ?461次閱讀

    關(guān)于圖像傳感器圖像質(zhì)量的四大誤區(qū)!你踩過幾個(gè)坑?

    關(guān)于圖像傳感器圖像質(zhì)量的四大誤區(qū)!你踩過幾個(gè)坑?
    的頭像 發(fā)表于 11-27 16:56 ?344次閱讀
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>圖像</b>傳感器<b class='flag-5'>圖像</b>質(zhì)量的四大誤區(qū)!你踩過幾個(gè)坑?

    機(jī)器視覺:圖像準(zhǔn)方法分類

    基于特征的準(zhǔn)方法 主要是采用各種算法提取基準(zhǔn)圖像和實(shí)時(shí)圖像的特征,如邊緣、角點(diǎn)、曲率、不變矩等,然后對(duì)提取的特征進(jìn)行描述從而使其可以按照
    發(fā)表于 11-06 16:54 ?1855次閱讀
    機(jī)器視覺:<b class='flag-5'>圖像</b><b class='flag-5'>配</b><b class='flag-5'>準(zhǔn)</b>方法分類

    基于道路照明標(biāo)準(zhǔn)的LED光源圖像清晰度研究

    電子發(fā)燒友網(wǎng)站提供《基于道路照明標(biāo)準(zhǔn)的LED光源圖像清晰度研究.pdf》資料免費(fèi)下載
    發(fā)表于 11-03 09:36 ?0次下載
    基于道路照明標(biāo)準(zhǔn)的LED光源<b class='flag-5'>配</b>光<b class='flag-5'>圖像</b>清晰度研究

    關(guān)于RL78/G13系列R5F100BEANA產(chǎn)品ADC采集誤差過大的問題

    關(guān)于RL78/G13系列R5F100BEANA產(chǎn)品ADC采集誤差過大的問題
    的頭像 發(fā)表于 10-30 17:20 ?660次閱讀
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>RL</b>78/G13系列R5F100BEANA產(chǎn)品ADC采集誤差過大的問題

    預(yù)訓(xùn)練擴(kuò)散大模型取得點(diǎn)云-圖像準(zhǔn)SoTA!

    現(xiàn)有方法往往是:用個(gè)2D特征提取網(wǎng)絡(luò)提取圖像特征;用個(gè)3D特征提取網(wǎng)絡(luò)提取點(diǎn)云特征;然后根據(jù)pixel-to-point對(duì)應(yīng)關(guān)系真值通過Metric Learning (Tripl
    的頭像 發(fā)表于 10-29 17:14 ?651次閱讀
    預(yù)訓(xùn)練擴(kuò)散大模型取得點(diǎn)云-<b class='flag-5'>圖像</b><b class='flag-5'>配</b><b class='flag-5'>準(zhǔn)</b>SoTA!

    關(guān)于RL78 MCU如何讀取Unique ID和Device Part Number

    關(guān)于RL78 MCU如何讀取Unique ID和Device Part Number
    的頭像 發(fā)表于 10-27 15:14 ?818次閱讀
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>RL</b>78 MCU如何讀取Unique ID和Device Part Number

    機(jī)器視學(xué)習(xí)筆記:圖像準(zhǔn)

    準(zhǔn)圖像與原圖像相比存在偏移、旋轉(zhuǎn)、比例等空間變換關(guān)系,圖像
    的頭像 發(fā)表于 10-24 09:27 ?892次閱讀
    機(jī)器視學(xué)習(xí)筆記:<b class='flag-5'>圖像</b><b class='flag-5'>配</b><b class='flag-5'>準(zhǔn)</b>

    三維點(diǎn)準(zhǔn)算法原理及推導(dǎo)

    準(zhǔn)就是再兩個(gè)點(diǎn)云還差得十萬(wàn)八千里、完全不清楚兩個(gè)點(diǎn)云的相對(duì)位置關(guān)系的情況下,找到個(gè)這兩個(gè)點(diǎn)
    的頭像 發(fā)表于 09-25 11:31 ?809次閱讀