在线高清精品第一区二区三区,无码人妻久久一区二区三区不卡,欧美成人一级免费欧美一级成人

深度強(qiáng)化學(xué)習(xí)（Deep RL）可以通過序列決策式的方式，在很多方面得到應(yīng)用。這里我們主要介紹一篇CVPR‘21使用RL做點(diǎn)云圖像配準(zhǔn)的文章：ReAgent： Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

總體上而言，ReAgent是通過訓(xùn)練了一個(gè)Policy網(wǎng)絡(luò)，狀態(tài)是Source點(diǎn)云和Target點(diǎn)云，輸出一系列動(dòng)作（旋轉(zhuǎn)、平移Source點(diǎn)云），使得Source點(diǎn)云最終和Target點(diǎn)云在相同的地方重合。那么我們現(xiàn)在深入其中的細(xì)節(jié)，其實(shí)針對(duì)RL的應(yīng)用文章，最需要關(guān)注的點(diǎn)是以下4個(gè)方面：

狀態(tài)（State）設(shè)計(jì)

動(dòng)作（Action）設(shè)計(jì)

獎(jiǎng)勵(lì)（Reward）設(shè)計(jì)

算法實(shí)現(xiàn)

一般來(lái)說(shuō)RL的應(yīng)用文章在算法上無(wú)非使用的是較為廣泛使用的算法模型，如DQN、PPO、SAC等。

State

這里的State是將Source和Targe點(diǎn)云通過一個(gè)PointNet類似的結(jié)構(gòu)，從高維點(diǎn)云信息Embedding到一個(gè)特征空間后，兩者Concatenate得到State的表征信息。這里從上圖中可以比較好的理解。

Action

這里Action的選擇就比較直觀，我們需要通過一些操作來(lái)旋轉(zhuǎn)、平移Source點(diǎn)云。那么Action就直接設(shè)置為旋轉(zhuǎn)、平移相關(guān)的動(dòng)作。這篇文章在實(shí)現(xiàn)上，使用離散的動(dòng)作集，比如x方向的平移為［0.0033，0.01，0.03，0.09，0.27］，當(dāng)然是有正有負(fù)。

Reward

Reward的設(shè)計(jì)就更為直觀，就是在執(zhí)行動(dòng)作后，看是否Source和Target之間更加接近了。這里使用的是Chamfer Distance（CD）來(lái)衡量，下面給出Reward的設(shè)計(jì)：

這里的Reward也很直觀，就是加入執(zhí)行動(dòng)作之后，是否變得更好？如果變好了就給一個(gè)正的獎(jiǎng)勵(lì)，如果變差了就給一個(gè)負(fù)的獎(jiǎng)勵(lì)。

算法實(shí)現(xiàn)

文章采用了PPO。那么ReAgent的總體框架就如下圖：

如果理解了這個(gè)問題中的State、Action的設(shè)計(jì)，還是相當(dāng)直觀的框架。同時(shí)筆者也跑通了ReAgent的代碼，實(shí)際看下其效果如何，主要是觀察其序列動(dòng)作過程

可以看到ReAgent的動(dòng)作還是相當(dāng)“絲滑“”且準(zhǔn)確的。也希望更多的讀者能夠探索RL的各種應(yīng)用，做到像人一樣“絲滑”~

—版權(quán)聲明—

來(lái)源：強(qiáng)化學(xué)習(xí)技術(shù)前沿

僅用于學(xué)術(shù)分享，版權(quán)屬于原作者。

若有侵權(quán)，請(qǐng)聯(lián)系微信號(hào)：刪除或修改！

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

代碼

代碼

+關(guān)注

關(guān)注
30

文章
4671

瀏覽量
67766
深度強(qiáng)化學(xué)習(xí)

深度強(qiáng)化學(xué)習(xí)

+關(guān)注

關(guān)注
0

文章
12

瀏覽量
2284

原文標(biāo)題：深度強(qiáng)化學(xué)習(xí)點(diǎn)云配準(zhǔn)——ReAgent技術(shù)詳解

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

OpenCV攜Orbbec 3D相機(jī)亮相CVPR 2024，加速AI視覺創(chuàng)新

在科技發(fā)展的浪潮中，一年一度的IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議（CVPR）無(wú)疑是視覺技術(shù)領(lǐng)域的一大盛事。今年的CVPR 2024于6月17日至2

發(fā)表于 06-21 10:15 ?460次閱讀

OpenCV攜奧比中光3D相機(jī)亮相CVPR 2024

6月17日-21日，奧比中光合作伙伴OpenCV攜Orbbec 3D相機(jī)參展在美國(guó)西雅圖舉辦的CVPR 2024（即IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議），讓開發(fā)者親身體驗(yàn)Orbbec 3D相機(jī)

發(fā)表于 06-21 09:38 ?371次閱讀

機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

通過自主開發(fā)的3D掃描儀可獲準(zhǔn)確并且快速地獲取場(chǎng)景的點(diǎn)云圖像，通過3D識(shí)別算法，可實(shí)現(xiàn)在對(duì)點(diǎn)云圖中的多種目標(biāo)物體進(jìn)行識(shí)別和位姿估計(jì)。

發(fā)表于 04-29 09:31 ?255次閱讀

如何提取、匹配圖像特征點(diǎn)

我們習(xí)慣從圖像中選取比較有代表性的點(diǎn)，然后，在此基礎(chǔ)上，討論相機(jī)位姿估計(jì)問題，以及這些點(diǎn)的定位問題。在經(jīng)典 SLAM 模型中，把它們稱為路標(biāo)，而在視覺 SLAM 中，路標(biāo)則是指圖像

發(fā)表于 04-19 11:41 ?484次閱讀

圖像處理怎么入門？

總之圖像處理的基本思想還是要立足于圖像本身，要深度到圖像內(nèi)部結(jié)構(gòu)中，思維要靈活。我當(dāng)時(shí)做本科畢設(shè)時(shí)，怎么也不知道圖像和高維空間中的

發(fā)表于 01-08 09:51 ?323次閱讀

RL究竟是如何與LLM做結(jié)合的？

強(qiáng)化學(xué)習(xí)（Reinforcement Learning, RL）的核心概念可簡(jiǎn)單概括為：一個(gè)機(jī)器人（Agent）在看到了一些信息（Observation）后，自己做出一個(gè)決策（Acti

發(fā)表于 01-03 16:34 ?994次閱讀

PCL濾波配準(zhǔn)常用的濾波方式

最近在看PCL濾波配準(zhǔn)等操作，之前在自動(dòng)駕駛-激光雷達(dá)預(yù)處理/特征提取和提到了一些濾除點(diǎn)云等操作，但是最近作者發(fā)現(xiàn)里面還有一些

發(fā)表于 11-28 11:24 ?461次閱讀

關(guān)于圖像傳感器圖像質(zhì)量的四大誤區(qū)！你踩過幾個(gè)坑？

關(guān)于圖像傳感器圖像質(zhì)量的四大誤區(qū)！你踩過幾個(gè)坑？

發(fā)表于 11-27 16:56 ?344次閱讀

機(jī)器視覺：圖像配準(zhǔn)方法分類

基于特征的配準(zhǔn)方法主要是采用各種算法提取基準(zhǔn)圖像和實(shí)時(shí)圖像的特征，如邊緣、角點(diǎn)、曲率、不變矩等，然后對(duì)提取的特征進(jìn)行描述從而使其可以按照

發(fā)表于 11-06 16:54 ?1855次閱讀

基于道路照明標(biāo)準(zhǔn)的LED光源配光圖像清晰度研究

電子發(fā)燒友網(wǎng)站提供《基于道路照明標(biāo)準(zhǔn)的LED光源配光圖像清晰度研究.pdf》資料免費(fèi)下載

發(fā)表于 11-03 09:36 ?0次下載

關(guān)于RL78/G13系列R5F100BEANA產(chǎn)品ADC采集誤差過大的問題

關(guān)于RL78/G13系列R5F100BEANA產(chǎn)品ADC采集誤差過大的問題

發(fā)表于 10-30 17:20 ?660次閱讀

預(yù)訓(xùn)練擴(kuò)散大模型取得點(diǎn)云-圖像配準(zhǔn)SoTA！

現(xiàn)有方法往往是：用一個(gè)2D特征提取網(wǎng)絡(luò)提取圖像特征；用一個(gè)3D特征提取網(wǎng)絡(luò)提取點(diǎn)云特征；然后根據(jù)pixel-to-point對(duì)應(yīng)關(guān)系真值通過Metric Learning (Tripl

發(fā)表于 10-29 17:14 ?651次閱讀

關(guān)于RL78 MCU如何讀取Unique ID和Device Part Number

關(guān)于RL78 MCU如何讀取Unique ID和Device Part Number

發(fā)表于 10-27 15:14 ?818次閱讀

機(jī)器視學(xué)習(xí)筆記：圖像配準(zhǔn)

待配準(zhǔn)圖像與原圖像相比存在偏移、旋轉(zhuǎn)、比例等空間變換關(guān)系，圖像配

發(fā)表于 10-24 09:27 ?892次閱讀

三維點(diǎn)云配準(zhǔn)算法原理及推導(dǎo)

粗配準(zhǔn)就是再兩個(gè)點(diǎn)云還差得十萬(wàn)八千里、完全不清楚兩個(gè)點(diǎn)云的相對(duì)位置關(guān)系的情況下，找到一個(gè)這兩個(gè)點(diǎn)

發(fā)表于 09-25 11:31 ?809次閱讀