丝瓜视频官网下载最新版ios,亚洲中文欧美日韩,久久亚洲精品日本波多野结衣

導(dǎo)讀

自動(dòng)駕駛中的激光雷達(dá)點(diǎn)云如何做特征表達(dá)，將基于Lidar的目標(biāo)檢測(cè)方法分成了4類，即：基于BEV的目標(biāo)檢測(cè)方法，基于camera/range view的目標(biāo)檢測(cè)方法，基于point-wise feature的目標(biāo)檢測(cè)方法，基于融合特征的目標(biāo)檢測(cè)方法。本文對(duì)這4類方法講解并總結(jié)，希望能幫助大家在實(shí)際使用中做出快速選擇?；趌idar的目標(biāo)檢測(cè)方法可以分成3個(gè)部分：lidar representation，network backbone，detection head，如下圖所示。

根據(jù)lidar不同的特征表達(dá)方式，可以將目標(biāo)檢測(cè)方法分成以下4種：基于BEV（bird’s eye view）的目標(biāo)檢測(cè)方法，基于camera view的目標(biāo)檢測(cè)方法，基于point-wise feature的目標(biāo)檢測(cè)方法，基于融合特征的目標(biāo)檢測(cè)方法。如下圖所示。

圖1 基于lidar目標(biāo)檢測(cè)方法分類

1、基于BEV的目標(biāo)檢測(cè)方法

基于bev的目標(biāo)檢測(cè)方法顧名思義是使用bev作為點(diǎn)云特征的表達(dá)，其檢測(cè)流程如下圖所示，包括3個(gè)部分：bev generator，network backbone， detection head。下面詳細(xì)介紹一下這3個(gè)部分如何在基于bev的目標(biāo)檢測(cè)方法中發(fā)揮作用。

1. bev generator BEV圖由激光雷達(dá)點(diǎn)云在XY坐標(biāo)平面離散化后投影得到，其中需要人為規(guī)定離散化時(shí)的分辨率，即點(diǎn)云空間多大的長(zhǎng)方體范圍（Δl*Δw*Δh）對(duì)應(yīng)離散化后的圖像的一個(gè)像素點(diǎn)（或一組特征向量），如點(diǎn)云20cm*20cm*Δh的長(zhǎng)方體空間，對(duì)應(yīng)離散化后的圖像的一個(gè)像素點(diǎn)。在bev generator中，需要根據(jù)Δl*Δw*Δh來(lái)生成最后L*W*H大小的bev特征圖，該特征圖是network backbone特征提取網(wǎng)絡(luò)的輸入，因此該特征圖的大小對(duì)整個(gè)網(wǎng)絡(luò)的效率影響很大，如pointpillar通過(guò)對(duì)voxelnet中bev generator的優(yōu)化，整個(gè)網(wǎng)絡(luò)效率提高了7ms。

2. network backbone 網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)需要兼顧性能和效果，一般都是在現(xiàn)有比較大且性能比較好的網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上進(jìn)行修改。以voxelnet和pointpillar為例，pointpillar以voxelnet為原型，不改變?cè)鞒痰幕A(chǔ)上，對(duì)voxelnet設(shè)計(jì)做了以下一些修改，使網(wǎng)絡(luò)效率提高了10多倍，具體如下：簡(jiǎn)化bev中的網(wǎng)絡(luò)結(jié)構(gòu)voxelnet使用stacked vfe layer，在代碼中使用了2個(gè)vfe layer，如下圖所示。

pointpillars簡(jiǎn)化了voxel表達(dá)形式，變成pillar，提高了數(shù)據(jù)生成效率，并且只使用了一個(gè)vfe layer，減少了2ms，如下圖所示。

簡(jiǎn)化主網(wǎng)絡(luò)結(jié)構(gòu)

不使用3D卷積

輸入特征圖的channel數(shù)從128減少為64，網(wǎng)絡(luò)耗時(shí)減少2.5ms

網(wǎng)絡(luò)主結(jié)構(gòu)所有層channel數(shù)減半，網(wǎng)絡(luò)耗時(shí)減少4.5ms

Upsampling的channel數(shù)從256減少到128，減輕detection head，網(wǎng)絡(luò)耗時(shí)減少3.9ms

Tensor RT加速，提速45.5%

Pointpillar［2］在保證網(wǎng)絡(luò)性能提升的前提下，逐步提高網(wǎng)絡(luò)效率，從不同角度優(yōu)化網(wǎng)絡(luò)流程，最后使網(wǎng)絡(luò)效率提高10倍有余。 3.detection head detection head包括兩個(gè)任務(wù)，即：目標(biāo)分類與目標(biāo)定位，由于bev將點(diǎn)云用圖像的形式呈現(xiàn)，同時(shí)保留了障礙物在三維世界的空間關(guān)系，因此基于bev的目標(biāo)檢測(cè)方法可以和圖像目標(biāo)檢測(cè)方法類比：目標(biāo)分類任務(wù)與圖像目標(biāo)檢測(cè)方法中目標(biāo)分類任務(wù)沒(méi)有差別；而目標(biāo)定位任務(wù)可以直接回歸目標(biāo)的真實(shí)信息，但與圖像目標(biāo)檢測(cè)方法中目標(biāo)定位任務(wù)不同，該任務(wù)需要給出旋轉(zhuǎn)框。與圖像目標(biāo)檢測(cè)方法相同，基于bev的目標(biāo)檢測(cè)方法的detection head也分成anchor base的方法和anchor free的方法。 anchor base方法以voxelnet為例，需要人為設(shè)定anchor的大小，由于bev可以直接回歸真實(shí)的目標(biāo)大小，因此anchor也可以根據(jù)真實(shí)目標(biāo)大小設(shè)定，如：以下單位為米，l、w、h分別表示anchor的長(zhǎng)、寬、高，對(duì)于車來(lái)說(shuō)anchor大小可以設(shè)定為la = 3.9，wa = 1.6，ha = 1.56，對(duì)于人la = 0.8，wa = 0.6，ha = 1.73，對(duì)于騎行者la =1.76，wa = 0.6，ha = 1.73，且對(duì)于每種anchor，設(shè)置了θa=0°和90°兩種角度。由于目標(biāo)有各種角度，因此為了得到更準(zhǔn)確的角度回歸，anchor的角度設(shè)置可以在［0°，180°）進(jìn)行等間隔采樣，獲得更多不同角度的anchor，提高回歸精度?；貧w誤差的計(jì)算如下圖所示。

anchor free方法典型代表是pixor，對(duì)于bbox的回歸，如下圖所示，對(duì)于正樣本的紅點(diǎn)p（x，y），需要回歸如下信息：{cos（θ）， sin（θ）， dx， dy， w， l}，其中θ為障礙物偏角，dx、dy分別為p點(diǎn)相對(duì)障礙物中心點(diǎn)的偏移，w、l是障礙物大小的表達(dá)。沒(méi)有anchor，對(duì)目標(biāo)的回歸是不是簡(jiǎn)單了很多。

以上為基于bev的目標(biāo)檢測(cè)方法的簡(jiǎn)單介紹，該方法在目前的自動(dòng)駕駛的3D目標(biāo)檢測(cè)方案中應(yīng)用較廣。

2、基于camera/range view的目標(biāo)檢測(cè)方法

基于cameraview的目標(biāo)檢測(cè)方法顧名思義是使用camera view作為點(diǎn)云特征的表達(dá)，檢測(cè)流程如下圖所示，下面詳細(xì)介紹一下這3個(gè)部分如何在基于camera view的目標(biāo)檢測(cè)方法中發(fā)揮作用。

1. camera view generator

camera view圖是將每圈激光線拉成直線再按行累積而成，因此也稱為range view，其中投影圖的高為激光線數(shù)，寬為lidar掃描一圈的點(diǎn)數(shù)，如： 64線激光雷達(dá)，水平角分辨率為0.2°，生成的camera view的圖大小為64*1800。camera view相對(duì)bev圖小很多，因此基于camera view的方法效率都較高。camera view效果如下圖。

2. network backbone

網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)要依據(jù)任務(wù)需求，基于camera view的目標(biāo)檢測(cè)方法，多是以分割任務(wù)為主，因此網(wǎng)絡(luò)結(jié)構(gòu)大都是encode+decode結(jié)構(gòu)，如下圖1所示。因此有關(guān)提高分割效果的網(wǎng)絡(luò) 設(shè)計(jì)思想都可以在此使用，如圖2中使用不同大小的dilation rate的卷積獲得不同感受野的特征表達(dá)，如圖3使用global attention增加上下文信息。更多分割增強(qiáng)模塊，在后面會(huì)專門寫一篇文章介紹。

圖1 ecode+decode

圖2 不同dilate rate卷積

圖3 global attention

3. detection head

基于camera view的目標(biāo)檢測(cè)方法有兩種輸出方式表達(dá)，一種是純分割區(qū)域，另一種是分割與檢測(cè)框。純分割區(qū)域表達(dá)純分割的輸出是基于camera view的模型最直接、最好的一種輸出。在原始3D點(diǎn)云中，尤其是遠(yuǎn)處的點(diǎn)，點(diǎn)與點(diǎn)之間的距離都較遠(yuǎn)，如bev投影圖，造成點(diǎn)特征提取時(shí)很難融入上下文信息。而camera view投影圖將點(diǎn)云中的點(diǎn)聚攏，每個(gè)點(diǎn)都可以很方便的獲得更大范圍的上下文信息，這種投影方式更適合分割任務(wù)。如在SqueezeSeg和PointSeg兩篇文章中，都直接將分割作為最終任務(wù)目標(biāo)，但是為了得到更好的聯(lián)通區(qū)域，需要增加較多的后處理。如在SqueezeSeg，在模型輸出后又增加了crf提高分割效果。在PointSeg中，使用RANSAC將異常點(diǎn)剔除，如下圖，第一行為模型輸入，第二行為模型直接的預(yù)測(cè)輸出，第三行為將模型輸出的camera view圖反投影得到的點(diǎn)云圖，第四行為經(jīng)過(guò)ransac后再反投影得到的點(diǎn)云圖，對(duì)比第三行和第四行對(duì)應(yīng)的圖可以看出，ransac有效的抑制很多離目標(biāo)較遠(yuǎn)的點(diǎn)。

分割與檢測(cè)表達(dá)分割任務(wù)對(duì)于基于camera view的模型相對(duì)簡(jiǎn)單，但是檢測(cè)框的回歸并不容易。camera view投影圖增加了點(diǎn)云中點(diǎn)的上下文信息，但也將原本在3D空間分離的目標(biāo)拉近，引入了遮擋與目標(biāo)尺度變化，然而點(diǎn)云投影圖又不像真實(shí)的圖像那樣有很豐富的紋理信息，造成了camera view圖像很難做實(shí)例分割與目標(biāo)框回歸，因此，檢測(cè)框的回歸需要增加一些額外操作來(lái)實(shí)現(xiàn)。

在lasernet中，對(duì)于目標(biāo)框中的點(diǎn)（x，y）需要回歸6個(gè)信息，如上圖所示，Box Parameters為6，包括：該點(diǎn)相對(duì)中心點(diǎn)的偏移（dx，dy），相對(duì)旋轉(zhuǎn)角度（ωx，ωy） = （cosω，sinω），以及框大小（l，w），從而可以通過(guò)下述公式計(jì)算得到真正的目標(biāo)框中心點(diǎn)bc以及旋轉(zhuǎn)角φ，其中θ為該點(diǎn)在點(diǎn)云中的方位角，Rθ為以θ為旋轉(zhuǎn)角的旋轉(zhuǎn)矩陣。

另外，由于對(duì)每個(gè)點(diǎn)的預(yù)測(cè)存在噪聲，而后又在bev投影圖中使用mean shift聚類方法得到更準(zhǔn)確的目標(biāo)框。 4. 小結(jié) 由于3D點(diǎn)云在做camera view投影的時(shí)候丟失了原來(lái)的3D結(jié)構(gòu)信息，引入了圖像中的尺度變化和遮擋兩個(gè)問(wèn)題，因此少有方法直接在這種模式下作3D目標(biāo)檢測(cè)，一般需要在網(wǎng)絡(luò)輸出基礎(chǔ)上做比較多的后處理。但是camera view的表達(dá)模式，極大的增加了遠(yuǎn)處點(diǎn)云的上下文信息，也是一種極好的提高點(diǎn)云特征表達(dá)能力的方式。

3、基于point-wise feature的目標(biāo)檢測(cè)方法

我們從如下圖所示的3個(gè)部分（lidar representation，network backbone，detection head），來(lái)介紹一下point-wise方法。其中l(wèi)idar represention部分是直接使用點(diǎn)云做輸入，即n*4的點(diǎn)集，不做單獨(dú)介紹，下面重點(diǎn)介紹一下其他兩個(gè)部分。

1. network backbone 提取點(diǎn)特征一般有兩種方式：基于pointnet/pointnet++的點(diǎn)特征、voxel特征。如圖1：在STD中，組合了兩種方式。如圖2，在PointRcnn中，僅使用了pointnet++提取點(diǎn)特征

圖1 STD特征提取方式

圖2 PointRcnn中特征提取方式

在使用pointnet++［11］提取特征時(shí)，包含兩個(gè)重要模塊，即set abstraction（即，SA）和feature propagation（即，F(xiàn)P），如下圖3所示其中SA是特征encoder過(guò)程，通過(guò)點(diǎn)云篩選與特征提取逐步減少點(diǎn)云點(diǎn)數(shù)，提高特征表達(dá)能力與感受，F(xiàn)P是特征decoder過(guò)程，通過(guò)點(diǎn)云上采樣，獲得稠密的點(diǎn)云表達(dá)，并級(jí)聯(lián)SA過(guò)程的特征，提高最終的點(diǎn)云特征表達(dá)能力。

圖3 pointnet++特征表達(dá)

在3DSSD中，為了提高模型效率，去掉了耗時(shí)比較嚴(yán)重的FP模塊，由于SA過(guò)程只篩選了一部分點(diǎn)做特征表達(dá)，對(duì)目標(biāo)檢測(cè)的召回影響很大，尤其對(duì)點(diǎn)云比較稀疏的遠(yuǎn)處的目標(biāo)，影響更大，因此3DSSD在D-FPS的基礎(chǔ)上，提出了F-FPS，即通過(guò)點(diǎn)的語(yǔ)義信息來(lái)做點(diǎn)的篩選，保留更多的正樣本的點(diǎn)，保證最終的目標(biāo)召回率。

2. detection head detection head除了完成目標(biāo)分類與目標(biāo)定位的任務(wù)，在two-stage detector中，還需要實(shí)現(xiàn)roi pooling，為第二階段提供實(shí)例級(jí)別的特征，點(diǎn)云的特征表達(dá)還是有些差別的。對(duì)于目標(biāo)定位的任務(wù)，同樣有anchor-base方法和anchor-free方法。在STD中，為應(yīng)對(duì)有旋轉(zhuǎn)角的box回歸，提出了球形anchor，由于anchor沒(méi)有角度的變化，直接將anchor數(shù)量減少50%，提高了計(jì)算效率。其他方法大都是anchor-free的方法，關(guān)于anchor-free的方法，推薦讀一下kaiming大神的voteNet，比較好理解。

關(guān)于roi pooling，一般是針對(duì)單個(gè)目標(biāo)，再次提取更豐富、更具表達(dá)能力的特征，因此在不同論文中，根據(jù)實(shí)例提取特征方式的不同，提出了不同的roi pooling方法，如在STD中，提出了PointsPool，在Part aware and aggregation中，提出了Roi aware Point Cloud Pooling，在pv-rcnn中提出了Roi grid Pooling。下面分別介紹一下。 PointsPool如下圖4所示，分成三個(gè)步驟

圖4 PointsPool

特征提?。涸趐roposal中隨機(jī)篩選N個(gè)點(diǎn)，1）獲得第一階段的點(diǎn)特征；2）獲得N個(gè)點(diǎn)的坐標(biāo)，并用如下圖5所示的canonical transformation得到與原坐標(biāo)系無(wú)關(guān)的坐標(biāo)特征。兩種特征聯(lián)合在一起，作為proposal中點(diǎn)的特征表達(dá)

Voxel表達(dá)：將不同大小的proposal，通過(guò)voxel統(tǒng)一化到相同大?。篸l = 6，dw = 6，dh = 6

使用VFE layer提取最終特征

圖5 canonical transformation

Roi aware Point Cloud Pooling整體流程如下圖6所示，與STD中的pooling方法類似，首先將proposal分割成固定大小的voxel，如14×14×14，然后再提取voxel特征表達(dá)：

RoIAwareMaxPool：使用的是第一階段輸出的point-wise semantic part feature，在voxel中計(jì)算max pooling

RoIAwareAvgPool：使用的是proposal中經(jīng)過(guò)canonical transformation點(diǎn)坐標(biāo)特征和segmentation score，在voxel中計(jì)算avg pooling

最后將兩組特征聯(lián)合作為proposal的pooling特征。

圖6 Roi aware Point Cloud Pooling

Roi grid pooling與上面兩種pooling方法不同的是，并沒(méi)有將proposal通過(guò)voxel得到固定大小的特征圖，而是根據(jù)pv-rcnn中提出的key point信息，將proposal用6*6*6=216個(gè)grid points表達(dá)，grid points是從proposal中的key points均勻采樣獲得，且RoI-grid point features提取過(guò)程和key point feature提取過(guò)程是相似的。簡(jiǎn)單來(lái)說(shuō)就是以grid point為中心，r為半徑的區(qū)域內(nèi)提取不同尺度、不同感受野的特征，最后在使用2層的MLP網(wǎng)絡(luò)獲得最終的特征表達(dá)，如圖7所示。

圖7 Roi grid point feature extraction

3.小結(jié)與展望

目前基于point-wise feature的目標(biāo)檢測(cè)方法還處于研究階段，效率無(wú)法保證，精度還未在真實(shí)自動(dòng)駕駛車上測(cè)試，但由于該方法直接從點(diǎn)云提取特征，極大的保留了點(diǎn)云的原始信息，比較有潛力得到更好的效果。

4、基于融合特征的目標(biāo)檢測(cè)方法

Waymo在2020年初的文章“End-to-End Multi-View Fusionfor 3D Object Detection in LiDAR Point Clouds”使用了融合特征的方式，得到了不錯(cuò)的結(jié)果。下面詳細(xì)介紹一下。

圖1 目標(biāo)檢測(cè)流程

我們從如圖1所示的3個(gè)部分（lidar representation，network backbone，detection head），來(lái)介紹一下融合特征的目標(biāo)檢測(cè)方法。文中主要和pointpillar做了對(duì)比，為了證明融合特征的有效性，在network backbone和detection head兩部分的設(shè)計(jì)上保持了與pointpillars的一致性，這里不做單獨(dú)介紹，下面重點(diǎn)介紹lidar representation，即如何獲得融合特征。 1. lidar representation

圖2 multi-view feature fusion的流程

圖3 dynamic voxelization計(jì)算流程

如圖2所示為multi-view feature fusion的流程，融合了3部分特征：bev feature（如圖中綠色部分）、camera/range view feature（如圖中黃色部分）、point-wise feature（如圖中藍(lán)色部分）。具體流程如下：

對(duì)于原始點(diǎn)云，使用一個(gè)全連接層，獲得point-wise feature。

在point-wise feature的基礎(chǔ)上，提取bev feature。提出了使用動(dòng)態(tài)voxel（dynamic voxelization，DV）的方式獲得bev圖，計(jì)算過(guò)程如圖3所示，相對(duì)傳統(tǒng)的voxel（Hard voxelization，HV），有3個(gè)好處，1）DV保留了voxel中的所有點(diǎn)，HV使用隨機(jī)采樣的方法選取固定的點(diǎn)數(shù)，有可能會(huì)丟失重要信息，如圖3中v1的計(jì)算；2）HV中每個(gè)voxel中選擇固定的點(diǎn)數(shù)，且對(duì)整個(gè)點(diǎn)云選擇固定的voxel數(shù)量，因此會(huì)隨機(jī)丟棄點(diǎn)甚至整個(gè)voxel，這種方式可能導(dǎo)致不穩(wěn)定的檢測(cè)結(jié)果，如圖3中v2在HV中被丟棄；3）HV對(duì)于點(diǎn)數(shù)少于固定值的voxel使用0填充，這樣會(huì)造成額外的計(jì)算，如圖3中v2~v4。最后對(duì)于點(diǎn)云的每一個(gè)點(diǎn)，使用公式（1）獲得點(diǎn)與voxel的投影關(guān)系，其中pi表示點(diǎn)云坐標(biāo)，vj表示voxel，F(xiàn)V表示點(diǎn)到voxel的投影關(guān)系。

對(duì)于camera view，同樣可以使用公式（1）計(jì)算得到，而camera view的投影計(jì)算

bev圖和camera view圖經(jīng)過(guò)一個(gè)cnn后，獲得相應(yīng)的bev feature與camera view feature，再使用公式（2）（其中，F(xiàn)P表示voxel feature到點(diǎn)云的投影關(guān)系，是FV的逆）逆投影獲得不同view的點(diǎn)特征的表達(dá)，最后與point-wise feature融合得到最終的點(diǎn)特征表達(dá)。

（1）

（2） 2. 結(jié)果與小結(jié)

在實(shí)驗(yàn)中，作者為了證明融合特征較強(qiáng)的表達(dá)能力，network backbone與detection head使用了與pointpillar相同的參數(shù)，并在waymo公開(kāi)的數(shù)據(jù)庫(kù)與kitti上做了實(shí)驗(yàn)。僅分析一下waymo公開(kāi)數(shù)據(jù)庫(kù)的結(jié)果，如圖4中的table1和table 2。從結(jié)果可以看出，使用DV替換HV，使整體結(jié)果提高2個(gè)多點(diǎn)，再增加point-wise feature后，車輛檢測(cè)結(jié)果再提高3個(gè)多點(diǎn)，行人檢測(cè)結(jié)果再提高4個(gè)點(diǎn)，說(shuō)明voxel中的每個(gè)點(diǎn)對(duì)voxel特征表達(dá)都重要，不能隨機(jī)丟棄，更不能隨機(jī)丟棄整個(gè)voxel，更精細(xì)的特征對(duì)小尺度的目標(biāo)表達(dá)有幫助。耗時(shí)方面，由于mvf使用了與兩種方法相同的網(wǎng)絡(luò)配置，而又增加了新的特征表達(dá)，整體耗時(shí)高了20多ms，如果再對(duì)網(wǎng)絡(luò)做一些優(yōu)化，這種融合的方法對(duì)結(jié)果的提升意義很大。

圖4 waymo數(shù)據(jù)集結(jié)果

5、總結(jié)與展望

通過(guò)對(duì)整個(gè)檢測(cè)流程的分析，將目標(biāo)檢測(cè)流程分成如下3個(gè)部分，如圖2所示。并針對(duì)不同的目標(biāo)檢測(cè)方法，從這3個(gè)部分進(jìn)行了詳細(xì)的分析。

lidar representation：激光雷達(dá)點(diǎn)云的特征表達(dá)，包括bev圖、camera/range view圖、point-wise feature、融合特征。

network backbone：用于特征提取的主體結(jié)構(gòu)，可以為resnet，vgg等，也包括增強(qiáng)特征的方式，如fpn

detection head：檢測(cè)網(wǎng)絡(luò)輸出，包括目標(biāo)的類別、位置、大小和姿態(tài)，以及速度預(yù)測(cè)等，對(duì)于two-stage detector來(lái)說(shuō)，roi pooling也是很重要的一個(gè)環(huán)節(jié)。

圖2 目標(biāo)檢測(cè)流程

其實(shí)，在實(shí)際應(yīng)用中，無(wú)論對(duì)于哪一種基于lidar的目標(biāo)檢測(cè)方法來(lái)說(shuō)，我們?cè)u(píng)價(jià)其好壞，需要看精度與耗時(shí)之間的平衡。根據(jù)不同算法在kitti的bird’s eye view任務(wù)下公布的結(jié)果，將部分基于lidar的目標(biāo)檢測(cè)方法的moderate精度和latency總結(jié)如表1，并根據(jù)方法所屬的不同類別畫出分布圖，如圖3所示，橫坐標(biāo)表示算法耗時(shí)，單位ms，縱坐標(biāo)表示算法在車輛檢測(cè)任務(wù)中moderate精度，其中藍(lán)點(diǎn)表示基于point-wise feature的目標(biāo)檢測(cè)方法，橙點(diǎn)表示基于BEV的目標(biāo)檢測(cè)方法，灰點(diǎn)表示基于camera view的目標(biāo)檢測(cè)方法。表1 不同算法檢測(cè)效果

圖3 不同算法效果分布圖

從圖3，我們可以看出基于point-wise feature的目標(biāo)檢測(cè)方法精度最高，而且耗時(shí)有逐步減小的趨勢(shì)，但是整體耗時(shí)依舊比其他兩種方法高，其中耗時(shí)最低的是基于camera-view的目標(biāo)檢測(cè)方法，即LaserNet，僅有12ms，但是精度相對(duì)較最低；基于bev的目標(biāo)檢測(cè)方法在精度與耗時(shí)之間做了比較好的平衡，因此，在實(shí)際自動(dòng)駕駛應(yīng)用中，基于bev的目標(biāo)檢測(cè)方法應(yīng)用最多。之前在介紹基于point-wise feature的目標(biāo)檢測(cè)方法中說(shuō)過(guò)，該方法潛力較大，其實(shí)從圖3中也可以看出。如果從效率上可以優(yōu)化一下，在實(shí)際應(yīng)用的可能性也會(huì)變大。這個(gè)圖僅是不同方法在車輛檢測(cè)子任務(wù)上的效果，其實(shí)，相同的方法在自行車和人的檢測(cè)任務(wù)中精度排名差別很大，如PV-RCNN在車輛檢測(cè)中排名第2，在行人和自行車檢測(cè)任務(wù)中分別滑到第6和第4；STD在車輛檢測(cè)中排名第5，在行人和自行車檢測(cè)任務(wù)中分別滑到第20和第13，如果基于point-wise feature的目標(biāo)檢測(cè)方法可以在不同任務(wù)間依然能保持精度優(yōu)勢(shì)，那么其落地的可能性又會(huì)增大很多?？傊覀冃枰獜暮臅r(shí)、不同任務(wù)間精度平衡來(lái)評(píng)估算法的落地難易程度，但是對(duì)于有潛力的算法，我們更需要持續(xù)的投入，以期待解決未來(lái)更復(fù)雜的實(shí)際問(wèn)題。本文來(lái)源：計(jì)算機(jī)視覺(jué)之路，作者：山澗一壺酒

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

激光雷達(dá)

激光雷達(dá)

+關(guān)注

關(guān)注
967

文章
3863

瀏覽量
188745
自動(dòng)駕駛

自動(dòng)駕駛

+關(guān)注

關(guān)注
781

文章
13449

瀏覽量
165260

原文標(biāo)題：一文覽盡LiDAR點(diǎn)云目標(biāo)檢測(cè)方法

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺(jué)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

激光雷達(dá)點(diǎn)云數(shù)據(jù)包含哪些信息

激光雷達(dá)（LiDAR）是一種利用激光技術(shù)進(jìn)行距離測(cè)量的遙感技術(shù)。它通過(guò)發(fā)射激光脈沖并接收反射回來(lái)的光束，來(lái)測(cè)量物體與激光雷達(dá)系統(tǒng)之間的距離。激光雷達(dá)

發(fā)表于 08-29 17:18 ?263次閱讀

激光雷達(dá)濾光片：自動(dòng)駕駛的“眼睛之選”

隨著科技的飛速進(jìn)步，激光雷達(dá)作為核心技術(shù)，正以前所未有的態(tài)勢(shì)革新著我們的生活。從自動(dòng)駕駛汽車的安全導(dǎo)航到智能機(jī)器人的敏銳環(huán)境感知，激光雷達(dá)的應(yīng)用廣泛且深入，而濾光片則是其中不可或缺的一部分。激

發(fā)表于 08-09 17:54 ?1544次閱讀

FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用？

的數(shù)據(jù)處理和預(yù)處理，實(shí)現(xiàn)實(shí)時(shí)計(jì)算和反饋。二、數(shù)據(jù)傳輸與處理FPGA在自動(dòng)駕駛中扮演著數(shù)據(jù)傳輸和處理的角色。它能夠支持多種傳感器（如激光雷達(dá)、攝像頭、GPS等）的數(shù)據(jù)傳輸，并通過(guò)其高速的數(shù)據(jù)處理能力，實(shí)現(xiàn)

發(fā)表于 07-29 17:09

百度蘿卜快跑第六代無(wú)人車攜手禾賽AT128激光雷達(dá),共筑自動(dòng)駕駛新篇章

在自動(dòng)駕駛技術(shù)的浪潮中，激光雷達(dá)作為感知層的核心部件，正引領(lǐng)著行業(yè)向更高水平的智能化邁進(jìn)。近日，激光雷達(dá)領(lǐng)域的佼佼者禾賽科技宣布了一項(xiàng)重要合作——成為百度蘿卜快跑第六代無(wú)人車主

發(fā)表于 07-19 16:21 ?1340次閱讀

基于FPGA的激光雷達(dá)控制板

激光雷達(dá)作為一種高精度、高性能的傳感技術(shù)，廣泛應(yīng)用于自動(dòng)駕駛、機(jī)器人導(dǎo)航、工業(yè)自動(dòng)化、無(wú)人機(jī)等應(yīng)用領(lǐng)域。激光雷達(dá)控制板可以很好的滿足這些領(lǐng)域中對(duì)于精準(zhǔn)控制和數(shù)據(jù)處理的需求?；贔PGA

發(fā)表于 05-28 08:11 ?435次閱讀

阜時(shí)科技近期簽訂商用車自動(dòng)駕駛全固態(tài)激光雷達(dá)批量訂單

阜時(shí)科技戰(zhàn)略合作的某頭部激光雷達(dá)（LiDAR）公司，簽訂商用車自動(dòng)駕駛全固態(tài)激光雷達(dá)批量訂單，近期將陸續(xù)交付。

發(fā)表于 04-11 14:08 ?926次閱讀

激光雷達(dá)的應(yīng)用場(chǎng)景

激光雷達(dá)在多個(gè)領(lǐng)域中都有著廣泛的應(yīng)用。以下是幾個(gè)主要的應(yīng)用場(chǎng)景： 自動(dòng)駕駛汽車：激光雷達(dá)在自動(dòng)駕駛汽車中起到了至關(guān)重要的作用。它可以幫助車輛

發(fā)表于 04-10 14:59 ?852次閱讀

激光雷達(dá)的應(yīng)用場(chǎng)景

景：大氣環(huán)境監(jiān)測(cè) ：激光雷達(dá)成為對(duì)大氣進(jìn)行高精度遙感探測(cè)的有效手段。它可以探測(cè)氣溶膠、云粒子的分布、大氣成分和風(fēng)場(chǎng)的垂直廓線，對(duì)主要污染源進(jìn)行有效監(jiān)控。 自動(dòng)駕駛汽車：激光雷達(dá)在

發(fā)表于 03-21 10:38 ?739次閱讀

LabVIEW開(kāi)發(fā)自動(dòng)駕駛的雙目測(cè)距系統(tǒng)

挑戰(zhàn)，包括激光雷達(dá)、單目測(cè)距和雙目視覺(jué)技術(shù)等。在當(dāng)前的高級(jí)輔助駕駛技術(shù)（ADAS）中，雙目視覺(jué)技術(shù)在距離檢測(cè)方面表現(xiàn)出色，它可以精確地測(cè)量物體的距離，提供更客觀的數(shù)據(jù)。為了應(yīng)對(duì)這一需求，設(shè)計(jì)了一種

發(fā)表于 12-19 18:02

寶馬發(fā)力L3自動(dòng)駕駛，摩根大通看好，激光雷達(dá)公司再迎暴漲

來(lái)源：激光雷達(dá)老炮兒（略有刪改） ?2023年12月14日，寶馬集團(tuán)官方宣布，其搭載L3級(jí)別自動(dòng)駕駛功能的車輛在上海市正式獲得高快速路自動(dòng)駕駛測(cè)試牌照。未來(lái)，寶馬將在上海市政府的監(jiān)督和指導(dǎo)下，在

發(fā)表于 12-15 08:38 ?564次閱讀

自動(dòng)駕駛激光雷達(dá)特征提取

2.1 激光雷達(dá)時(shí)間序列這一幀數(shù)據(jù)中點(diǎn)的排列順序?yàn)閺淖罡叩木€束到最低的線束進(jìn)行排列，每條線束之間點(diǎn)按逆時(shí)針的順序排列。目前大部分主流激光雷達(dá)應(yīng)該都可以直接在點(diǎn)云中提供每個(gè)點(diǎn)對(duì)應(yīng)的掃

發(fā)表于 11-27 18:17 ?405次閱讀

激光雷達(dá)點(diǎn)云預(yù)處理介紹

激光雷達(dá)作為自動(dòng)駕駛最常用的傳感器，經(jīng)常需要使用激光雷達(dá)來(lái)做建圖、定位和感知等任務(wù)。而這時(shí)候使用降低點(diǎn)云規(guī)模的預(yù)處理方法，可以能夠去除無(wú)關(guān)

發(fā)表于 11-27 18:11 ?713次閱讀

探索新視界：車載激光雷達(dá)技術(shù)助力自動(dòng)駕駛

激光雷達(dá)(Lidar)又稱光學(xué)雷達(dá)，其通過(guò)向目標(biāo)發(fā)射激光脈沖并接收反射回來(lái)的信號(hào)，來(lái)測(cè)量目標(biāo)與傳感器之間的距離，具有輕便靈巧、分辨率高、抗干擾能力強(qiáng)等優(yōu)勢(shì)，在自動(dòng)駕駛領(lǐng)域發(fā)揮著重要作用

發(fā)表于 11-24 10:27 ?457次閱讀

激光雷達(dá)和毫米波雷達(dá)的區(qū)別哪個(gè)才是自動(dòng)駕駛感知的最優(yōu)選擇？

激光雷達(dá)和毫米波雷達(dá)的區(qū)別哪個(gè)才是自動(dòng)駕駛感知的最優(yōu)選擇？ 激光雷達(dá)和毫米波雷達(dá)是自動(dòng)駕駛車輛

發(fā)表于 11-22 17:41 ?7058次閱讀

自動(dòng)駕駛的激光雷達(dá)和純計(jì)算機(jī)視覺(jué)對(duì)比分析

本文將對(duì)激光雷達(dá)、攝像頭以及毫米波雷達(dá)等主流傳感器、各自動(dòng)駕駛公司的解決方案以及傳感器市場(chǎng)格局作介紹。

發(fā)表于 10-16 11:47 ?2546次閱讀