0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員們提出了一系列新的點云處理模塊

nlfO_thejiangme ? 來源:lq ? 2019-08-02 14:44 ? 次閱讀

點云是三維深度學(xué)習(xí)中一種重要的數(shù)據(jù)類型,研究人員們一直致力于高效準(zhǔn)確的處理點云,并基于點云實現(xiàn)分類、檢測和分割等一系列高級計算機視覺任務(wù)。自從PointNet以來,研究人員們提出了眾多基于PointNet的模型和模型變體,極大的拓展了計算機視覺對于三維點云數(shù)據(jù)的處理能力。

但是由于點云的表示和處理方法對于計算資源的消耗使得網(wǎng)絡(luò)模型無法加深,同時全局與局部的信息缺乏多層級地交互也限制了模型的表達能力。

為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員們提出了一系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了更寬、更深、更快效率更高的點云處理網(wǎng)絡(luò),讓更深的點云深度學(xué)習(xí)模型成為可能。

與圖像領(lǐng)域的深度學(xué)習(xí)架構(gòu)相比,針對點云的處理手段還比較簡單。無論是模塊的多樣性和網(wǎng)絡(luò)的寬度與深度上,點云網(wǎng)絡(luò)的架構(gòu)都還有很大的發(fā)展空間。例如PointNet和PointNet++這樣的模型架構(gòu)隨讓證明了神經(jīng)網(wǎng)絡(luò)的有效性,但是對于計算資源的巨大消耗成為了制約這類架構(gòu)發(fā)展的限制。

網(wǎng)絡(luò)內(nèi)部的每一個節(jié)點都需要攜帶所有鄰域的特征使得存儲資源消耗過大,過深的網(wǎng)絡(luò)無法高效的實現(xiàn)。而在圖像領(lǐng)域的發(fā)展經(jīng)驗表明,更深更寬的網(wǎng)絡(luò)與模型的精度有著直接的聯(lián)系。研究人員在這一工作中通過引入三方面的新結(jié)構(gòu)來改善點云處理網(wǎng)絡(luò)的精度、降低計算資源的消耗,同時提升了推理階段的運行速度。

多分辨率

研究人員引入了多分辨率用于在多個不同的尺度上處理多尺度網(wǎng)絡(luò)結(jié)構(gòu),大幅度降低了內(nèi)存占用。在PointNet++中利用不斷增加的聚類半徑來對原始點云處理多尺度信息。而在這篇文章中,研究人員直接在網(wǎng)絡(luò)早期的處理階段使用了多個不同的聚類半徑來處理,使得模型可以混合多個尺度的信息,理解多尺度上下文內(nèi)容并減少計算資源的消耗。

研究人員使用了以下采樣的方法來對原始點云進行處理,而后進行分組實現(xiàn)了不同尺度的處理。下圖顯示了多分辨率的處理方式不僅增加了某個點的領(lǐng)域感受野,同時不增加內(nèi)存占用,更好的捕獲全局的內(nèi)容信息。

圖中紅色的點表示綠色點增加的感受野

點卷積模塊

為了更加高效的獲取鄰域信息,研究人員將圖像鄰域信息的卷積概念延伸到了點云領(lǐng)域,提出了點卷積概念,在訓(xùn)練過程中更有效地混合鄰域信息。相較于PointNet++減小了67%的內(nèi)存占用,實現(xiàn)了41%的速度提升。其中的關(guān)鍵在于針對分組操作在前向傳播的過程中將中間結(jié)果及時釋放,利用單層神經(jīng)網(wǎng)絡(luò)大大加速了處理過程。

上面的算法顯示了前向和反向傳播的過程,在內(nèi)存占用和速度上同時進行了優(yōu)化。

卷積計算單元對于內(nèi)存占用的大幅下降使得更深的網(wǎng)絡(luò)成為可能。與先前的工作相比,這種結(jié)構(gòu)的網(wǎng)絡(luò)在深度增加時對計算資源需求增加地更為緩慢。

新的模型不僅在降低了初始化地內(nèi)存需求,當(dāng)層數(shù)增加時內(nèi)存的增加也較為緩慢。深度翻倍時模型地高分辨和低分辨部分地僅僅增加了16.8%和2.3%。

優(yōu)化信息流

為了綜合各個尺度下的信息實現(xiàn)更有效的點云感知,研究人員對模型進行了更深入的分析和改進。首先為了保證在模型加深時網(wǎng)絡(luò)的穩(wěn)定性,研究人員在模型中添加了殘差結(jié)構(gòu),在提高訓(xùn)練效果的同時避免了梯度消失的問題。

為了更好地利用多分辨率的信息,研究人員利用了交叉分辨率鏈接來為不同分辨率下的分支提供了信息溝通的渠道,使得高、中、低各個分辨率的信息得以有效在訓(xùn)練過程中交換,每個分辨率在專注于學(xué)習(xí)自身尺度信息的同時與其他分辨率進行信息交換,更有效地提升了訓(xùn)練和速度和推理地精度。

最終利用鄰域卷積、多分辨率交叉互聯(lián)和多分辨率點云處理等基礎(chǔ)模塊構(gòu)建出了可堆疊的深度卷積點云網(wǎng)絡(luò)。

研究人員在ShapeNet-Part,ScanNet,PartNet等數(shù)據(jù)集上對算法進行了驗證,并利用平均IOU和部分IOU等指標(biāo)評測了算法對于點云目標(biāo)分割的表現(xiàn)。研究發(fā)現(xiàn)新提出的卷積點云處理結(jié)構(gòu)對于更為復(fù)雜的數(shù)據(jù)表現(xiàn)更為優(yōu)秀。

首先多分辨率結(jié)構(gòu)為模型提供了不同尺度上的信息理解,對于不同分辨率的信息混合可以增加對于復(fù)雜數(shù)據(jù)的感知,更為關(guān)鍵的是在模型同時還在效率上實現(xiàn)了提升。在反向傳播階段時間減少了62%。

其次,交叉連接部分可以看作是不同分辨率間的信息互補,在很小的內(nèi)存開銷和速度延遲下,能在最復(fù)雜的PartNet數(shù)據(jù)集上實現(xiàn)更好的分割精度。

最后,內(nèi)存高效的卷積利用單層感知機實現(xiàn)點云特征提取移除了中間層的激活,并利用多個相同單元進行堆疊,不僅提升了2.6~3%的IOU提升,更減小了67%的內(nèi)存占用和41~68%的時間消耗。

最重要的,由于新的網(wǎng)絡(luò)模塊對于內(nèi)存的消耗減少,使得更深的點云處理網(wǎng)絡(luò)成為可能,通過殘差結(jié)構(gòu)和交叉互聯(lián)保證了深度網(wǎng)絡(luò)的穩(wěn)定性和信息的流動過程。

下圖展示了模型與PointNet++比較的一些結(jié)果,可以看到深度卷積點云網(wǎng)絡(luò)在分割任務(wù)中的的誤差更?。?/p>

基于本文提出模塊重新構(gòu)建的網(wǎng)絡(luò)模型在IOU和計算資源利用率上均有大幅度提升:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2655

    瀏覽量

    47293
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1694

    瀏覽量

    45901
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890

原文標(biāo)題:高效點云處理模塊讓更深的網(wǎng)絡(luò)成為可能!

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項新發(fā)明 新...

    據(jù)物理學(xué)家組織網(wǎng)報道,美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項極為應(yīng)景的新發(fā)明:種外形如同顆圣誕樹
    發(fā)表于 02-03 20:30

    高價收購西門子一系列型號觸摸屏PLC系列模塊

    \\\300\\\\400\西門子一系列模塊高價收購西門子6AV 6DD 6GK 西門子一系列型號、求購模塊PLC、觸摸屏、伺服電機、模擬量輸入、輸出
    發(fā)表于 09-17 10:42

    求購新舊工控觸摸屏系列模塊 高價收購西門子一系列模塊

    求購新舊工控觸摸屏系列模塊 高價收購西門子一系列模塊,收價回收西門子模塊,高價回收CPU模塊新舊
    發(fā)表于 11-30 09:30

    世平集團所代理產(chǎn)線ADI針對DSC提出一系列解決方案

    世平集團所代理產(chǎn)線ADI針對DSC提出一系列解決方案 針對DSC的應(yīng)用,提供了以下產(chǎn)品來滿足客戶的設(shè)計需求:.
    發(fā)表于 05-08 09:26 ?837次閱讀
    世平集團所代理產(chǎn)線ADI針對DSC<b class='flag-5'>提出</b><b class='flag-5'>一系列</b>解決方案

    Ryzen Pro系列處理器正式發(fā)布:提供一系列的管理和安全特性

    本周,AMD正式針對企業(yè)用戶發(fā)布了Ryzen Pro系列處理器。該系列處理器將與英特爾的vPro系列作為直接對手,與普通版本的Ryzen
    發(fā)表于 07-02 09:55 ?867次閱讀

    研究人員提出了種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7種,實現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實時同步監(jiān)測。
    的頭像 發(fā)表于 01-24 15:15 ?7196次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>種柔性可拉伸擴展的多功能集成傳感器陣列

    安的電子推出了一系列內(nèi)嵌式微功率讀寫器

    廣州安的電子科技有限公司是業(yè)內(nèi)知名的專注于RFID設(shè)備研發(fā)、生產(chǎn)、銷售和提供解決方案的高科技公司,該公司日前推出了一系列內(nèi)嵌式微功率讀寫器。
    的頭像 發(fā)表于 01-28 17:20 ?3303次閱讀

    研究人員開發(fā)出觸摸屏壓力傳感器陣列

    研究人員通過一系列測試,包括系統(tǒng)材料沉積,顯微鏡和壓電表征。最終結(jié)果:在薄的可彎曲玻璃晶圓上制造的一系列可擴展,高性能和固態(tài)力傳感器。
    發(fā)表于 07-29 11:09 ?1861次閱讀

    港中文和商湯研究提出高效的三維目標(biāo)檢測?新框架

    與二維圖像中會相互遮擋的物體不同,三維云中的物體都是天然分離的,使得三維目標(biāo)內(nèi)部各個部分的相對位置可以精確獲取,這些方法將有效提高目標(biāo)檢測方法的性能?;谶@樣的觀察結(jié)果,研究人員提出了
    的頭像 發(fā)表于 08-02 14:18 ?3467次閱讀
    港中文和商湯<b class='flag-5'>研究</b>員<b class='flag-5'>提出</b>高效的三維<b class='flag-5'>點</b><b class='flag-5'>云</b>目標(biāo)檢測?新框架

    JD和OPPO的研究人員提出了種姿勢引導(dǎo)的時尚圖像生成模型

    研究人員的主要目的在于訓(xùn)練個生成模型,將模特在當(dāng)前姿勢上的圖像遷移到其他的目標(biāo)姿勢上去,實現(xiàn)對于衣著等商品的全面展示。
    的頭像 發(fā)表于 08-02 14:50 ?2512次閱讀

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標(biāo)是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應(yīng)的三維網(wǎng)格,并對真實世界中的復(fù)雜模型進行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進并
    的頭像 發(fā)表于 08-02 15:51 ?3843次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    Waymo公開最新自動駕駛汽車數(shù)據(jù)集 并邀請相關(guān)人員參加一系列挑戰(zhàn)賽

    Waymo公開了其最新的自動駕駛汽車數(shù)據(jù)集,邀請無人駕駛汽車研究人員根據(jù)其無人駕駛車隊收集的大量數(shù)據(jù)參加一系列挑戰(zhàn)賽。 從Google分離出來的Waymo為其多傳感器數(shù)據(jù)集增加了800個新的細分。
    的頭像 發(fā)表于 03-20 15:29 ?2039次閱讀

    研究人員提出了個名為CommPlan的框架

    使用CommPlan,開發(fā)人員首先使用數(shù)據(jù),領(lǐng)域?qū)I(yè)知識和學(xué)習(xí)算法指定五個模塊-任務(wù)模型,通信功能,通信成本模型,人員響應(yīng)模型和人員可選動作模型。通過對所有
    的頭像 發(fā)表于 04-09 14:30 ?2144次閱讀

    Waymo和谷歌合作提出一系列用于自動駕駛行為預(yù)測的模型

    Waymo 近期宣布在鳳凰城地區(qū)開放沒有安全員的無人駕駛出租車,實現(xiàn)首個商用的真正的無人駕駛。與此同時,Waymo 也公開分享了一系列新的研究論文,本文就來講解下 Waymo 在行為預(yù)測方面的
    的頭像 發(fā)表于 10-19 12:00 ?1907次閱讀
    Waymo和谷歌合作<b class='flag-5'>提出</b><b class='flag-5'>一系列</b>用于自動駕駛行為預(yù)測的模型

    阿里在海外市場發(fā)布一系列AI大數(shù)據(jù)產(chǎn)品

    近日,阿里宣布面向海外市場發(fā)布一系列AI計算及大數(shù)據(jù)產(chǎn)品,進步擴大其在全球市場的份額。這一系列新產(chǎn)品涵蓋了serverless模式的AI服務(wù)平臺、整合向量引擎技術(shù)的大數(shù)據(jù)產(chǎn)品等,旨
    的頭像 發(fā)表于 02-05 11:30 ?978次閱讀