0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SkeletonNet:完整的人體三維位姿重建方法

nlfO_thejiangme ? 來源:lq ? 2019-01-06 10:43 ? 次閱讀

從單張圖片中估計(jì)人體的三維位姿是計(jì)算機(jī)視覺中一個(gè)重要的問題,不僅可以在人體重構(gòu)和行為監(jiān)控上發(fā)揮作用,更為機(jī)器人控制和遠(yuǎn)程執(zhí)行提供了潛在的解決方案。卷積網(wǎng)絡(luò)可以有效的從圖像中檢測人體的關(guān)鍵點(diǎn),得到精確的2D關(guān)節(jié)位置。但想要直接通過2D關(guān)節(jié)位置學(xué)習(xí)出包含關(guān)節(jié)位置和骨骼旋轉(zhuǎn)角度的3D位姿是十分困難的,需要解決高度非線性的映射問題。最近,日本產(chǎn)業(yè)綜合技術(shù)研究院的研究人員提出了一種新的方法,通過結(jié)合骨骼結(jié)構(gòu)的回歸器和基于3D位姿表達(dá)的交叉熱力圖回歸,實(shí)現(xiàn)了端到端的3D人體位姿預(yù)測,不僅能從單張RGB圖中預(yù)測出關(guān)節(jié)位置,同時(shí)還能準(zhǔn)確得到連接在關(guān)節(jié)上的骨骼角度。此外研究人員還豐富了已有的MPII數(shù)據(jù)集并進(jìn)行了有效的三維標(biāo)注。

預(yù)測三維位姿存在的挑戰(zhàn)

最近在人體位姿估計(jì)方面的工作取得了很大進(jìn)展,但例如像OpenPose等模型只能生成2D層面的關(guān)節(jié)信息,生成3D的關(guān)節(jié)信息面臨著一系列挑戰(zhàn)。首先,需要對三維的關(guān)節(jié)位姿進(jìn)行準(zhǔn)確有效的表達(dá),這關(guān)系到最終預(yù)測的精度。先前的方法使用了熱力圖(體積和2D熱力圖+深度)的方法實(shí)現(xiàn)了精確的3D位姿預(yù)測。但目前利用卷積網(wǎng)絡(luò)預(yù)測3D關(guān)節(jié)還沒有獲得較好的效果。此外對于應(yīng)用的角度,人們希望能夠同時(shí)獲得關(guān)節(jié)的位置和角度,即骨骼每一部分在空間中的位姿其次,對于3D人體位姿估計(jì)任務(wù)缺乏良好的、充分的數(shù)據(jù)集。相比2D的數(shù)據(jù),3D關(guān)節(jié)位姿標(biāo)記更為復(fù)雜耗時(shí)。雖然可以利用運(yùn)動(dòng)捕捉系統(tǒng)(MoCap)和RGB相機(jī)同時(shí)記錄,但其獲得的場景有限。例如Human 3.6M數(shù)據(jù)集只包含了10種物體的周圍場景,使模型不能得到充分訓(xùn)練。

新方法

人體的骨骼結(jié)構(gòu)具有天然的連續(xù)性和固定的結(jié)構(gòu)空間,可以作為三維位姿估計(jì)的一個(gè)約束來使用。在機(jī)器人和生物力學(xué)領(lǐng)域,研究人員們經(jīng)常會使用正逆運(yùn)動(dòng)學(xué)的研究方法,在統(tǒng)計(jì)模型和人體骨架的約束下(骨骼相對長度、關(guān)節(jié)運(yùn)動(dòng)空間和對稱性等),從MoCap的2D關(guān)鍵點(diǎn)結(jié)果計(jì)算出3D位姿。在這一工作中,研究人員提出了SkeletonNet模型,通過結(jié)合骨骼結(jié)構(gòu)和關(guān)節(jié)3D位置的熱力圖表示實(shí)現(xiàn)了3D人體關(guān)節(jié)位姿的高精度估計(jì)。這一模型主要由負(fù)責(zé)從輸入圖像獲得初始解的骨旋轉(zhuǎn)網(wǎng)絡(luò),基于此利用卷積熱力圖回歸器來恢復(fù)出更為精確的結(jié)果。模型的架構(gòu)如下圖所示:

骨旋轉(zhuǎn)回歸器(Bone rotation regressor)。首先,骨旋轉(zhuǎn)回歸器的任務(wù)是從輸入圖像中預(yù)測出人體全局的選擇信息以及每一個(gè)骨頭相對于整體的局部旋轉(zhuǎn)信息。由于人體骨骼構(gòu)造的特性,人體的全局位姿特征具有一系列離散的模式。例如坐姿、站立和躺下等姿勢都可以用離散的全局模式來表示,所以研究人員利用了分類器的原理來預(yù)測全局位姿。此外,每一個(gè)關(guān)節(jié)的運(yùn)動(dòng)空間在一定范圍內(nèi)是連續(xù)的,這意味著關(guān)節(jié)的局部角度預(yù)測可以用回歸模型很好的建模。

正交化(Gram Schmidt orthogonalization layer)。在通過分類器得到全局位姿RotG以及每個(gè)關(guān)節(jié)的局部旋轉(zhuǎn)RotB后,相乘就可以得到關(guān)節(jié)位姿的初始解了。但此時(shí)面臨著一個(gè)問題,如果這兩個(gè)矩陣不是正交陣的話,生成的位姿在尺度和外形上就會畸變。為了解決這個(gè)問題,研究人員又在結(jié)果添加了格拉姆施密特正交層來對先前得到的矩陣進(jìn)行變換。將變換后的選擇矩陣相乘就可以得到每個(gè)關(guān)節(jié)有效的初始位姿,并通過初始位置矢量和角度關(guān)系計(jì)算得到關(guān)節(jié)的絕對位置。交叉熱力圖回歸器(Cross heatmap regressor)。為了得到更為精確的結(jié)果,研究人員們提出了交叉熱力圖的方法來優(yōu)化每個(gè)關(guān)節(jié)三維位姿的最終預(yù)測。這種交叉熱力圖由xy和zy方向堆疊的熱力圖構(gòu)成,兩個(gè)平面足夠描述關(guān)節(jié)在三維空間中的信息。將關(guān)節(jié)的三維位置投影到二維坐標(biāo)中,并經(jīng)過一系列可微運(yùn)算可以得到每個(gè)關(guān)節(jié)的交叉熱力圖,通過回歸來優(yōu)化最終關(guān)節(jié)位置。最終的網(wǎng)絡(luò)的損失函數(shù)如下所示:

分別表示全局選擇、每個(gè)骨頭的旋轉(zhuǎn)、最終的旋轉(zhuǎn)、位置和交叉熱力圖損失。

數(shù)據(jù)集

為了對網(wǎng)絡(luò)進(jìn)行充分的訓(xùn)練,研究人員對MPII數(shù)據(jù)進(jìn)行了3D標(biāo)注,利用PMP(projected matching pursuit)等方法得到了原數(shù)據(jù)集中關(guān)節(jié)的三維位置,并利用標(biāo)注工具標(biāo)注了3D位姿。最終得到了10291張標(biāo)記圖像。

結(jié)果

實(shí)驗(yàn)在重建誤差、旋轉(zhuǎn)和MPJPE(每關(guān)節(jié)平均位置誤差)上到得到了較好的結(jié)果。相較于今年cvpr的87.97mm的結(jié)果,這篇文章的MPJPE達(dá)到了69.9mm。

下圖中可以清楚的看到使用了格拉姆正交矩陣和交叉熱力圖對結(jié)果的提升作用,其中正交化讓生成結(jié)果的尺度和外形更加合理,而熱力圖回歸則大幅度的提高了模型預(yù)測的精度。

研究人員希望在未來繼續(xù)探索基于圖像的人體監(jiān)測應(yīng)用,包括從單張圖像檢測人體的形態(tài)、體重、接觸力甚至關(guān)節(jié)的扭矩等等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28109

    瀏覽量

    205861
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1694

    瀏覽量

    45901
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24621

原文標(biāo)題:SkeletonNet:完整的人體三維位姿重建方法

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無序抓取系統(tǒng)?三維重建無序抓取系統(tǒng)是由哪些部分組成的?三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)?
    發(fā)表于 07-02 06:29

    如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)

    基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)?如何去開發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)?基于RGB-D相機(jī)與機(jī)械臂的三維重建無序抓取系統(tǒng)是由哪些部分組成的?
    發(fā)表于 09-08 06:12

    無人機(jī)三維建模的信息

    項(xiàng)目需要調(diào)研一下無人機(jī)三維建模的信息無人機(jī)三維建模核心技術(shù)是三維重建,或者說基于圖片的建模(Image-Based Modeling)。項(xiàng)目需要是建立園區(qū)的三維模型,其他應(yīng)用上可以用于
    發(fā)表于 09-16 06:55

    基于部件分解的三維服裝人體建模

    提出基于部件分解的三維服裝人體建模方法,通過去噪處理和人體特征點(diǎn)識別使三維人體掃描數(shù)據(jù)分解為若干
    發(fā)表于 04-01 09:24 ?18次下載

    基于激光掃描儀的樹干三維重建方法研究

    本文介紹了一種利用三維激光掃描儀,對樹木枝干進(jìn)行三維重建方法。首先利用激光掃描儀獲取一系列樹木枝干的坐標(biāo)數(shù)據(jù),繼而通過篩選這些數(shù)據(jù)來重建一系列樹木枝干的片
    發(fā)表于 01-22 11:58 ?31次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對這個(gè)問題,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于FPGA(Field Programmable Gate Array,現(xiàn)場可編
    發(fā)表于 03-15 13:52 ?44次下載

    人體特殊動(dòng)作三維動(dòng)畫建模與渲染方法改進(jìn)研究

    人體特殊動(dòng)作三維動(dòng)畫建模與渲染方法改進(jìn)研究_孔素然
    發(fā)表于 01-07 20:49 ?0次下載

    基于非量測相片的三維模型重建

    隨著地球數(shù)字化、信息化、智能化的發(fā)展,快速將物體的原態(tài)呈現(xiàn)出來,建立物體的三維模型成為當(dāng)前的研究熱點(diǎn)。目前,已有的三維模型重建方法由于效率低、周期長、成本高、受限大,而不能廣泛服務(wù)日常
    發(fā)表于 02-23 10:30 ?0次下載
    基于非量測相片的<b class='flag-5'>三維</b>模型<b class='flag-5'>重建</b>

    如何使用智能手機(jī)進(jìn)行三維模型重建方法概述

    模型重建方法。利用智能手機(jī)拍攝物體,通過計(jì)算相機(jī)內(nèi)部參數(shù)和目標(biāo)物體的三維信息,生成物體表面的密集點(diǎn)云數(shù)據(jù),并根據(jù)點(diǎn)云數(shù)據(jù)建立三維模型。最終以三維
    發(fā)表于 11-15 16:15 ?13次下載
    如何使用智能手機(jī)進(jìn)行<b class='flag-5'>三維</b>模型<b class='flag-5'>重建</b>的<b class='flag-5'>方法</b>概述

    中山大學(xué)HCP實(shí)驗(yàn)室PAMI論文:低成本、可擴(kuò)展的三維人體姿預(yù)測應(yīng)用

    ground-truth。估計(jì)的3D姿被重新映射到圖像中,并在側(cè)面 (圖像旁邊) 顯示出來。如圖所示,與(a)相比,(b)中預(yù)測的3D姿得到了顯著的修正。紅色和綠色分別表示
    的頭像 發(fā)表于 01-26 09:43 ?5569次閱讀

    淺析面向圖像三維重建的無人機(jī)航線規(guī)劃

    隨著無人機(jī)技術(shù)的發(fā)展,無人機(jī)序列影像三維重建越來越受到人們的關(guān)注。為完整重建任務(wù)區(qū)域的三維模型并減少無
    的頭像 發(fā)表于 04-06 08:58 ?3994次閱讀
    淺析面向圖像<b class='flag-5'>三維重建</b>的無人機(jī)航線規(guī)劃

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維
    的頭像 發(fā)表于 01-09 14:26 ?2240次閱讀

    三維重建:從入門到入土

    經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline從相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SFM),從SFM到稠密點(diǎn)云重建、表面重建、紋理貼圖。熟悉SFM的工程師已經(jīng)是行業(yè)內(nèi)的佼佼者,能掌握
    的頭像 發(fā)表于 03-03 10:17 ?1107次閱讀

    如何實(shí)現(xiàn)整個(gè)三維重建過程

    在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識,而多視圖的三維重建
    發(fā)表于 09-01 11:06 ?1591次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過程

    基于光學(xué)成像的物體三維重建技術(shù)研究

    三維重建的一種重要方法,具有成本低、精度高等優(yōu)點(diǎn),因此越來越受到人們的關(guān)注和青睞。本文就基于光學(xué)成像的物體三維重建技術(shù)進(jìn)行研究和探討。
    的頭像 發(fā)表于 09-15 09:29 ?850次閱讀
    基于光學(xué)成像的物體<b class='flag-5'>三維重建</b>技術(shù)研究