0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款只通過單個普通的2D攝像頭就能實時捕捉視頻中的3D動作的系統(tǒng)

0wvm_ARchan_TT ? 來源:未知 ? 作者:李倩 ? 2018-05-14 09:53 ? 次閱讀

動作捕捉在各行各業(yè)都有著重要的作用,我們實現(xiàn)它的方法主要有兩種。一是在電影和游戲當中經(jīng)常使用的方式,通過在關(guān)節(jié)處貼上標志來記錄運動軌跡;

二則是深度攝像頭,通過紅外來測量用戶的身體,這個大家都十分熟悉了。前者根本無法普及,后者在強光下效率低下,但擁有一個共同的優(yōu)良品質(zhì)—昂貴。

而市場上充滿的是普通智能手機,如果能夠僅僅通過普通智能手機的攝像頭實現(xiàn)身體追蹤,那這將是一個巨大的進步。

除了便宜,普通攝像頭較深度攝像頭的另一大優(yōu)勢就是視野廣,可以用于大場景的使用。同時基于紅外的深度攝像頭在戶外陽光直射的條件下難以工作,2D攝像頭卻沒有這個煩惱。

目前,馬克思普朗克計算機科學研究所的科學家們研發(fā)出了一款只通過單個普通的2D攝像頭(比如普通智能手機的攝像頭),就能實時捕捉視頻中的3D動作的系統(tǒng)。其效果可以媲美多個攝像頭或者深度攝像頭如Kinect的效果。

使用2D攝像頭獲得3D畫面是科技前沿的開發(fā)者一直在做的事情,我們曾多次提到過,簡單點說就是通過深度學習,也就是看得多了就能通過2D畫面得出3D動作,例如通過照片就能的出一個人樣貌的3D畫面。

用2D攝像頭捕捉3D動作也是科學家們一直在做的,其中骨骼姿勢是其中的一大難題。前人的解決方案中,3D關(guān)節(jié)是十分不穩(wěn)定的,會發(fā)生嚴重的偏離,重新投影時會不準確匹配2D位置。即使準確,也只是在極短的時間內(nèi),長時間下還是不穩(wěn)定的。這導致他們大多數(shù)只能穩(wěn)定捕獲局部3D動作,而不是全身。

VNect解決了時間問題,可以在短時間內(nèi)骨骼姿勢穩(wěn)定,同時還是全身動作捕捉。

VNect采用卷積神經(jīng)網(wǎng)絡(CNN),拋棄了以往的100層設計,因為運算時間過長,不適合實時運算,改為更淺的50層。同時了全新的公式,使得能以高精度輸出,同時運行在30Hz以上。

在CNN的骨骼預測當中,最重要的骨盆的3D姿勢,他們提出的姿態(tài)公式得出的結(jié)果,吻合度可與世界最先進的離線方法媲美。通過組合預測2D和3D關(guān)節(jié)位置來確保關(guān)節(jié)的穩(wěn)定,同時應用濾波步驟來確保隨著時間的推移還能夠平滑的跟蹤,提高了跟蹤姿態(tài)的穩(wěn)定性。

根據(jù)圖片拓展出來了2D熱圖,再捕獲關(guān)節(jié)的相對位置x、y、z,變?yōu)殛P(guān)節(jié)H。根據(jù)關(guān)節(jié)之間的長度計算骨骼的長度,這將成為預測動作的重要依據(jù)。采集了通常考慮的17個關(guān)節(jié),還采取了腳尖的位置。

系統(tǒng)使用的是骨骼的平均數(shù)據(jù),在剛開始的時候會有不穩(wěn)定的現(xiàn)象,因為單個攝像頭沒有其他數(shù)據(jù)可以參考,所以需要被跟蹤對象提供一次身高的數(shù)據(jù),來實現(xiàn)穩(wěn)定的追蹤。

同時系統(tǒng)是完全卷積的,可以在目標周圍缺少緊湊物的情況下運作,并能預測不同的場景,這無疑給準確的測量提供了堅實的基礎。

在訓練時,選擇了八個項目,五個與胸同高,2個與頭同高并向下傾斜,一個與膝蓋同高并向上傾斜,來學習在不同角度下保持穩(wěn)定。同時采用了多種組合,如背景、衣物(增多衣物)、障礙物(如椅子)等等。

結(jié)果是喜人的,在使用低端手機的相機條件下,在3D角色控制、姿態(tài)跟蹤等方面,質(zhì)量與深度攝像頭相當,例如Xbox上的Kinect(也就是一代和二代,可不是最新的四代)。

在速度上,CNN計算需要18ms,骨架擬合需要7到10ms,預處理和過濾需要5ms,最多時間也只有33ms。

除去前文介紹的優(yōu)勢,該方案還具備深度攝像頭不具備的功能,比如坐在凳子上或其他四肢靠近場景物體時,Kinect發(fā)生明顯錯亂,而2D解決方案卻成功了。不過當雙腿交叉時,就較為困難了,這將是一個挑戰(zhàn)。

通過VNect,任何一個智能手機都能變成輕量級的全自動手持動作捕捉傳感器,這將使許多應用變成可能,同時它還是開源的,可以使更多人參與到開發(fā)當中。

不過它也存在著許多不足,VNect腳踝追蹤十分穩(wěn)定,但頭部準確性十分差。而且單個2D攝像頭在深度捕捉上嚴重不足,任何一點細微的不準確都可能導致很大的不同。在時間上也不夠長,長時間下追蹤也會發(fā)生抖動。此外,遮擋還是一個十分嚴峻的挑戰(zhàn),十分快的運動也是。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2837

    瀏覽量

    107019
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100030
  • 手機攝像頭
    +關(guān)注

    關(guān)注

    11

    文章

    60

    瀏覽量

    34204

原文標題:開源項目VNect使用普通手機攝像頭進行動作捕捉,媲美深度攝像頭

文章出處:【微信號:ARchan_TT,微信公眾號:AR醬】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    專題:3D ToF 技術(shù)大熱,哪些方案值得關(guān)注?

    到的數(shù)據(jù),我們能準確地知道圖像每個點離攝像頭的距離,這樣加上該點在2D圖像的(x,y)坐標,就能獲取圖像
    的頭像 發(fā)表于 07-03 16:32 ?5064次閱讀

    3D掃描的結(jié)構(gòu)光

    光調(diào)制器和幀捕捉速率更高的攝像頭,而亮度更高的圖形照明也會對快速掃描有所幫助。在不同的3D測量系統(tǒng),也許需要從每秒數(shù)次到最高每秒數(shù)百次的圖
    發(fā)表于 08-30 14:51

    怎樣去設計種基于OPT9221和OPT8241的3D ToF攝像頭電路?

    3D ToF攝像頭有哪些特性?3D ToF攝像頭有哪些功能?怎樣去設計種基于OPT9221和OPT8241的
    發(fā)表于 07-04 07:15

    全球首2D/3D視頻轉(zhuǎn)換實時處理芯片:DA8223

      Dialog半導體股份有限公司日前宣布推出全球首2D/3D影像轉(zhuǎn)換實時處理芯片:DA8223.該芯片為包括智能手機和平板電腦等在內(nèi)的各種便攜式設備提供了
    發(fā)表于 12-14 09:17 ?5065次閱讀

    Xilinx與Xylon聯(lián)合發(fā)布2D/3D環(huán)視系統(tǒng)自動多攝像頭圖形拼接IP

    2015年3月6日,中國北京 - All Programmable 技術(shù)和器件的全球領(lǐng)先企業(yè)賽靈思公司(Xilinx, Inc. (NASDAQ:XLNX))攜手Xylon公司今天共同宣布推出最新面向2D/3D環(huán)視
    發(fā)表于 03-06 09:18 ?3505次閱讀

    HTC推出第一款拍攝3D影像雙攝像頭的手機

    2011 年,HTC 就推出了第一款拍攝 3D 影像雙攝像頭的手機 EVO 3D(G17),隨后HTC 推出了記錄景深數(shù)據(jù),以實現(xiàn)「先拍照后對焦」功能雙
    的頭像 發(fā)表于 04-25 16:01 ?8959次閱讀

    3D攝像頭和vcesl產(chǎn)業(yè)做個超詳細的專業(yè)科普

    電子終端加上了物體感知功能,從而引入多個“痛點型應用場景”,包括人機交互、人臉識別、三維建模、AR、安防和輔助駕駛等多個領(lǐng)域。站在當前時點,我們認為2D3D攝像頭的轉(zhuǎn)變將成為繼黑白到彩色、低分辨率到
    的頭像 發(fā)表于 02-05 09:35 ?2.6w次閱讀
    對<b class='flag-5'>3D</b><b class='flag-5'>攝像頭</b>和vcesl產(chǎn)業(yè)做<b class='flag-5'>一</b>個超詳細的專業(yè)科普

    MWC2018:奧比光成功研發(fā)手機3D攝像頭 安卓陣營進入3D人臉識別時代

    MWC2018正式拉開帷幕,在這次的展會上,聯(lián)發(fā)科戰(zhàn)略入股,奧比光成功研發(fā)手機前置3D攝像頭,最新helio P系列芯片平臺支持奧比3D
    發(fā)表于 03-02 14:49 ?1864次閱讀

    2D3D視頻自動轉(zhuǎn)換系統(tǒng)

    完成系統(tǒng)界面的設置及控制、顯示等功能,其DSP處理器實現(xiàn)圖像分割和渲染等核心算法,實現(xiàn)了1個高效的2D3D視頻視頻轉(zhuǎn)換
    發(fā)表于 03-06 14:20 ?1次下載
    <b class='flag-5'>2D</b>到<b class='flag-5'>3D</b><b class='flag-5'>視頻</b>自動轉(zhuǎn)換<b class='flag-5'>系統(tǒng)</b>

    適用于顯示屏的2D多點觸摸與3D手勢模塊

    視頻將展示結(jié)合多點觸摸與3D手勢模塊的Microchip顯示解決方案。支持2D/3D功能的顯示屏是Microchip基于GestIC?技術(shù)的最新解決方案。顯示屏上結(jié)合了
    的頭像 發(fā)表于 06-06 02:45 ?5026次閱讀

    華為將推搭載索尼傳感器的3D攝像頭手機

    華為計劃推出一款能夠支持3D攝像頭的新手機。
    的頭像 發(fā)表于 12-11 17:15 ?4397次閱讀

    手機的雙攝像頭有什么作用

    人的兩眼睛看到的世界是不同的,人腦合成兩眼睛看到的圖像后,就產(chǎn)生了立體感,能判斷出距離、看到繽紛的世界。我們?nèi)粘K吹降恼掌?b class='flag-5'>視頻都是平面的、二維的,是單個
    的頭像 發(fā)表于 02-01 10:14 ?1.8w次閱讀

    什么是TOF3D立體攝像頭技術(shù)

    不知道大家是否還記得游戲畫面從2D進化到3D時代的那種感動?唯有更加趨近真實的3D立體“視界”,才能帶給我們最為震撼和沉浸式的體驗。如今,手機攝像頭模塊也正走在從
    的頭像 發(fā)表于 05-20 10:30 ?2.8w次閱讀

    3d人臉識別和2d人臉識別的區(qū)別

    首先是3d人臉識別和2d人臉識別圖像數(shù)據(jù)獲取不同。3D人臉識別是以3D攝像頭立體成像,而2D是以
    發(fā)表于 02-05 16:00 ?4w次閱讀

    aikit 2023 3D與機械臂結(jié)合!

    引言 今天我們主要了解3D攝像頭是如何跟機械臂應用相結(jié)合的。我們最近準備推出一款新的機械臂套裝AI Kit 2023 3D,熟悉我們的老用戶應該知道,我們之前的AI Kit 2023套
    的頭像 發(fā)表于 11-28 10:38 ?816次閱讀
    aikit 2023 <b class='flag-5'>3D</b>與機械臂結(jié)合!