日本免费中文字幕在线视频,向日葵视频色板下载安装,老外把我添高潮了A片

首發(fā)：AIWalker

標(biāo)題&作者團(tuán)隊(duì)

1. 論文簡要

在這項(xiàng)工作中，視頻中的3D姿態(tài)可以通過全卷積模型來估計，具體是在二維關(guān)鍵點(diǎn)上通過空洞時間卷積的模型得到3D姿態(tài)。我們還介紹了一種不帶標(biāo)簽（反向投影）的半監(jiān)督式訓(xùn)練方法。我們先從未標(biāo)注視頻中得到2D姿態(tài)，然后估計3D姿態(tài)和最后反向投影到輸入的2D關(guān)鍵點(diǎn)。在實(shí)驗(yàn)中，全卷積模型相比之前state-of-arts，在Human3.6 M上平均每個關(guān)節(jié)位置誤差小6mm，對應(yīng)誤差降低11%，模型在HumanEva-I中也有顯著改進(jìn)。

代碼和模型的下載地址：https://github.com/facebookre...

2. 背景介紹

我們的工作重點(diǎn)是視頻中的三維人體姿態(tài)估計。我們以最先進(jìn)的方法為基礎(chǔ)，然后將問題描述為2D關(guān)鍵點(diǎn)檢測三維姿態(tài)估計，這種方法可能導(dǎo)致不同的3D姿態(tài)對應(yīng)相同的2D關(guān)鍵點(diǎn)。早期為解決這一問題主要通過RNN構(gòu)建時序信息，但是由于RNN的串行結(jié)構(gòu)無法多幀并行處理，因此本文提出一個完整的卷積架構(gòu)，在二維關(guān)鍵點(diǎn)上執(zhí)行時序卷積用于視頻中準(zhǔn)確的三維姿態(tài)預(yù)測，該方法兼容任何二維關(guān)鍵點(diǎn)檢測器，并能通過空洞卷積有效地處理較大的上下文信息。與依賴RNNs的方法相比，它在計算復(fù)雜度和參數(shù)數(shù)量方面都提供了更高的精度、簡單性和效率。

在構(gòu)建一個高度精確和高效的架構(gòu)之后，接下來需要關(guān)注訓(xùn)練數(shù)據(jù)，本文引入了半監(jiān)督訓(xùn)練的方案，因?yàn)?D姿態(tài)的監(jiān)督學(xué)習(xí)需要大量的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)，收集3D人體姿態(tài)標(biāo)簽需要昂貴的動作捕捉設(shè)備和長時間錄制。本文的方法的靈感來自于無監(jiān)督機(jī)器翻譯中的循環(huán)一致性，即翻譯到中間語言和翻譯回原始語言的往返應(yīng)該接近恒等函數(shù)。具體地說，使用現(xiàn)有的2D關(guān)鍵點(diǎn)檢測器為未標(biāo)記的視頻預(yù)測2D關(guān)鍵點(diǎn)，然后預(yù)測3D姿態(tài)，最后將它們映射回2D空間中。

本文創(chuàng)新點(diǎn)有兩個：（1）在網(wǎng)絡(luò)結(jié)構(gòu)方面，基于空洞時序卷積將2D關(guān)鍵點(diǎn)軌跡推理出3D人體姿態(tài)，在計算量和模型參數(shù)量上遠(yuǎn)小于基于RNN的模型；（2）在訓(xùn)練數(shù)據(jù)方面，采用半監(jiān)督學(xué)習(xí)解決數(shù)據(jù)量不足的問題，相比于其他方法，該方法僅僅需要相機(jī)內(nèi)部參數(shù)（數(shù)據(jù)增強(qiáng)的過程中需要相機(jī)參數(shù)對ground-truth姿態(tài)進(jìn)行幾何變換），不需要2D標(biāo)簽或帶有外部攝像機(jī)參數(shù)的多視圖圖像。

image-20201126105219606

3. 相關(guān)工作

在深度學(xué)習(xí)成功之前，大部分的三維姿態(tài)估計方法都是基于特征工程和骨骼和關(guān)節(jié)靈活性的假設(shè)。目前大多數(shù)的姿態(tài)估計方法是在二維姿態(tài)估計器的基礎(chǔ)上，建立了一種新的三維姿態(tài)估計器，然后被提升到3D空間中。

視頻姿態(tài)估計，大多數(shù)以前的工作都是在單幀的背景下進(jìn)行的，但最近幾年利用視頻的時間信息來產(chǎn)生更可靠的預(yù)測，并降低對噪音的敏感性。最近，有人提出了LSTM序列到序列學(xué)習(xí)模型，該模型將視頻中的二維姿態(tài)序列編碼為固定大小的向量，然后解碼為三維姿態(tài)序列。然而，輸入和輸出序列具有相同的長度，2D姿態(tài)的確定性轉(zhuǎn)換是更自然的選擇。用seq2seq模型進(jìn)行的實(shí)驗(yàn)表明，輸出姿勢在較長的序列上容易產(chǎn)生漂移。

4. 本文方法

4.1 時序空洞卷積模型

image-20201126112311029

我們的模型是一個具有殘差結(jié)構(gòu)的完全卷積的架構(gòu)，它將一個2D姿態(tài)序列作為輸入，并通過時間卷積對其進(jìn)行轉(zhuǎn)換。卷積模型允許在批處理維度和時間維度上并行化，而RNNs不能在時間維度上并行化。在卷積模型中，無論序列長度如何，輸出和輸入之間的梯度路徑都是固定長度的，這可以緩解影響RNN的消失和爆炸梯度。卷積架構(gòu)也提供了對時間感受域的精確控制，這有利于建立三維姿態(tài)估計任務(wù)的時間依賴模型。此外，使用空洞卷積能夠?qū)﹂L期依賴關(guān)系進(jìn)行建模，同時也保持較高計算效率。（上圖表示帶有2D關(guān)鍵點(diǎn)的243幀圖像，經(jīng)過網(wǎng)絡(luò)推理得到3D關(guān)節(jié)點(diǎn)）

4.2 半監(jiān)督訓(xùn)練方法

image-20201126113555405

本文引入了一種半監(jiān)督訓(xùn)練方法，以提高真實(shí)的標(biāo)記數(shù)據(jù)不足的情況下的模型的準(zhǔn)確性。我們利用未標(biāo)記的視頻，然后結(jié)合一個現(xiàn)成的2D關(guān)鍵點(diǎn)檢測器，來擴(kuò)展監(jiān)督損失函數(shù)一個反向投影損失項(xiàng)。解決了未標(biāo)記數(shù)據(jù)的自動編碼問題：編碼器（位姿估計器）根據(jù)二維關(guān)節(jié)坐標(biāo)進(jìn)行三維位姿估計，解碼器（投影層）將三維位姿投影回二維關(guān)節(jié)坐標(biāo)。當(dāng)來自解碼器的二維關(guān)節(jié)坐標(biāo)遠(yuǎn)離原始輸入時，訓(xùn)練就會受到懲罰。

上圖將監(jiān)督組件與充當(dāng)正則化器的非監(jiān)督組件組合在一起。這兩個目標(biāo)是共同優(yōu)化的，標(biāo)記數(shù)據(jù)占據(jù)Batch的前半部分，未標(biāo)記數(shù)據(jù)占據(jù)Batch的后半部分一半。對于標(biāo)記數(shù)據(jù)，我們使用真實(shí)三維姿態(tài)作為目標(biāo)，訓(xùn)練一個監(jiān)督損失。未標(biāo)記的數(shù)據(jù)用于實(shí)現(xiàn)自動編碼器損失，其中預(yù)測的3D姿態(tài)被投影回2D，然后檢查與輸入的一致性。

軌跡模型，由于透視投影，屏幕上的2D姿態(tài)都取決于軌跡（人體根節(jié)點(diǎn)整體位置，可以理解成人體中心點(diǎn)）和3D姿態(tài)（所有關(guān)節(jié)點(diǎn)相對于根關(guān)節(jié)的位置）。目標(biāo)函數(shù)為每個關(guān)節(jié)的加權(quán)平均軌跡的位置誤差（WMPJPE）。

骨骼長度損失，添加一個軟約束來近似匹配未標(biāo)記batch的受試者與已標(biāo)記batch的受試者的平均骨長度。

5. 實(shí)驗(yàn)論證

5.1 數(shù)據(jù)集與評價標(biāo)準(zhǔn)

數(shù)據(jù)集有兩個分別是Human3.6M，HumanEva-I，評價標(biāo)準(zhǔn)是Protocol 1: MPJPE（每個關(guān)節(jié)點(diǎn)的平均誤差）， Protocol 2：P-MPJPE（與標(biāo)簽數(shù)據(jù)對準(zhǔn)后的平移、旋轉(zhuǎn)、縮放誤差），Protocol 3：N-MPJPE（只在比例上與真實(shí)標(biāo)簽相匹配）

5.2 2D姿態(tài)估計

2D姿態(tài)估計網(wǎng)絡(luò)模型：stacked hourglass detector, Mask R-CNN with ResNet-101-FPN，CPN

5.3 3D姿態(tài)估計

image-20201126140916717

image-20201126141002629

image-20201126141144006

6. 總結(jié)

介紹了一個簡單的完全卷積模型用于視頻中三維人體姿態(tài)估計。網(wǎng)絡(luò)結(jié)構(gòu)利用時間信息在2D關(guān)鍵點(diǎn)軌跡上進(jìn)行空洞卷積。這項(xiàng)工作的第二個貢獻(xiàn)是反向投影，這是一種半監(jiān)督訓(xùn)練方法，在標(biāo)記數(shù)據(jù)稀缺的情況下提高性能。該方法適用于未標(biāo)記的視頻，只需要內(nèi)在的攝像機(jī)參數(shù)，使其在運(yùn)動捕捉具有挑戰(zhàn)性的場景中切實(shí)可行。

7. 論文復(fù)現(xiàn)

居然還有這樣的10.1寸光場裸眼3D視覺訓(xùn)練平板電腦？

在這個科技飛速發(fā)展的時代，我們?yōu)槟鷰砹艘豢罡锩缘漠a(chǎn)品——10.1寸光場裸眼3D視覺訓(xùn)練平板電腦。這款平板電腦不僅讓您無需佩戴3D眼鏡就能享受逼真的立體視覺效果，還通過先進(jìn)的技術(shù)幫助您緩解眼疲勞，提升視覺健康。

發(fā)表于 07-25 14:09 ?131次閱讀

居然還有這樣的10.1寸光場裸眼<b class='flag-5'>3D</b>視覺<b class='flag-5'>訓(xùn)練</b>平板電腦？

神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分，其訓(xùn)練方式多樣，其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模式或規(guī)律，從而提取有用的特征表示。這種

發(fā)表于 07-09 18:06 ?573次閱讀

卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

、訓(xùn)練過程以及應(yīng)用場景。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義卷積神經(jīng)網(wǎng)絡(luò)是一種前饋深度學(xué)習(xí)模型，其核心思想是利用卷積

發(fā)表于 07-03 09:15 ?220次閱讀

除了令人驚嘆的裸眼3D顯示技術(shù)，英倫科技裸眼3D視覺訓(xùn)練一體機(jī)還具備哪些特點(diǎn)？

革命性的產(chǎn)品——英倫科技裸眼3D視覺訓(xùn)練一體機(jī)，它不僅帶來了震撼的視覺效果，還能夠幫助用戶改善視力，緩解視力疲勞。

發(fā)表于 06-04 09:28 ?270次閱讀

除了令人驚嘆的裸眼<b class='flag-5'>3D</b>顯示技術(shù)，英倫科技裸眼<b class='flag-5'>3D</b>視覺<b class='flag-5'>訓(xùn)練</b>一體機(jī)還具備哪些特點(diǎn)？

機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

通過自主開發(fā)的3D掃描儀可獲準(zhǔn)確并且快速地獲取場景的點(diǎn)云圖像，通過3D識別算法，可實(shí)現(xiàn)在對點(diǎn)云圖中的多種目標(biāo)物體進(jìn)行識別和位姿估計。

發(fā)表于 04-29 09:31 ?255次閱讀

機(jī)器人<b class='flag-5'>3D</b>視覺引導(dǎo)系統(tǒng)框架介紹

3D動畫原理：電阻

電阻3D

深圳崧皓電子

發(fā)布于 :2024年03月19日 06:49:19

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計模型部署前期準(zhǔn)備

Bottom-up類型的。 3、Openpose/lightweight openpose模型首先要用到的是Openpose模型，這應(yīng)該是最有名的人體姿態(tài)估計的模型了，因?yàn)槭鞘讉€開源的人體姿

發(fā)表于 01-01 01:04

3D人體生成模型HumanGaussian實(shí)現(xiàn)原理

在 3D 生成領(lǐng)域，根據(jù)文本提示創(chuàng)建高質(zhì)量的 3D 人體外觀和幾何形狀對虛擬試穿、沉浸式遠(yuǎn)程呈現(xiàn)等應(yīng)用有深遠(yuǎn)的意義。傳統(tǒng)方法需要經(jīng)歷一系列人工制作的過程，如 3D 人體模型回歸、綁定、蒙皮、紋理貼圖

發(fā)表于 12-20 16:37 ?1304次閱讀

一個用于6D姿態(tài)估計和跟蹤的統(tǒng)一基礎(chǔ)模型

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose，是一個用于 6D 姿態(tài)估計和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像，F(xiàn)oundationPose就可以在測試時立即應(yīng)用于新物體，無需任何微

發(fā)表于 12-19 09:58 ?685次閱讀

提供3D打印材料與解決方案，助力3D打印產(chǎn)業(yè)發(fā)展

提供3D打印材料與解決方案，助力3D打印產(chǎn)業(yè)發(fā)展

發(fā)表于 12-12 11:12 ?391次閱讀

3D 封裝與 3D 集成有何區(qū)別？

3D 封裝與 3D 集成有何區(qū)別？

發(fā)表于 12-05 15:19 ?760次閱讀

動態(tài)場景下的自監(jiān)督單目深度估計方案

自監(jiān)督單目深度估計的訓(xùn)練可以在大量無標(biāo)簽視頻序列來進(jìn)行，訓(xùn)練集獲取很方便。但問題是，實(shí)際采集的視頻序列往往會有很多動態(tài)物體，而自監(jiān)督

發(fā)表于 11-28 09:21 ?484次閱讀

當(dāng)芯片變身 3D系統(tǒng)，3D異構(gòu)集成面臨哪些挑戰(zhàn)

當(dāng)芯片變身 3D 系統(tǒng)，3D 異構(gòu)集成面臨哪些挑戰(zhàn)

發(fā)表于 11-24 17:51 ?617次閱讀

基于飛控的姿態(tài)估計算法作用及原理

? 姿態(tài)估計的作用？ 姿態(tài)估計是飛控算法的一個基礎(chǔ)部分，而且十分重要。為了完成飛行器平穩(wěn)的姿態(tài)控制，首先需要精準(zhǔn)的

發(fā)表于 11-13 11:00 ?776次閱讀

如何利用CLIP 的2D 圖像-文本預(yù)習(xí)知識進(jìn)行3D場景理解

自我監(jiān)督學(xué)習(xí)的目的是獲得有利于下游任務(wù)的良好表現(xiàn)。主流的方法是使用對比學(xué)習(xí)來與訓(xùn)練網(wǎng)絡(luò)。受CLIP成功的啟發(fā)，利用CLIP的預(yù)訓(xùn)練模型來完成下游任務(wù)引起了廣泛的關(guān)注。本文利用圖像文本預(yù)先訓(xùn)練

發(fā)表于 10-29 16:54 ?1174次閱讀

搜索歷史

3D姿態(tài)估計時序卷積+半監(jiān)督訓(xùn)練

1. 論文簡要

2. 背景介紹

3. 相關(guān)工作

4. 本文方法

4.1 時序空洞卷積模型

4.2 半監(jiān)督訓(xùn)練方法

5. 實(shí)驗(yàn)論證

5.1 數(shù)據(jù)集與評價標(biāo)準(zhǔn)

5.2 2D姿態(tài)估計

5.3 3D姿態(tài)估計

6. 總結(jié)

7. 論文復(fù)現(xiàn)

推薦閱讀

評論

居然還有這樣的10.1寸光場裸眼3D視覺訓(xùn)練平板電腦？

神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

除了令人驚嘆的裸眼3D顯示技術(shù)，英倫科技裸眼3D視覺訓(xùn)練一體機(jī)還具備哪些特點(diǎn)？

機(jī)器人3D視覺引導(dǎo)系統(tǒng)框架介紹

3D動畫原理：電阻

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計模型部署前期準(zhǔn)備

3D人體生成模型HumanGaussian實(shí)現(xiàn)原理

一個用于6D姿態(tài)估計和跟蹤的統(tǒng)一基礎(chǔ)模型

提供3D打印材料與解決方案，助力3D打印產(chǎn)業(yè)發(fā)展

3D 封裝與 3D 集成有何區(qū)別？

動態(tài)場景下的自監(jiān)督單目深度估計方案

當(dāng)芯片變身 3D系統(tǒng)，3D異構(gòu)集成面臨哪些挑戰(zhàn)

基于飛控的姿態(tài)估計算法作用及原理

如何利用CLIP 的2D 圖像-文本預(yù)習(xí)知識進(jìn)行3D場景理解

搜索歷史

3D姿態(tài)估計 時序卷積+半監(jiān)督訓(xùn)練

1. 論文簡要

2. 背景介紹

3. 相關(guān)工作

4. 本文方法

4.1 時序空洞卷積模型

4.2 半監(jiān)督訓(xùn)練方法

5. 實(shí)驗(yàn)論證

5.1 數(shù)據(jù)集與評價標(biāo)準(zhǔn)

5.2 2D姿態(tài)估計

5.3 3D姿態(tài)估計

6. 總結(jié)

7. 論文復(fù)現(xiàn)

推薦閱讀

評論

3D姿態(tài)估計時序卷積+半監(jiān)督訓(xùn)練