0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

三維實體檢測解決方案

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2021-01-19 14:45 ? 次閱讀

僅僅通過在照片上訓練模型,機器學習(ML)的最新技術就已經(jīng)在許多計算機視覺任務中取得了卓越的準確性。在這些成功的基礎上,進一步提高對3D對象的理解,這將極大地促進更廣泛的應用,例如增強現(xiàn)實,機器人技術,自主性和圖像檢索。

今年早些時候,我們發(fā)布了MediaPipe Objectron,這是一套針對移動設備設計的實時3D對象檢測模型,這些模型在經(jīng)過完全注釋(annotated)的真實3D數(shù)據(jù)集上進行了訓練,可以預測對象的3D邊界框。

然而,由于與2D任務(例如ImageNet,COCO和Open Images)相比,因為缺少大型真實數(shù)據(jù)集,所以了解3D對象仍然是一項具有挑戰(zhàn)性的任務。為了使研究社區(qū)能夠不斷提高三維實體的理解,迫切需要發(fā)布以對象為中心視頻數(shù)據(jù)集,該數(shù)據(jù)集可以捕獲對象的更多3D結構,同時匹配用于許多視覺任務的數(shù)據(jù)格式(例如視頻或攝像機流),以幫助訓練和確定機器學習模型的基準。

今天,我們很高興發(fā)布Objectron數(shù)據(jù)集,這是一個短的,以對象為中心的視頻剪輯的集合,可以從不同的角度捕獲更大的一組公共對象。每個視頻剪輯都隨附有AR會話元數(shù)據(jù),其中包括相機姿勢和稀疏點云。除此之外,數(shù)據(jù)還包含每個對象手工標注的3D邊框,用來描述對象的位置,方向和尺寸。數(shù)據(jù)集包括15K帶注釋的視頻剪輯,并補充了從不同地理區(qū)域的樣本中收集的超過4M帶注釋的圖像(覆蓋五大洲的10個國家/地區(qū))。

三維實體檢測解決方案

除了和數(shù)據(jù)集一起之外,我們還將共享一個針對四類對象的三維實體檢測解決方案-鞋子,椅子,杯子和照相機。這些模型在MediaPipe中發(fā)布,MediaPipe是Google的跨平臺可定制ML解決方案的開源框架,適用于實時和流媒體,該解決方案還支持設備上的實時手部,虹膜和身體姿勢跟蹤等ML解決方案。

在移動設備上運行的3D對象檢測解決方案的示例結果

與以前發(fā)布的單階段Objectron模型相反,這些最新版本使用兩級架構。第一階段采用TensorFlow對象檢測模型來查找實體的2D裁剪。然后,第二階段使用圖像裁剪來估計3D邊框,同時為下一幀計算實體的2D裁剪,因此實體檢測器不需要運行每個幀。第二階段3D邊框預測器在Adreno 650移動GPU上以83 FPS運行。

a52aa03c-4ec2-11eb-8b86-12bb97331649.png

參考3D對象檢測解決方案圖

3D對象檢測的評估指標

借助ground truth annotations,我們使用3Dintersection over union(IoU)相似度統(tǒng)計信息(一種用于計算機視覺任務的常用度量標準)來評估三維實體檢測模型的性能,該度量標準衡量邊框與地面真相的接近程度。

我們提出了一種算法,可為通用三維面向盒計算準確的3D IoU值。首先,我們使用Sutherland-Hodgman多邊形裁剪算法計算兩個盒子的面之間的交點。這類似于用于計算機圖形學的視錐剔除技術。相交的體積由所有修剪的多邊形的凸包計算。最后,根據(jù)兩個框的交點的體積和并集的體積計算IoU。我們將在發(fā)表數(shù)據(jù)集的同時發(fā)布評估指標的源代碼。

使用多邊形裁剪算法計算并集的三維交點(左):通過對方框裁剪多邊形計算每個面的交點。右:通過計算所有交點的凸包計算交點的體積(綠色)。

數(shù)據(jù)集格式

數(shù)據(jù)集的技術細節(jié),包括用法和教程,可在數(shù)據(jù)集網(wǎng)站上找到。數(shù)據(jù)集包括自行車,書籍,瓶子,照相機,谷物盒,椅子,杯子,筆記本電腦和鞋子,并存儲在Google Cloud存儲上的objectron存儲桶中,具有以下資源:

視頻片段

注釋標簽(實體的3D邊框)

AR元數(shù)據(jù)(例如照相機姿勢,點云和平面)

已處理的數(shù)據(jù)集:帶注釋幀的改編版本,圖像的格式為tf.example,視頻的格式為SequenceExample。

支持腳本以基于上述指標運行評估

支持腳本以將數(shù)據(jù)加載到Tensorflow,PyTorch和Jax中并可視化數(shù)據(jù)集,包括“ Hello World”示例

有了數(shù)據(jù)集,我們還將開放數(shù)據(jù)管道,以在流行的Tensorflow,PyTorch和Jax框架中解析數(shù)據(jù)集。還提供了示例colab筆記本。

通過發(fā)布此Objectron數(shù)據(jù)集,我們希望使研究界能夠突破三維實體幾何理解的極限。我們還希望促進新的研究和應用。例如視圖合成,改進的三維表達和無監(jiān)督學習。加入我們的郵件列表并訪問我們的github頁面,請隨時關注未來的活動和發(fā)展。

致謝

這篇文章中描述的研究是由Adel Ahmadyan, Liangkai Zhang, JianingWei, Artsiom Ablavatski, Mogan Shieh, Ryan Hickman, Buck Bourdon, Alexander Kanaukou, Chuo-Ling Chang, Matthias Grundmann, ?and Tom Funkhouser完成的。我們感謝Aliaksandr Shyrokau,Sviatlana Mialik,Anna Eliseeva和注釋團隊的高質量注釋。我們還要感謝Jonathan Huang和Vivek Rathod對TensorFlow對象檢測API的指導。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    847

    瀏覽量

    47557
  • Google
    +關注

    關注

    5

    文章

    1748

    瀏覽量

    57187
  • 數(shù)據(jù)集

    關注

    4

    文章

    1197

    瀏覽量

    24538

原文標題:Google發(fā)布Objectron數(shù)據(jù)集

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    三維打印技術原理

    三維打印技術,又稱3D打印技術,是一種快速成型技術,其核心原理在于將數(shù)字模型文件逐層轉化為實體物體。以下是三維打印技術原理的詳細闡述:
    的頭像 發(fā)表于 09-16 15:31 ?114次閱讀

    蔡司掃描儀GOM Scan 1三維掃描儀對考古文物建模掃描

    在考古環(huán)境中,三維掃描技術應用廣泛,如存檔、保存、復制和分享(包括實體和虛擬形式)。文中,通過真實的掃描案例,您將了解到三維光學解決方案如何幫助呈現(xiàn)精確細節(jié)、顯示文物顏色和紋理的掃描網(wǎng)
    的頭像 發(fā)表于 09-04 10:51 ?306次閱讀
    蔡司掃描儀GOM Scan 1<b class='flag-5'>三維</b>掃描儀對考古文物建模掃描

    友思特方案 基于三維點云實現(xiàn)PCB裝配螺絲視覺檢測

    三維點云是完成精密化 PCB 檢測的最新視覺技術。友思特 Saccde Vision 視覺掃描系統(tǒng),采用先進的三維成像技術和算法輸出直觀點云圖,進一步確保了PCB生產(chǎn)的可靠性與穩(wěn)定性能。
    的頭像 發(fā)表于 08-28 16:35 ?157次閱讀
    友思特<b class='flag-5'>方案</b>  基于<b class='flag-5'>三維</b>點云實現(xiàn)PCB裝配螺絲視覺<b class='flag-5'>檢測</b>

    校園三維可視化解決方案

    在當今數(shù)字化時代,校園管理面臨著越來越復雜的挑戰(zhàn)和需求。為了更好地實現(xiàn)校園資源管理、安全監(jiān)控、規(guī)劃設計等多方面的需求,校園 三維可視化 解決方案應運而生。通過將校園環(huán)境、設施、資源等信息進行
    的頭像 發(fā)表于 08-16 14:05 ?87次閱讀

    泰來三維|三維激光掃描技術在古建筑保護中的應用

    通過三維激光掃描技術,可以快速獲取古建筑的精確三維模型。在文物保護與修復過程中,利用三維模型可以更加全面、準確地記錄古建筑的損傷情況,并輔助修復工作的設計和實施。例如,通過對模型進行測量和分析,修復人員可以預測古建筑的穩(wěn)定性,制
    的頭像 發(fā)表于 06-21 09:15 ?336次閱讀
    泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>激光掃描技術在古建筑保護中的應用

    車架三維掃描逆向建模大尺寸部件stl建模曲面逆向設計方案

    三維掃描技術在汽車設計、制造、質量檢測等多個環(huán)節(jié)中都發(fā)揮著關鍵作用。汽車車架三維掃描建模是汽車工程領域中的一項重要技術,通過CASAIM高精度的三維掃描設備,對車架表面進行快速掃描,獲
    的頭像 發(fā)表于 06-11 16:57 ?268次閱讀
    車架<b class='flag-5'>三維</b>掃描逆向建模大尺寸部件stl建模曲面逆向設計<b class='flag-5'>方案</b>

    泰來三維|數(shù)字化工廠_煤礦三維掃描數(shù)字化解決方案

    采用大空間三維激光掃描儀對廠區(qū)內部進行架站式精準三維掃描。廠區(qū)外部采用無人機傾斜攝影的方式獲取彩色模型數(shù)據(jù),采集控制點坐標與三維點云進行坐標轉換融合點云數(shù)據(jù),快速得到廠區(qū)內外完整的 三維
    的頭像 發(fā)表于 05-29 11:55 ?357次閱讀
    泰來<b class='flag-5'>三維</b>|數(shù)字化工廠_煤礦<b class='flag-5'>三維</b>掃描數(shù)字化<b class='flag-5'>解決方案</b>

    三維雷達在煤礦安全檢測中如何應用

    三維雷達在煤礦安全檢測中的應用主要體現(xiàn)在以下幾個方面: 井下環(huán)境探測: 三維雷達技術能夠掃描煤礦井下環(huán)境,生成高精度的三維點云數(shù)據(jù),從而構建出井下的
    的頭像 發(fā)表于 05-22 10:08 ?304次閱讀
    <b class='flag-5'>三維</b>雷達在煤礦安全<b class='flag-5'>檢測</b>中如何應用

    三維雷達在煤堆檢測中的具體應用和優(yōu)勢

    三維雷達在煤堆檢測中具有顯著的優(yōu)勢和應用價值。以下是三維雷達在煤堆檢測中的具體應用和優(yōu)勢: 原理介紹: 三維雷達通過發(fā)射高頻電磁波,這些電磁
    的頭像 發(fā)表于 05-22 10:05 ?252次閱讀
    <b class='flag-5'>三維</b>雷達在煤堆<b class='flag-5'>檢測</b>中的具體應用和優(yōu)勢

    泰來三維|三維掃描服務_三維掃描助力園區(qū)改造公園

    三維激光掃描儀利用激光反射測距原理,通過接受和返回的信號,獲取點云三維空間坐標。這種測量方式可以無接觸快速獲取大型建筑三維空間數(shù)據(jù),實現(xiàn)實體建筑的高精度數(shù)字化。 根據(jù)
    的頭像 發(fā)表于 05-07 11:44 ?176次閱讀
    泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>掃描服務_<b class='flag-5'>三維</b>掃描助力園區(qū)改造公園

    三維掃描服務項目-工廠三維掃描建模

    工廠三維掃描,廠房三維掃描,工廠數(shù)字化服務,工廠三維掃描解決方案,逆向還原石化管線,完成工廠數(shù)據(jù)化,為工廠設施的設計改造和維修維護提供原始三維
    的頭像 發(fā)表于 04-26 09:46 ?341次閱讀
    <b class='flag-5'>三維</b>掃描服務項目-工廠<b class='flag-5'>三維</b>掃描建模

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒?,需要文?b class='flag-5'>三維數(shù)字化保護,所以三維數(shù)字化文物保護是非常重要的一個技術手段。 那么文物
    的頭像 發(fā)表于 03-12 11:10 ?438次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作

    3d掃描風力渦輪機零部件三維尺寸測量解決方案

    CASAIM中科廣電的專業(yè)級三維掃描儀與其他替代方案相比,是一個很有說服力且切實可行的解決方案??蛻暨x擇這款三維掃描儀的主要原因之一是CASAIM中科廣電自帶的3D測量軟件平臺中的功能
    的頭像 發(fā)表于 11-30 14:44 ?320次閱讀
    3d掃描風力渦輪機零部件<b class='flag-5'>三維</b>尺寸測量<b class='flag-5'>解決方案</b>

    基于FPGA的LED體三維顯示方案研究

    電子發(fā)燒友網(wǎng)站提供《基于FPGA的LED體三維顯示方案研究.doc》資料免費下載
    發(fā)表于 11-02 10:43 ?0次下載
    基于FPGA的LED體<b class='flag-5'>三維</b>顯示<b class='flag-5'>方案</b>研究

    如何實現(xiàn)超高精度智能化全彩手持三維掃描

    全彩手持三維掃描儀直接采集三維數(shù)據(jù),軟件自動處理,獲得1:1三維數(shù)據(jù)模型和彩色信息。為用戶在文物數(shù)字化、三維展示、游戲數(shù)字資產(chǎn)制作、物品3D數(shù)據(jù)庫建立(收藏品、珍貴樣品等)、物品真實
    的頭像 發(fā)表于 10-16 15:58 ?645次閱讀
    如何實現(xiàn)超高精度智能化全彩手持<b class='flag-5'>三維</b>掃描