0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三維視覺將成為人工智能的“殺手級(jí)應(yīng)用”

MEMS ? 來源:未知 ? 作者:伍文輝 ? 2018-04-03 11:04 ? 次閱讀

Google人工智能機(jī)器學(xué)習(xí)首席科學(xué)家李飛飛在Google I/O開發(fā)者大會(huì)表示人工智能將成為“第四次工業(yè)革命的驅(qū)動(dòng)力”,它將改變?nèi)祟惿?、工作和溝通的方式。在人工智能的三個(gè)階段“弱人工智能—強(qiáng)人工智能—超人工智能”的發(fā)展中,視覺信息的獲取是必不可少的,機(jī)器從對(duì)物體的識(shí)別到場(chǎng)景的理解都必須先獲取其三維信息以及位置關(guān)系。三維視覺將成為人工智能的“殺手級(jí)應(yīng)用”。

在過去十年間,人類在對(duì)圖像識(shí)別和圖像標(biāo)注等基礎(chǔ)視覺領(lǐng)域已經(jīng)取得了重大進(jìn)展,基于這種二維圖像視覺在諸如人臉識(shí)別、工業(yè)檢測(cè)、安防以及汽車ADAS等方面得到了廣泛的應(yīng)用,成為人工智能的一些重要落地應(yīng)用。隨著人工智能的發(fā)展,二維信息無法滿足對(duì)真實(shí)場(chǎng)景的充分理解,所以各個(gè)大廠都在著力研究三維視覺的技術(shù),如Intel的RealSense、Apple的TrueDepth,以及諸多廠家面向無人駕駛的多線激光雷達(dá)等,這些技術(shù)都在幫助機(jī)器獲取一個(gè)至關(guān)重要信息——深度信息,來實(shí)現(xiàn)三維人臉識(shí)別、手勢(shì)識(shí)別、獲知物體間的空間關(guān)系,以及視覺導(dǎo)航、路徑規(guī)劃、主動(dòng)避障等工作。

三維視覺在強(qiáng)人工智能階段必將是不可獲取的組成部分,是機(jī)器智能和企業(yè)變革的重要技術(shù)。接下來我們就三維視覺的技術(shù)方案給做一個(gè)系統(tǒng)介紹。

其中三角測(cè)距中的非編碼方式的方案常見于工業(yè)檢測(cè)領(lǐng)域,這種方案我們暫且不討論。我們?cè)谶@一期著重討論其它幾種方式的近距離三維視覺方案。

近距離三維感知設(shè)備我們稱之為深度相機(jī),其中雙目相機(jī)即是利用雙攝像頭模擬人眼,通過計(jì)算空間中同一個(gè)物體在兩個(gè)相機(jī)成像的視差來獲得物體離相機(jī)的距離。

而ToF(Time of Flight)即飛行時(shí)間法,其測(cè)距原理是通過連續(xù)發(fā)射經(jīng)過調(diào)制的特定頻率的光脈沖到被觀測(cè)物體上,然后接收從物體反射回去的光脈沖,通過探測(cè)光脈沖的飛行(往返)時(shí)間來計(jì)算被測(cè)物體離相機(jī)的距離。

三角法測(cè)距中的采用編碼方式的方案業(yè)內(nèi)均定義為結(jié)構(gòu)光方式。結(jié)構(gòu)光法不依賴于物體本身的顏色和紋理,是采用主動(dòng)投影編碼圖案(比如散斑、條紋光等)的方法來實(shí)現(xiàn)快速魯棒的匹配特征點(diǎn),能夠獲得較高的精度,也大大擴(kuò)展了適用范圍。

蘋果iPhone X的“齊劉海”——TrueDepth系統(tǒng)

iPhone X通過前置點(diǎn)陣投影器(也就是結(jié)構(gòu)光投影儀)將超過30000個(gè)肉眼不可見的光點(diǎn)(紅外激光散斑點(diǎn))投影到人臉,再根據(jù)紅外鏡頭接收到的反射光點(diǎn),計(jì)算得到人臉三維圖。

這種空間編碼方式,是向空間投射了單幅隨機(jī)的激光衍射斑點(diǎn),但是由于這些點(diǎn)并不能覆蓋空間上所有的區(qū)域,勢(shì)必在某些位置無法獲取到三維信息,導(dǎo)致其精度是有一定限制的,通常為毫米級(jí)精度,這也是為什么iPhone X只是獲取了人臉的大致模型,在其FaceID應(yīng)用中實(shí)際上只是應(yīng)用了結(jié)構(gòu)光方案判斷解鎖手機(jī)的是一個(gè)真實(shí)的人,而非平面照片或視頻,作為一種活體判斷防止被攻擊破解的手段。

這類散斑結(jié)構(gòu)光的方案被國內(nèi)奧比中光、華捷艾米等企業(yè)采用。主要應(yīng)用于體感交互、手勢(shì)識(shí)別、人臉識(shí)別活體檢測(cè)等領(lǐng)域。

那是否有方案可以實(shí)現(xiàn)高精度的三維數(shù)據(jù)呢?答案是肯定的。這就是我們接下來要講的動(dòng)態(tài)結(jié)構(gòu)光的時(shí)間編碼方案,此種方案的深度相機(jī)的原理如下:

它同樣由一個(gè)攝像機(jī)和一個(gè)結(jié)構(gòu)光投影儀組成,結(jié)構(gòu)光投影儀向被測(cè)物體投射多組明暗相間的光柵圖像(隨時(shí)間可調(diào)制),攝像機(jī)同時(shí)拍攝經(jīng)被測(cè)物體表面調(diào)制而變形的多組光柵圖像,通過一定算法計(jì)算出被測(cè)物體的三維數(shù)據(jù)。

這種動(dòng)態(tài)結(jié)構(gòu)光方案的三維視覺其實(shí)在工業(yè)界早有應(yīng)用,主要應(yīng)用在逆向工程、三維檢測(cè)、三維建模等領(lǐng)域,這就是傳統(tǒng)的三維掃描儀,既然將它稱為儀器,也就可想而知其體積通常比較大,價(jià)格也很昂貴。

那是否存在一種深度相機(jī)方案,其精度高,體積小,價(jià)格也不那么高呢?答案也是肯定的。這個(gè)就是MEMS微振鏡的方案(MEMS:微機(jī)電系統(tǒng))。MEMS微振鏡是一種將可動(dòng)結(jié)構(gòu)芯片化的執(zhí)行器,工作時(shí)芯片內(nèi)部的鏡面可以高速擺動(dòng),以實(shí)現(xiàn)激光束的高速掃描。

基于MEMS微振鏡的深度相機(jī)與傳統(tǒng)的三維掃描儀最大的區(qū)別是結(jié)構(gòu)光投影方式上,三維掃描儀采用DLP、LCOS等進(jìn)行動(dòng)態(tài)結(jié)構(gòu)光的投影,而此深度相機(jī)是采用MEMS微振鏡與激光來進(jìn)行掃描投影。

采用MEMS微振鏡的投影方式,不僅克服了體積和成本上的缺點(diǎn),同時(shí)由于這種投影系統(tǒng)是激光掃描式,投影并無光學(xué)放大鏡頭,也就沒有焦距的概念,是一個(gè)無需調(diào)焦的系統(tǒng)(free-focus projector),這也就使得基于MEMS微振鏡深度相機(jī)的工作范圍要比三維掃描儀要大很多。

基于MEMS微振鏡的深度相機(jī)可以實(shí)現(xiàn)亞毫米級(jí),甚至更高的深度精度,相比較同樣小體積的散斑靜態(tài)結(jié)構(gòu)光方案的深度相機(jī),精度提升有至少一個(gè)數(shù)量級(jí)。而相比同樣精度的三維掃描儀,其體積小、重量輕、無需調(diào)焦等優(yōu)勢(shì)特點(diǎn)擴(kuò)展了高精度三維視覺的應(yīng)用場(chǎng)景。

以下將結(jié)構(gòu)光的三維視覺方案做一個(gè)綜合對(duì)比:

MEMS深度相機(jī)所采集的亞毫米精度數(shù)據(jù)可以滿足三維人臉識(shí)別需求,實(shí)現(xiàn)真正用三維數(shù)據(jù)來作為識(shí)別判定依據(jù)。而非像iPhoneX中三維信息只能用于活體判斷,也避免出現(xiàn)如新聞中所報(bào)道的母子二人均可解鎖iPhone X的情況。

同時(shí)這種高精度深度相機(jī)所采用的MEMS微振鏡尺寸通常只有幾個(gè)毫米,功耗也只有幾十毫瓦,非常適合集成于如智能手機(jī)、平板電腦等便攜式的設(shè)備中,為其增加三維人臉識(shí)別、三維掃描建模等功能。目前采用這種技術(shù)方案的國內(nèi)外廠家有Intel的RealSense,知微傳感(Zhisensor)的Argus等。

隨著人工智能對(duì)視覺傳感器的需求越來越高,高精度的三維視覺產(chǎn)品也將會(huì)越來越普及,在不遠(yuǎn)的將來,機(jī)器擁有比人類更敏銳的視覺感知的確是完全可能的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • iPhone X
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    6359
  • 三維視覺
    +關(guān)注

    關(guān)注

    1

    文章

    16

    瀏覽量

    1721

原文標(biāo)題:比iPhone X更牛X的三維視覺技術(shù)

文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    友思特方案 基于三維點(diǎn)云實(shí)現(xiàn)PCB裝配螺絲視覺檢測(cè)

    三維點(diǎn)云是完成精密化 PCB 檢測(cè)的最新視覺技術(shù)。友思特 Saccde Vision 視覺掃描系統(tǒng),采用先進(jìn)的三維成像技術(shù)和算法輸出直觀點(diǎn)云圖,進(jìn)一步確保了PCB生產(chǎn)的可靠性與穩(wěn)定性能
    的頭像 發(fā)表于 08-28 16:35 ?158次閱讀
    友思特方案  基于<b class='flag-5'>三維</b>點(diǎn)云實(shí)現(xiàn)PCB裝配螺絲<b class='flag-5'>視覺</b>檢測(cè)

    報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇于一體的世界級(jí)人工智能合作交流平臺(tái)。本次大會(huì)暨博覽會(huì)由工業(yè)和信息化部政府采購中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導(dǎo),深圳市人工智能產(chǎn)業(yè)協(xié)會(huì)主辦
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能技術(shù)的發(fā)展提供有力支持。
    發(fā)表于 07-29 17:05

    三維可視化的魅力與應(yīng)用

    三維可視化是一種強(qiáng)大的工具,它融合了藝術(shù)、科學(xué)和技術(shù),通過在三維空間中呈現(xiàn)數(shù)據(jù)、概念和想法,為人們提供了一種直觀而生動(dòng)的方式來理解和探索信息。這項(xiàng)技術(shù)在當(dāng)今世界中的應(yīng)用非常廣泛,涵蓋了科學(xué)、教育
    的頭像 發(fā)表于 07-17 14:19 ?142次閱讀

    機(jī)器視覺人工智能的關(guān)系與應(yīng)用

    機(jī)器視覺人工智能的關(guān)系是一個(gè)廣泛而深入的話題,涉及到計(jì)算機(jī)科學(xué)、電子工程、光學(xué)、圖像處理、模式識(shí)別等多個(gè)領(lǐng)域。 一、機(jī)器視覺人工智能的定義 機(jī)器
    的頭像 發(fā)表于 07-16 10:27 ?431次閱讀

    SolidWorks軟件 強(qiáng)大的三維設(shè)計(jì)軟件

    在當(dāng)今的工程設(shè)計(jì)領(lǐng)域,三維設(shè)計(jì)軟件已經(jīng)成為不可或缺的工具。而SolidWorks,作為一款功能強(qiáng)大的三維設(shè)計(jì)軟件,憑借其優(yōu)越的性能和廣泛的應(yīng)用,成為了工程師和技術(shù)人員首要選擇的設(shè)計(jì)平臺(tái)
    的頭像 發(fā)表于 06-27 16:48 ?367次閱讀
    SolidWorks軟件 強(qiáng)大的<b class='flag-5'>三維</b>設(shè)計(jì)軟件

    三維可視:展現(xiàn)未來的視覺盛宴

    帶你了解這一領(lǐng)域的種種奇跡。 一、三維可視化技術(shù)的定義 三維可視化技術(shù)是基于計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺的一種技術(shù),用于創(chuàng)建和呈現(xiàn)逼真的三維場(chǎng)景。通過使用復(fù)雜的算法和圖像處理技術(shù),它能夠模
    的頭像 發(fā)表于 06-05 15:48 ?215次閱讀

    激光距離選通三維成像技術(shù)研究進(jìn)展綜述

    隨著人工智能(AI)時(shí)代的到來,同時(shí)獲得反映目標(biāo)輻射特性和紋理特征的高分辨率強(qiáng)度圖像以及反映目標(biāo)和所處場(chǎng)景的三維空間信息的稠密點(diǎn)云數(shù)據(jù)/三維圖像的激光相機(jī)雷達(dá)技術(shù)已成為激光雷達(dá)的發(fā)展趨
    的頭像 發(fā)表于 05-28 10:26 ?2260次閱讀
    激光距離選通<b class='flag-5'>三維</b>成像技術(shù)研究進(jìn)展綜述

    泰來三維|三維掃描服務(wù)_三維掃描助力園區(qū)改造公園

    三維激光掃描儀利用激光反射測(cè)距原理,通過接受和返回的信號(hào),獲取點(diǎn)云三維空間坐標(biāo)。這種測(cè)量方式可以無接觸快速獲取大型建筑三維空間數(shù)據(jù),實(shí)現(xiàn)實(shí)體建筑的高精度數(shù)字化。 根據(jù)三維掃描得到的立
    的頭像 發(fā)表于 05-07 11:44 ?177次閱讀
    泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>掃描服務(wù)_<b class='flag-5'>三維</b>掃描助力園區(qū)改造公園

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒校枰奈?b class='flag-5'>三維數(shù)字化保護(hù),所以三維數(shù)字化文物保護(hù)是非常重要的一個(gè)技術(shù)手段。 那么文物
    的頭像 發(fā)表于 03-12 11:10 ?440次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    三維視覺測(cè)量技術(shù)知識(shí)科普

    三維視覺測(cè)量技術(shù)按照測(cè)量過程中是否投射光源,獲取被測(cè)物體三維形貌信息的方法可以分為兩大類: 被動(dòng)視覺測(cè)量和主動(dòng)視覺測(cè)量。
    的頭像 發(fā)表于 01-03 11:47 ?708次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>視覺</b>測(cè)量技術(shù)知識(shí)科普

    三維視覺測(cè)量技術(shù):被動(dòng)視覺測(cè)量和主動(dòng)視覺測(cè)量

    與人眼的立體感知類似,雙目立體視覺用兩個(gè)相機(jī)從不同的角度對(duì)被測(cè)物體成像。依據(jù)兩幅圖像中對(duì)應(yīng)點(diǎn)的立體視差( stereo disparity) ,根據(jù)角測(cè)量原理實(shí)現(xiàn)三維信息測(cè)量。
    的頭像 發(fā)表于 01-03 11:30 ?596次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>視覺</b>測(cè)量技術(shù):被動(dòng)<b class='flag-5'>視覺</b>測(cè)量和主動(dòng)<b class='flag-5'>視覺</b>測(cè)量

    基于深度學(xué)習(xí)的三維重建技術(shù)

    多視圖立體幾何(Multi-View Stereo,MVS)是計(jì)算機(jī)視覺中重要的研究領(lǐng)域,也是邁入三維計(jì)算機(jī)視覺研究的重點(diǎn)問題。它通過利用多張互相重疊的圖像恢復(fù)出原始三維場(chǎng)景的幾何結(jié)構(gòu)
    的頭像 發(fā)表于 12-04 10:08 ?799次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>三維</b>重建技術(shù)

    三維立體視覺三維恢復(fù)方法

    電子發(fā)燒友網(wǎng)站提供《三維立體視覺三維恢復(fù)方法.doc》資料免費(fèi)下載
    發(fā)表于 11-03 09:31 ?0次下載
    <b class='flag-5'>三維</b>立體<b class='flag-5'>視覺</b>之<b class='flag-5'>三維</b>恢復(fù)方法