最近一段時(shí)間,我們也采訪了不少做深度傳感器的廠商,聊來(lái)聊去,繞不開(kāi)的一個(gè)話題就是:曾經(jīng)小眾的深度攝像頭市場(chǎng),正在慢慢走向大眾化。
我們大腦皮層有50%的區(qū)域是用于視覺(jué),在經(jīng)過(guò)幾億年的進(jìn)化以后,我們的眼睛可以在150毫秒內(nèi)將看到的場(chǎng)景識(shí)別理解出來(lái)。但是,現(xiàn)在要讓機(jī)器只憑簡(jiǎn)單的攝像頭做到這些是不可能的。
所以出現(xiàn)了可以捕捉三維深度信息的深度傳感器,雖然聽(tīng)名字這是一顆傳感器,其實(shí)它的最終形態(tài)和我們的眼睛一樣,需要去觀察、認(rèn)識(shí)以及理解這個(gè)世界。
尤其是在蘋(píng)果推出Face ID之后,相關(guān)的智能手機(jī)廠商都想跟風(fēng),雖然這股風(fēng)現(xiàn)在還沒(méi)起來(lái),但是大多已經(jīng)開(kāi)始蠢蠢欲動(dòng)。最近,華為在某場(chǎng)手機(jī)發(fā)布會(huì)上,也公布了點(diǎn)云深度攝像頭Jupiter X,和Phone X的“齊劉?!毕到y(tǒng)十分相似……
從小眾走向大眾的深度傳感器市場(chǎng)
最近一段時(shí)間,我們也采訪了不少做深度傳感器的廠商,聊來(lái)聊去,繞不開(kāi)的一個(gè)話題就是:曾經(jīng)小眾的深度攝像頭市場(chǎng),正在慢慢走向大眾化,而iPhone X在其中發(fā)揮了關(guān)鍵性的作用。
數(shù)據(jù)顯示,深度攝像頭市場(chǎng)規(guī)模將從2015年的12.5億美元增長(zhǎng)到2021年的78.9 億美元,年均增長(zhǎng)率達(dá)35%。
來(lái)自Markets and Markets的一份報(bào)告也顯示,預(yù)計(jì)到2020年全球機(jī)器視覺(jué)市場(chǎng)規(guī)模將達(dá)到125億美元。麥姆斯咨詢也顯示,預(yù)計(jì)2016~2022年間3D傳感器市場(chǎng)規(guī)模的復(fù)合年增長(zhǎng)率為26.5%,2022年將達(dá)到54.6億美元。
這也是為什么蘋(píng)果、微軟、英特爾這樣的大公司會(huì)在五年時(shí)間內(nèi),紛紛投資或者收購(gòu)深度傳感器、手勢(shì)識(shí)別算法以及上下游相關(guān)解決方案公司:
而一旦獲得這種三維信息,就能為機(jī)器感知和智能分析提供最基礎(chǔ)的數(shù)據(jù)信息。
目前,市面上比較成熟的深度信息捕捉方案主要就三種:結(jié)構(gòu)光、雙目視覺(jué)以及TOF(飛行時(shí)間)。
第一種是結(jié)構(gòu)光方案,通過(guò)發(fā)射特定圖形的散斑或者點(diǎn)陣的激光紅外圖案,攝像頭捕捉到被測(cè)物體反射回來(lái)的圖案,計(jì)算上面散斑或者點(diǎn)的大小,然后跟原始的尺寸做對(duì)比,從而測(cè)算出被測(cè)物體到攝像頭之間的距離。
第二個(gè)叫雙目,主要通過(guò)兩個(gè)普通的攝像頭獲得深度信息,簡(jiǎn)而言之它就是模仿人眼的結(jié)構(gòu),通過(guò)兩個(gè)攝像頭的視差來(lái)確定距離信息。
第三種是TOF,它是通過(guò)發(fā)出的激光反射回來(lái)的時(shí)間算距離,TOF的方案在第二代Kinect上有使用過(guò),傳感器發(fā)出調(diào)制的脈沖紅外光,然后遇到物體反射后,它會(huì)計(jì)算出光線發(fā)射和反射時(shí)間差或者相位差,實(shí)現(xiàn)距離的測(cè)量,最終產(chǎn)生深度信息。
可以說(shuō),既有的三種方案各有所長(zhǎng),TOF的響應(yīng)速度快、精度高,不易受環(huán)境光線干擾,但是功耗和成本都比較大;結(jié)構(gòu)光的工業(yè)化應(yīng)用較多;雙目立體成像更適合室外強(qiáng)光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺(jué)、自動(dòng)駕駛等方面。
但是,現(xiàn)在很多技術(shù)廠商在盡可能的取長(zhǎng)補(bǔ)短,彌補(bǔ)既有技術(shù)的短板。
深度攝像頭的產(chǎn)業(yè)鏈分解
無(wú)論是哪種方案,追根溯源其產(chǎn)業(yè)鏈的話,如下圖所示:
從產(chǎn)業(yè)鏈來(lái)看,相比較傳統(tǒng)的攝像頭,比較突出的就是紅外相關(guān)的元件。其實(shí),如果對(duì)比兩者的結(jié)構(gòu),也能很明顯發(fā)現(xiàn)深度攝像頭增加了不少新的硬件組件。
圖 | 2D 攝像頭模組結(jié)構(gòu)
圖 | 典型的3D 攝像頭模組結(jié)構(gòu)
發(fā)射端上新增了紅外激光發(fā)射器和輔助元件,包括衍射光柵和光學(xué)棱鏡部件(如準(zhǔn)直鏡頭);在接收端,新增紅外接收部分,包括鏡頭、紅外傳感器和窄帶紅外濾光片;在圖像處理器芯片上,由于算法上的復(fù)雜性,也比簡(jiǎn)單的2D成像芯片成本更高。
還是以蘋(píng)果iPhone X為例,它的黑劉海就引入了紅外光學(xué)發(fā)射器VCSEL(垂直共振腔表面放射激光)。
相比較傳統(tǒng)的LED,VCSEL的精度、體積以及低功耗更適合移動(dòng)端,現(xiàn)在大多數(shù)深度攝像頭都會(huì)采用VCSEL作為紅外光源,像蘋(píng)果的VCSEL供應(yīng)商之一是IQE,另一供應(yīng)商則是Lumentum。
市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè),2015年VCSEL市場(chǎng)規(guī)模為9.546億美元,至2022年預(yù)計(jì)將增長(zhǎng)至31.241億美元,2016~2022年期間的復(fù)合年增長(zhǎng)率可達(dá)17.3%。
VCSEL憑借其緊湊的尺寸、高可靠性、低功耗以及較低的制造成本而應(yīng)用廣泛。而汽車產(chǎn)業(yè)電氣系統(tǒng)對(duì)VCSEL的應(yīng)用增長(zhǎng),正推動(dòng)整個(gè)VCSEL的市場(chǎng)增長(zhǎng)。
隨著這塊市場(chǎng)的逐漸打開(kāi),提供綜合技術(shù)方案的廠商也開(kāi)始嶄露頭角,比如我們此前采訪過(guò)的圖漾和華捷艾米,都是以提供最終的軟硬件產(chǎn)品,甚至是算法為主。
另外,現(xiàn)在一大趨勢(shì)就是三維視覺(jué)在算法端上和人工智能的結(jié)合,從而進(jìn)一步提高識(shí)別的精確度。
以人臉識(shí)別為例,像我們熟悉的商湯、曠視都接二連三獲得數(shù)億美元的融資,這塊市場(chǎng)的容量可想而知,商湯、曠視都是算法段的高手,但是3D攝像頭可以減少對(duì)這部分算法的依賴,通過(guò)采集人臉圖像的深度信息,直接在終端上提高人臉識(shí)別技術(shù)的準(zhǔn)確率。
深度攝像頭就像萬(wàn)金油
在一項(xiàng)智研咨詢的數(shù)據(jù)調(diào)查中,2016-2022年3D成像會(huì)在消費(fèi)電子領(lǐng)域迎來(lái)爆發(fā),其平均年復(fù)合增速達(dá)到了160%,如下圖所示,
為此鎂客君也整理一份深度傳感器的應(yīng)用市場(chǎng)情況,從宏觀上來(lái)看,基本上囊括了移動(dòng)智能手機(jī)、機(jī)器人、自動(dòng)駕駛、安防等領(lǐng)域,也難怪為什么大公司十分熱衷于收購(gòu)這些技術(shù)公司。
如果簡(jiǎn)單梳理一下深度攝像頭的應(yīng)用方向,如下圖所示,主要集中在消費(fèi)端和工業(yè)領(lǐng)域:
說(shuō)到安防中的行為識(shí)別和生物特征識(shí)別。傳統(tǒng)的安防攝像頭只能記錄下海量的視頻信息,而無(wú)法對(duì)視頻里面人的行為做分析和預(yù)警,有了深度攝像頭,就有了對(duì)人的動(dòng)作獲取的硬件基礎(chǔ),配合深度學(xué)習(xí)算法,就可以對(duì)人的行為做識(shí)別和預(yù)警,安防的設(shè)備能夠真正能夠體現(xiàn)出它的價(jià)值。
在智能制造方面,包括流水化生產(chǎn)線上的工業(yè)機(jī)器人,無(wú)人倉(cāng)儲(chǔ)內(nèi)的送貨機(jī)器人都需要及時(shí)獲取深度信息,比如送貨機(jī)器自動(dòng)將不同大小、體重的包裹運(yùn)送到規(guī)定的位置,僅僅是二維平面信息完全不夠,它必須要配備深度攝像頭去獲取包括深度在內(nèi)的三維信息。
同樣是我們?nèi)粘3R?jiàn)的掃地機(jī)器人,它在室內(nèi)的避障也需要深度攝像頭去以捕獲周圍的環(huán)境信息,然后再規(guī)劃出合適的路徑。
就像圖漾的聯(lián)合創(chuàng)始人徐韜所說(shuō),“三維視覺(jué)在整個(gè)人工智能領(lǐng)域的基礎(chǔ)性地位,深度攝像頭的應(yīng)用范圍其實(shí)是在不斷拓展,將來(lái)有望成為所有機(jī)器的標(biāo)配傳感器。”
在娛樂(lè)消費(fèi)端,大家就比較熟悉它的幾個(gè)應(yīng)用場(chǎng)景,比如類似于微軟Kinect的體感游戲機(jī)。要實(shí)現(xiàn)體感交互,很重要的就是手勢(shì)、身體骨骼動(dòng)作的識(shí)別等,以華捷艾米的3D體感芯片為例,其中就包含了骨骼跟蹤技術(shù)以及slam算法(定位、跟蹤以及路徑規(guī)劃技術(shù)的核心)等。
對(duì)于消費(fèi)端來(lái)說(shuō),只有低功耗、小體積才能實(shí)現(xiàn)真正的商業(yè)化,這也是為什么很多廠商在做嵌入式方案、或者以“曲線救國(guó)”的形式去降低功耗等。
此前,公認(rèn)的是TOF比結(jié)構(gòu)光更加適合應(yīng)用到智能手機(jī)上,因?yàn)椴捎肨OF原理來(lái)實(shí)現(xiàn)動(dòng)作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中,Project Tango主要用于空間三維數(shù)據(jù)的采集。去年聯(lián)想推出了一款Project Tango技術(shù)方案的手機(jī),但是時(shí)間證明,外形過(guò)大、重量過(guò)度的Tango手機(jī)并沒(méi)有打開(kāi)市場(chǎng),現(xiàn)在關(guān)于這款手機(jī)的量產(chǎn)和銷量也不得而知,不得不說(shuō),TOF的方案還需要“斟酌”。
“所有的技術(shù)在某個(gè)時(shí)間點(diǎn)都有最優(yōu)的性價(jià)比選擇,只能說(shuō)在當(dāng)前這個(gè)階段,結(jié)構(gòu)光是最佳的選擇,這也是為什么蘋(píng)果會(huì)選擇結(jié)構(gòu)光。其實(shí)從蘋(píng)果的角度,它的實(shí)力、現(xiàn)金流,做任何技術(shù)都可以,但是它為什么選了結(jié)構(gòu)光,也說(shuō)明其他技術(shù)在一些問(wèn)題上沒(méi)法在當(dāng)前階段做一些消費(fèi)級(jí)的產(chǎn)品?!鄙颥u表示。
-
傳感器
+關(guān)注
關(guān)注
2541文章
49954瀏覽量
747465 -
攝像頭
+關(guān)注
關(guān)注
59文章
4752瀏覽量
94387 -
面部識(shí)別
+關(guān)注
關(guān)注
1文章
375瀏覽量
26581
原文標(biāo)題:iPhone X帶起的深度攝像頭熱,移動(dòng)端的路到底怎么走?
文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論