0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器視覺加速從2D走向3D

機器視覺 ? 來源:機器視覺 ? 作者:機器視覺 ? 2022-11-25 10:29 ? 次閱讀

機器視覺是指利用相機、攝像機等傳感器,配合機器視覺算法賦予智能設(shè)備人眼的功能,從而進行物體的識別、檢測、測量等功能。機器視覺是在上世紀 50 年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像分析和識別。隨著 5GAI 等技術(shù)的不斷發(fā)展,行業(yè)應用需求的不斷提升,機器視覺從二維向三維過渡不但成為可能,更是必須的方向。

機器視覺從2D進化到3D立體“視界”,常見常用的刷臉支付、Face ID、VR、無人便利店、智能機器人等產(chǎn)品技術(shù),背后關(guān)鍵的科技便是3D視覺技術(shù)。

在過去幾年里,3D視覺概念迭出,大量資本涌入這個賽道,新進企業(yè)眾多。業(yè)內(nèi)人士普遍認為,3D視覺在工業(yè)領(lǐng)域的產(chǎn)值和產(chǎn)出,可能要遠遠大于消費領(lǐng)域,但因為滲透率很低,推進速度不夠快,當前3D工業(yè)相機的規(guī)模在幾億美金區(qū)間,設(shè)備和軟件在20億美金水平,但行業(yè)市場有50倍以上的滲透率增長空間。

從2D到3D的賽道變化2D技術(shù)起步較早,技術(shù)也相對成熟,在過去的30年中已被證明在廣泛的自動化和產(chǎn)品質(zhì)量控制過程中非常有效。

2D技術(shù)根據(jù)灰度或彩色圖像中對比度的特征提供結(jié)果。2D適用于缺失/存在檢測、離散對象分析、圖案對齊、條形碼和光學字符識別(OCR)以及基于邊緣檢測的各種二維幾何分析,用于擬合線條、弧線、圓形及其關(guān)系(距離,角度,交叉點等)。

3D視覺利用近紅外線光來掃描周圍環(huán)境,再由CMOS圖像傳感器接收并轉(zhuǎn)換為數(shù)字信號,最后通過芯片計算出物體在三維空間中的遠近與相對位置,因此能了解物體的動作、與環(huán)境的互動,由此即能發(fā)展出由動作控制計算機的體感操控,檢測出前方的物體等。

由于2D視覺逐漸無法滿足對復雜對象識別和尺寸測量精度日益增加的要求,因此也催生了3D視覺的增長。從2D轉(zhuǎn)向3D,需要所獲取信息質(zhì)量和數(shù)量的飛躍。相對來說,2D視覺市場積淀深,3D視覺方案只有達到一定的成熟度,才可以全面實現(xiàn)2D向3D的轉(zhuǎn)變。

過去工業(yè)生產(chǎn)采用的機械臂都是盲取,閉著眼睛照著設(shè)定好的路徑加工,沒有更高階的智慧判斷。如果采用3D視覺后,就可以在更復雜的環(huán)境里更精準的夾取物件。業(yè)界認為,從2D到3D的過渡將成為繼黑白到彩色,低分辨率到高分辨率以及靜態(tài)圖像到電影之后的第四次革命。

但是3D機器視覺技術(shù)門檻高,涉及到光學、結(jié)構(gòu)、散熱等跨學科設(shè)計問題,再加上芯片、算法構(gòu)成的復雜系統(tǒng)設(shè)計,需要一定的技術(shù)實力,投入足夠的時間和人才,才可以研發(fā)相關(guān)方案。技術(shù)門檻高、投入大、研發(fā)企業(yè)少都是3D視覺發(fā)展路上的攔路虎。

在3D視覺興起之后,選擇2D視覺還是3D視覺,成為一個有爭議的問題。有業(yè)內(nèi)人士表示,3D視覺將全面替代2D視覺;但也有觀點認為,3D視覺價格高,在可以應用2D視覺的場合,沒有必要用3D視覺;當然還有第三方觀點認為,2D視覺和3D視覺可以融合應用。

就具體技術(shù)角度而言,2D顏色和3D幾何數(shù)據(jù)的采集是從兩個不同的物理通道進行的。

從落地來看,目前3D主要應用于大型工業(yè)制造業(yè)企業(yè)、物流、智慧城市監(jiān)控,以及少部分消費應用場景等,從探索到突破,在落地的路上逐顯繁榮。

3D視覺的不同技術(shù)形態(tài)目前市場上主流的有四種3D視覺技術(shù),雙目視覺、TOF、結(jié)構(gòu)光3D成像和激光三角測量。

1.雙目視覺雙目技術(shù)是目前較為廣泛的3D視覺系統(tǒng),它的原理就像我們?nèi)说膬芍谎劬?,用兩個視點觀察同一景物以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像的視差,來獲取景物的三維信息 。

87634e92-6c10-11ed-8abf-dac502259ad0.png

由于雙目技術(shù)原理簡單,不需要使用特殊的發(fā)射器和接收器,只需要在自然光照下就能獲得三維信息,所以雙目技術(shù)具有系統(tǒng)結(jié)構(gòu)簡單、實現(xiàn)靈活和成本低的優(yōu)點。適合于制造現(xiàn)場的在線、產(chǎn)品檢測和質(zhì)量控制,不過雙目技術(shù)的劣勢是算法復雜,計算量大,而且光照較暗或者過度曝光的情況下效果差。

8790d128-6c10-11ed-8abf-dac502259ad0.png

2.3D結(jié)構(gòu)光技術(shù)

它通過一個光源投射出一束結(jié)構(gòu)光,這結(jié)構(gòu)光可不是普通的光,而是具備一定結(jié)構(gòu)(比如黑白相間)的光線打到想要測量的物體上表面,因為物體有不同的形狀,會對這樣的一些條紋或斑點發(fā)生不同的變形,有這樣的變形之后,通過算法可以計算出距離、形狀、尺寸等信息從而獲得物體的三維圖像。

3. 激光三角測量法它基于光學三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系,來確定空間物體各點的三維坐標 。

87c53cce-6c10-11ed-8abf-dac502259ad0.png

通常用激光作為光源,用CCD相機作為檢測器,具有結(jié)構(gòu)光3D視覺的優(yōu)點,精準、快速、成本低。

4. TOF飛行時間法成像技術(shù)

TOF是Time Of Flight的簡寫。它的原理通過給目標物連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行時間來得到目標物距離。

87f23846-6c10-11ed-8abf-dac502259ad0.png

TOF的核心部件是光源和感光接收模塊,由于TOF是根據(jù)公式直接輸出深度信息,不需要用類似雙目視覺的算法來計算,所以具有響應快、軟件簡單、識別距離遠的特點,而且由于不需要進行灰度圖像的獲取與分析,因此不受外界光源物體表面性質(zhì)影響。典型的TOF 3D掃描系統(tǒng)每秒可測量物體上10,000至100,000個點的距離。不過TOF技術(shù)的缺點是:分辨率低、不能精密成像、而且成本高。

總的來說,無論是立體視覺、結(jié)構(gòu)光、激光三角測量還是TOF,沒有哪種技術(shù)是更好的,只有哪種技術(shù)是更適合的。

3D或?qū)⒊蔀橹髁?/p>

機器人自動駕駛、金融支付已經(jīng)體現(xiàn)出對3D視覺的強需求,當然,還有虛實相融的元宇宙,AR、VR等XR設(shè)備和3D交互需求已經(jīng)率先凸顯。這些需求帶來了龐大的市場,但這也是極度碎片化的市場。

GGII數(shù)據(jù)顯示,預計到2023年我國機器視覺市場規(guī)模將達到208.6億元,其中3D視覺市場規(guī)模將達到34.28億元,預計到2025年我國3D視覺市場規(guī)模將超過100億元。在這個未來的百億級市場中,3D視覺將趨于智能化、集成化、實時性、高性能、多場景應用等方向。

2D視覺雖為當前主流,但隨著測量精度要求越來越高,被測物體條件越來越復雜,2D系統(tǒng)的缺陷也愈發(fā)突出,而3D視覺技術(shù)不斷獲得突破,在精度、靈活性和速度方面都是2D無可比擬的,所以3D機器視覺檢測有取代2D系統(tǒng)的趨勢,相信3D視覺未來將成為主流視覺系統(tǒng)。

881f3bf2-6c10-11ed-8abf-dac502259ad0.png

應用背景

OCR字符識別,是指對部件或產(chǎn)品上刻印的字符進行確認、辨別、判定的檢測識別。此項技術(shù)目前已廣泛應用于工業(yè)自動化生產(chǎn)的產(chǎn)品質(zhì)量管理環(huán)節(jié)當中,企業(yè)通過為機器視覺檢測設(shè)備安裝OCR系統(tǒng),快速完成對產(chǎn)品生產(chǎn)日期、保質(zhì)期、生產(chǎn)批號、條碼等字符信息的檢測,從而更好地進行產(chǎn)品管理和追溯。

應用現(xiàn)狀

作為機器視覺的典型應用方向,OCR的工作原理即為:通過工業(yè)相機、工業(yè)鏡頭拍攝字符圖像,運用機器視覺軟件進行相應處理分析,判定被檢產(chǎn)品是否合格,并輸出檢測結(jié)果和相應信號。

這其中,軟件處理環(huán)節(jié)才是OCR技術(shù)真正的“用武之地”。常規(guī)的技術(shù)處理流程為:背景圖像處理——字符切割——字符注冊——字符識別與判斷——結(jié)果輸出。

實際的工業(yè)應用中,軟件的處理過程

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2541

    文章

    49961

    瀏覽量

    747524
  • 機器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4266

    瀏覽量

    119548

原文標題:機器視覺加速從2D走向3D/讓計算機去理解獲取數(shù)字圖像與視頻中的信息

文章出處:【微信號:www_51qudong_com,微信公眾號:機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?248次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>檢測技術(shù)

    銀牛微電子引領(lǐng)3D空間計算芯片前沿技術(shù)

    在此次活動上,銀牛微電子有限責任公司的周凡博士指出,2D視覺已無法滿足日益復雜的系統(tǒng)需求,因此我們需要引入更多維度來輔助機器人和智能設(shè)備更好地理解并融入真實環(huán)境,即從2D
    的頭像 發(fā)表于 05-18 16:34 ?692次閱讀

    通過2D/3D異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時間

    受經(jīng)典德拜弛豫啟發(fā)的米勒模型提供了通過操縱弛豫時間來控制自發(fā)極化的理論框架。作者通過使用層轉(zhuǎn)移技術(shù)形成的2D/C-3D/2D異質(zhì)結(jié)構(gòu)克服了傳統(tǒng)異質(zhì)結(jié)存在的鐵電性惡化和能量損失的問題。
    的頭像 發(fā)表于 04-29 10:27 ?395次閱讀
    通過<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時間

    有了2D NAND,為什么要升級到3D呢?

    2D NAND和3D NAND都是非易失性存儲技術(shù)(NVM Non-VolatileMemory),屬于Memory(存儲器)的一種。
    的頭像 發(fā)表于 03-17 15:31 ?757次閱讀
    有了<b class='flag-5'>2D</b> NAND,為什么要升級到<b class='flag-5'>3D</b>呢?

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領(lǐng)域頂會CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2D De
    的頭像 發(fā)表于 02-27 16:38 ?929次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b>目標檢測新方法QAF<b class='flag-5'>2D</b>

    高分工作!Uni3D3D基礎(chǔ)大模型,刷新多個SOTA!

    我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive
    的頭像 發(fā)表于 01-30 15:56 ?645次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎(chǔ)大模型,刷新多個SOTA!

    介紹一種使用2D材料進行3D集成的新方法

    美國賓夕法尼亞州立大學的研究人員展示了一種使用2D材料進行3D集成的新穎方法。
    的頭像 發(fā)表于 01-13 11:37 ?898次閱讀

    一種用于2D/3D圖像處理算法的指令集架構(gòu)以及對應的算法部署方法

    二維(2D)和三維(3D)雙模視覺信息在自動駕駛、工業(yè)機器人、人機交互等前沿領(lǐng)域具有廣泛的應用前景。
    的頭像 發(fā)表于 01-05 10:35 ?358次閱讀
    一種用于<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>圖像處理算法的指令集架構(gòu)以及對應的算法部署方法

    一文了解3D視覺2D視覺的區(qū)別

    一文了解3D視覺2D視覺的區(qū)別 3D視覺2D
    的頭像 發(fā)表于 12-25 11:15 ?2348次閱讀

    2D3D視覺技術(shù)的比較

    作為一個多年經(jīng)驗的機器視覺工程師,我將詳細介紹2D3D視覺技術(shù)的不同特點、應用場景以及它們能夠解決的問題。在這個領(lǐng)域內(nèi),
    的頭像 發(fā)表于 12-21 09:19 ?907次閱讀

    圖漾科技發(fā)布3D工業(yè)視覺應用開發(fā)平臺Vision++

    2023年12月20日,全球領(lǐng)先的3D機器視覺企業(yè)圖漾科技發(fā)布了3D工業(yè)視覺應用開發(fā)平臺Vision++,集成了簡單易用的圖形化低代碼開發(fā)環(huán)
    的頭像 發(fā)表于 12-20 16:46 ?704次閱讀
    圖漾科技發(fā)布<b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>視覺</b>應用開發(fā)平臺Vision++

    使用Python2D圖像進行3D重建過程詳解

    有許多不同的方法和算法可用于2D圖像執(zhí)行3D重建。選擇的方法取決于諸如輸入圖像的質(zhì)量、攝像機校準信息的可用性以及重建的期望準確性和速度等因素。
    的頭像 發(fā)表于 12-05 14:07 ?2115次閱讀
    使用Python<b class='flag-5'>從</b><b class='flag-5'>2D</b>圖像進行<b class='flag-5'>3D</b>重建過程詳解

    機器視覺系統(tǒng)組成 3D相機與2D相機的區(qū)別

    在以往的機器視覺領(lǐng)域通常是指2D視覺系統(tǒng)即通過攝像頭拍到一個平面的照片然后通過圖像分析或比對來識別物體,從而應用缺陷、瑕疵,位置、OCR,條形碼等。
    發(fā)表于 11-30 14:42 ?1294次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)組成 <b class='flag-5'>3D</b>相機與<b class='flag-5'>2D</b>相機的區(qū)別

    什么是3D霍爾開關(guān)?和2D霍爾開關(guān)的區(qū)別在哪里

    3D霍爾開關(guān)是一種新型的磁感應開關(guān)器件,它利用磁性材料之間的相互作用力來檢測磁場的變化,并輸出相應的開關(guān)信號。與傳統(tǒng)的2D霍爾開關(guān)相比,3D霍爾開關(guān)具有更高的靈敏度和可靠性,因此在很多領(lǐng)域得到了廣泛
    的頭像 發(fā)表于 11-16 16:16 ?1640次閱讀
    什么是<b class='flag-5'>3D</b>霍爾開關(guān)?和<b class='flag-5'>2D</b>霍爾開關(guān)的區(qū)別在哪里