0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單目視覺識(shí)別的無(wú)限市場(chǎng)潛力

ml8z_IV_Technol ? 來(lái)源:cg ? 2018-12-01 11:13 ? 次閱讀

對(duì)單目來(lái)說(shuō)物體越遠(yuǎn),測(cè)距的精度越低,硬件上的缺點(diǎn)可以通過(guò)算法去彌補(bǔ),近日有兩篇關(guān)于單目視覺的研究論文曝光,一篇是單目視頻的深度估計(jì),另一篇?jiǎng)t是單目3d物體識(shí)別,在數(shù)據(jù)集下測(cè)試都取得了不錯(cuò)的效果,我們熟悉的單目攝像頭可能一直被低估了。

攝像頭是自動(dòng)駕駛汽車中重要的傳感器之一,在自動(dòng)駕駛過(guò)程中的首要任務(wù)就是道路識(shí)別 ,主要是圖像特征法和模型匹配法來(lái)進(jìn)行識(shí)別。行駛過(guò)程中需要進(jìn)行障礙物檢測(cè)和路標(biāo)路牌識(shí)別等,此時(shí)車輛上的信息采集便可以運(yùn)用單目視覺或者多目視覺。

由于很多圖像算法的研究都是基于單目攝像機(jī)開發(fā)的,因此相對(duì)于其他類別的攝像機(jī),單目攝像機(jī)的算法成熟度更高?;趩文繑z像頭可以用來(lái)定位、目標(biāo)識(shí)別等。但是相比多目,單目有著先天的缺陷,視野信息不能夠豐富,單目測(cè)距的精度也較低。

不過(guò)單目攝像頭的作用還未發(fā)揮到極致,近日有兩篇關(guān)于單目視覺的研究,讓眾多研究者驚艷,原來(lái)單目一樣可以有不錯(cuò)的表現(xiàn)。

Paper1:

Orthographic Feature Transform for Monocular 3D Object Detection

單目3d物體檢測(cè)是一件很有挑戰(zhàn)性的事情,目前最先進(jìn)系統(tǒng)的成績(jī)也不及用激光雷達(dá)的1/10,劍橋大學(xué)的科學(xué)家利用單目視覺進(jìn)行3d物體識(shí)別,通過(guò)引入正交特征變換,使基于圖像的特征映射到正交3D空間,來(lái)避免形成圖像域,可以全面地推斷出各個(gè)物體比例尺寸以及相隔的距離。通過(guò)在KITTI數(shù)據(jù)集里測(cè)試,發(fā)現(xiàn)與前人的Mono3D方法對(duì)比,這種方法在鳥瞰圖平均精確度、3D物體邊界識(shí)別上各項(xiàng)測(cè)試成績(jī)上均優(yōu)于對(duì)手。

尤其在探測(cè)遠(yuǎn)處物體時(shí)要遠(yuǎn)超Mono3D,遠(yuǎn)處可識(shí)別出的汽車數(shù)量更多。甚至在嚴(yán)重遮擋、截?cái)嗟那闆r下仍能正確識(shí)別出物體。在某些場(chǎng)景下甚至達(dá)到了3DOP系統(tǒng)的水平。

在這項(xiàng)工作中,提出的一種新穎的單目三維物體檢測(cè)方法,基于在鳥瞰視野范圍內(nèi)操作的,減輕了許多不良圖像的屬性,更易于推斷出世界的3D結(jié)構(gòu)。用一種簡(jiǎn)單的正交特征變換,將基于圖像的特征轉(zhuǎn)換為這種鳥瞰視圖表示, 并描述了如何使用圖像積分有效地實(shí)現(xiàn)它,以深二維卷積網(wǎng)絡(luò)的形式應(yīng)用于提取的鳥瞰特征,取得了不錯(cuò)的效果,說(shuō)明單目還有很大可開發(fā)的空間。

Paper2:

A Structured Approach to Unsupervised Depth Learning from Monocular Videos

這是谷歌的工程師做的一個(gè)研究,他利用單目視頻深度估計(jì),自從2014年NIPS上出現(xiàn)第一篇用CNN-based來(lái)做單目深度估計(jì),近幾年也不斷涌現(xiàn)出一些做單目深度估計(jì)的文章,有直接依靠深度學(xué)習(xí)和網(wǎng)絡(luò)架構(gòu)得到結(jié)果,還有依靠于深度信息本身的性質(zhì)進(jìn)行估計(jì),基于CRF和基于相對(duì)深度方法的,本篇文章是基于無(wú)監(jiān)督學(xué)習(xí)單目視頻深度估計(jì)。文中的方法能夠模擬運(yùn)動(dòng)物體并產(chǎn)生高質(zhì)量的深度估計(jì)結(jié)果,與以前的單目視頻無(wú)監(jiān)督學(xué)習(xí)方法相比,該方法能夠恢復(fù)移動(dòng)物體的正確深度。也就說(shuō),能夠正確地恢復(fù)與自身運(yùn)動(dòng)車輛相同速度的移動(dòng)汽車的深度。因?yàn)橐慌_(tái)相對(duì)靜止的車輛,往往會(huì)表現(xiàn)出與地面相同的無(wú)線深度特征,解決了高動(dòng)態(tài)場(chǎng)景中的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    59

    文章

    4793

    瀏覽量

    95300
  • 視覺識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    89

    瀏覽量

    16671
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13633

    瀏覽量

    165992

原文標(biāo)題:被低估的單目視覺識(shí)別

文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    氮化鎵(GaN)技術(shù)的迅猛發(fā)展與市場(chǎng)潛力

    ,市場(chǎng)潛力巨大。根據(jù)市場(chǎng)研究機(jī)構(gòu)的預(yù)測(cè),氮化鎵功率元件市場(chǎng)的營(yíng)收將在2024年顯著增長(zhǎng),預(yù)計(jì)到2026年市場(chǎng)規(guī)模將達(dá)到13.3億美元,復(fù)合年增長(zhǎng)率高達(dá)65%。這一增長(zhǎng)趨
    的頭像 發(fā)表于 07-24 10:55 ?528次閱讀
    氮化鎵(GaN)技術(shù)的迅猛發(fā)展與<b class='flag-5'>市場(chǎng)潛力</b>

    如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)

    人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉識(shí)別的關(guān)鍵技術(shù)之一,本文將介紹如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)。 人臉
    的頭像 發(fā)表于 07-04 09:20 ?511次閱讀

    人臉檢測(cè)和人臉識(shí)別的區(qū)別是什么

    人臉檢測(cè)和人臉識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要技術(shù),它們?cè)谠S多應(yīng)用場(chǎng)景中都有廣泛的應(yīng)用,如安全監(jiān)控、身份驗(yàn)證、社交媒體等。盡管它們?cè)谀承┓矫嬗邢嗨浦?,但它們之間存在一些關(guān)鍵的區(qū)別。本文將詳細(xì)介紹人
    的頭像 發(fā)表于 07-03 14:49 ?851次閱讀

    人臉檢測(cè)與識(shí)別的方法有哪些

    人臉檢測(cè)與識(shí)別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)重要研究方向,具有廣泛的應(yīng)用前景,如安全監(jiān)控、身份認(rèn)證、智能視頻分析等。本文將詳細(xì)介紹人臉檢測(cè)與識(shí)別的方法。 引言 人臉檢測(cè)與識(shí)別技術(shù)在現(xiàn)代社會(huì)中
    的頭像 發(fā)表于 07-03 14:45 ?603次閱讀

    圖像檢測(cè)和圖像識(shí)別的區(qū)別是什么

    詳細(xì)的比較和分析。 定義和概念 圖像檢測(cè)(Image Detection)是指利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像中的特定目標(biāo)進(jìn)行定位和識(shí)別的過(guò)程。它通常包括目標(biāo)的檢測(cè)、分類和定位三個(gè)步驟。圖像檢測(cè)的目標(biāo)可以是人、車、動(dòng)物等任何具有特定特征
    的頭像 發(fā)表于 07-03 14:41 ?741次閱讀

    軍用光電耦合器產(chǎn)品的市場(chǎng)潛力與應(yīng)用前景

    光電耦合器作為現(xiàn)代軍事技術(shù)中的關(guān)鍵組件,其在軍用領(lǐng)域的市場(chǎng)空間和應(yīng)用前景備受關(guān)注。本文將深入分析光電耦合器產(chǎn)品在軍事領(lǐng)域中的市場(chǎng)潛力,探討其技術(shù)特點(diǎn)、應(yīng)用場(chǎng)景及未來(lái)發(fā)展趨勢(shì)。
    的頭像 發(fā)表于 06-28 11:50 ?235次閱讀
    軍用光電耦合器產(chǎn)品的<b class='flag-5'>市場(chǎng)潛力</b>與應(yīng)用前景

    芯啟源榮獲“最具市場(chǎng)潛力中小企業(yè)獎(jiǎng)”

    2024年6月20日下午,浙江省半導(dǎo)體行業(yè)協(xié)會(huì)四屆三次會(huì)員大會(huì)在湖州南潯舉行。芯啟源與省內(nèi)外專家學(xué)者、省半導(dǎo)體行業(yè)協(xié)會(huì)主要負(fù)責(zé)人、半導(dǎo)體行業(yè)相關(guān)企業(yè)等200余人共同參會(huì),并憑借高速的市場(chǎng)增長(zhǎng)、雄厚的科技實(shí)力和前瞻性的市場(chǎng)洞察榮獲“最具
    的頭像 發(fā)表于 06-22 11:09 ?943次閱讀

    語(yǔ)音識(shí)別的技術(shù)歷程及工作原理

    語(yǔ)音識(shí)別的本質(zhì)是一種基于語(yǔ)音特征參數(shù)的模式識(shí)別,即通過(guò)學(xué)習(xí),系統(tǒng)能夠把輸入的語(yǔ)音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。
    的頭像 發(fā)表于 03-22 16:58 ?2697次閱讀
    語(yǔ)音<b class='flag-5'>識(shí)別的</b>技術(shù)歷程及工作原理

    機(jī)器視覺的圖像目標(biāo)識(shí)別方法綜述

    機(jī)器視覺代替?zhèn)鹘y(tǒng)的人工視覺,能夠更好的滿足危險(xiǎn)作業(yè)基本需求。機(jī)器視覺的圖像目標(biāo)識(shí)別的重要性圖像目標(biāo)識(shí)別是機(jī)器
    的頭像 發(fā)表于 02-23 08:26 ?663次閱讀
    機(jī)器<b class='flag-5'>視覺</b>的圖像目標(biāo)<b class='flag-5'>識(shí)別</b>方法綜述

    機(jī)器視覺的圖像目標(biāo)識(shí)別方法操作要點(diǎn)

    通過(guò)加強(qiáng)圖像分割,能夠提高機(jī)器視覺的圖像目標(biāo)識(shí)別的自動(dòng)化水平,使得圖像目標(biāo)識(shí)別效果更加顯著。圖像分割的方法有很多種,不同方法分別適用于不同領(lǐng)域,這里重點(diǎn)介紹以下3種分割方法。
    發(fā)表于 01-15 12:17 ?381次閱讀

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練? 使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫(kù)和算法來(lái)實(shí)現(xiàn)
    的頭像 發(fā)表于 01-12 16:06 ?524次閱讀

    情感語(yǔ)音識(shí)別的應(yīng)用與挑戰(zhàn)

    一、引言 情感語(yǔ)音識(shí)別是一種通過(guò)分析人類語(yǔ)音中的情感信息實(shí)現(xiàn)智能化和個(gè)性化人機(jī)交互的技術(shù)。本文將探討情感語(yǔ)音識(shí)別的應(yīng)用領(lǐng)域、優(yōu)勢(shì)以及所面臨的挑戰(zhàn)。 二、情感語(yǔ)音識(shí)別的應(yīng)用領(lǐng)域 娛樂產(chǎn)業(yè):在娛樂產(chǎn)業(yè)中
    的頭像 發(fā)表于 11-30 10:40 ?604次閱讀

    情感語(yǔ)音識(shí)別的現(xiàn)狀與未來(lái)趨勢(shì)

    情感語(yǔ)音識(shí)別是一種涉及多個(gè)學(xué)科領(lǐng)域的前沿技術(shù),包括心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)等。它通過(guò)分析人類語(yǔ)音中的情感信息,實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)交互。本文將探討情感語(yǔ)音識(shí)別的現(xiàn)狀與未來(lái)趨勢(shì)。
    的頭像 發(fā)表于 11-28 17:22 ?725次閱讀

    AI視覺識(shí)別有哪些工業(yè)應(yīng)用

    AI視覺識(shí)別涵蓋多種應(yīng)用,如人臉識(shí)別、目標(biāo)檢測(cè)和識(shí)別、圖像分割、行為識(shí)別、視頻分析等。本篇就簡(jiǎn)單介紹一下AI
    的頭像 發(fā)表于 11-27 18:05 ?1147次閱讀
    AI<b class='flag-5'>視覺</b><b class='flag-5'>識(shí)別</b>有哪些工業(yè)應(yīng)用

    情感語(yǔ)音識(shí)別的研究方法與實(shí)踐

    一、引言 情感語(yǔ)音識(shí)別是指通過(guò)計(jì)算機(jī)技術(shù)和人工智能算法自動(dòng)識(shí)別和理解人類語(yǔ)音中的情感信息。為了提高情感語(yǔ)音識(shí)別的準(zhǔn)確性,本文將探討情感語(yǔ)音識(shí)別的研究方法與實(shí)踐。 二、情感語(yǔ)音
    的頭像 發(fā)表于 11-16 16:26 ?801次閱讀