0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機(jī)視覺的實現(xiàn)基本過程

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2020-09-24 10:49 ? 次閱讀

如果想要機(jī)器能夠進(jìn)行思考,我們需要先教會它們?nèi)タ础?/p>

李飛飛——Director of Stanford AI Lab and Stanford Vision Lab

計算機(jī)視覺(Computer vision)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指用攝影機(jī)和計算機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖像處理,用計算機(jī)處理成更適合人眼觀察或進(jìn)行儀器檢測的圖像。

學(xué)習(xí)和運(yùn)算能讓機(jī)器能夠更好的理解圖片環(huán)境,并且建立具有真正智能的視覺系統(tǒng)。當(dāng)下環(huán)境中存在著大量的圖片和視頻內(nèi)容,這些內(nèi)容亟需學(xué)者們理解并在其中找出模式,來揭示那些我們以前不曾注意過的細(xì)節(jié)。計算機(jī)視覺的實現(xiàn)基本過程為:

計算機(jī)從圖片中生成數(shù)學(xué)模型

計算機(jī)圖形在模型中對圖像進(jìn)行繪制,然后在圖像處理過程中將其作為輸入,另外給出處理圖像作為輸出

計算機(jī)視覺的理念在某些方面其實與很多概念有部分重疊,包括:人工智能、數(shù)字圖像處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、模式識別、概率圖模型、科學(xué)計算以及一系列的數(shù)學(xué)計算等。因此,你可以將本文看成是深入這個領(lǐng)域研究的第一步。本文將盡量包涵到盡可能多的內(nèi)容,但是可能仍然會存在一些較為復(fù)雜的主題,也有可能存在某些遺漏之處,敬請見諒。

丨第一步——背景

通常來說,你應(yīng)該具有一點(diǎn)相關(guān)的學(xué)術(shù)背景,比如上過有關(guān)概率學(xué)、統(tǒng)計學(xué)、線性代數(shù)、微積分(微分與積分)等相關(guān)課程,對矩陣計算有一定了解更好。另外,從我的經(jīng)驗來看如果你對數(shù)字信號處理有了解的話,在以后對于概念的理解來說會更加容易。
在實現(xiàn)層面來說,你最好能夠會用MATLAB或者Python中的一種,一定要記住的是計算機(jī)視覺幾乎全部與計算機(jī)編程有關(guān)。

你也可以在Coursera上選修《概率繪圖模型》一課,這門課程相對較難(講得比較深入),你也可以在學(xué)習(xí)一段時間之后再對其進(jìn)行了解。

丨第二步——數(shù)字圖像處理

觀看來自杜克大學(xué)的Guillermo Sapiro所教授的課程——《圖像和視頻處理:從火星到好萊塢Image and Video Processing: From Mars to Hollywood with a Stop at the Hospital》,該課程所提供的教學(xué)大綱每章都是獨(dú)立的且包涵大量的練習(xí),你可以在coursera和YouTube上找到相關(guān)的課程視頻信息。另外你可以看下Gonzalez與Woods編寫的《數(shù)字圖像處理(Digital Image Processing)》一書,使用MATLAB來運(yùn)行其中所提到的范例,相信一定會有所獲。

丨第三步——計算機(jī)視覺

一旦學(xué)習(xí)完有關(guān)數(shù)字圖像處理有關(guān)內(nèi)容,接下來應(yīng)該了解相關(guān)的數(shù)學(xué)模型在各種圖像和視頻內(nèi)容中的應(yīng)用方法。來自佛羅里達(dá)大學(xué)的Mubarak Shah教授在計算機(jī)視覺方面的課程可以作為一門很好的入門課程,其涵蓋了幾乎所有的基礎(chǔ)概念。

觀看這些影片的同時,可以學(xué)習(xí)Gatech的James Hays教授的計算機(jī)視覺項目課程所使用的概念和算法,這些練習(xí)也都是基于MATLAB的。千萬不要跳過這些練習(xí),只有在真正的練習(xí)過程中才會對這些算法和公式有更深入的了解。

丨第四步——高級計算機(jī)視覺

如果你認(rèn)真學(xué)習(xí)了前三步中的內(nèi)容,現(xiàn)在可以進(jìn)入到高級計算機(jī)視覺相關(guān)學(xué)習(xí)了。
來自巴黎中央理工學(xué)院的Nikos Paragios和Pawan Kumar講授了一門人工視覺中的離散推理(Discrete Inference in Artificial Vision)課程,它能提供相關(guān)的概率圖形模型和計算機(jī)視覺相關(guān)的大量數(shù)學(xué)知識。

到現(xiàn)在這一步來看就比較有趣了,這門課程一定能讓你感受到用簡單模型構(gòu)筑機(jī)器視覺系統(tǒng)有多么復(fù)雜。學(xué)完這門課程的話,在接觸學(xué)術(shù)論文之前又邁進(jìn)一大步。

丨第五步——引入Python和開源框架

這一步我們要接觸到Python編程語言。
就Python而言有許多像 OpenCV、PIL、vlfeat這樣的相關(guān)擴(kuò)展包,現(xiàn)在就是將這些擴(kuò)展包運(yùn)用到你的項目中的最好時機(jī)。因為如果有其他的開源框架存在的話,沒有必要從頭開始來編寫一切內(nèi)容。
如果需要參考資料的話可以考慮《使用Python對計算機(jī)視覺進(jìn)行編程 Programming Computer Vision with Python》,使用這本書就夠了。你可以動手去嘗試下,看看MATLAB和Python結(jié)合的話如何來實現(xiàn)你的算法。

丨第六步——機(jī)器學(xué)習(xí)與CovNets(卷積神經(jīng)網(wǎng)絡(luò)

有關(guān)如何從頭開始機(jī)器學(xué)習(xí)的資料實在太多,你可以從在網(wǎng)上查找到大量相關(guān)教程

從現(xiàn)在開始最好一直使用Python進(jìn)行編程,可以看下《使用Python建立機(jī)器學(xué)習(xí)系統(tǒng)——Building Machine Learning Systems with Python》和《Python機(jī)器學(xué)習(xí)——Python Machine Learning》這兩本書。
目前深度學(xué)習(xí)正大行其道,可以試著學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在計算機(jī)視覺中的應(yīng)用( Computer Vision: the use of CovNets),在此推薦斯坦福的CS231n課程:針對視覺識別的卷積神經(jīng)網(wǎng)絡(luò)。

丨第七步——如何才能更進(jìn)一步

行文至此,你可能會覺得已經(jīng)講了太多的內(nèi)容,需要學(xué)的已經(jīng)太多。但是,你還可以進(jìn)一步進(jìn)行探索研究。
其中一個方法是看看由多倫多大學(xué)的Sanja Fidler和James Hays所舉行的一系列研討會課程,能幫助你對當(dāng)下計算機(jī)視覺研究方向的最新概念有所理解。
另一種即跟著 CVPR、ICCV、 ECCV、 BMVC這些頂級學(xué)術(shù)會議的相關(guān)學(xué)術(shù)論文,通過會上的研討會、主旨演講以及tutorial等日程一定能學(xué)到不少知識。

總結(jié):如果你按照步驟一步步完成所有的學(xué)習(xí)任務(wù),屆時你將大概了解計算機(jī)視覺中有關(guān)濾波器、特征檢測、描述、相機(jī)模型、追蹤器的歷史,另外還學(xué)習(xí)到分割和識別、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的最新進(jìn)展。希望本文能幫助你在計算機(jī)視覺領(lǐng)域走得更遠(yuǎn),學(xué)習(xí)得更加深入。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1275

    瀏覽量

    56577
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4320

    瀏覽量

    119997
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1694

    瀏覽量

    45901

原文標(biāo)題:從計算機(jī)視覺的小白變?yōu)榇笊瘢阈枰?jīng)歷這七個階段

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計算機(jī)視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?654次閱讀

    計算機(jī)視覺技術(shù)的AI算法模型

    計算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標(biāo),計算機(jī)
    的頭像 發(fā)表于 07-24 12:46 ?543次閱讀

    機(jī)器視覺計算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計算機(jī)視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?442次閱讀

    計算機(jī)視覺的五大技術(shù)

    計算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機(jī)視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對象檢測、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1137次閱讀

    計算機(jī)視覺的工作原理和應(yīng)用

    計算機(jī)視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計算機(jī)和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進(jìn)行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?1500次閱讀

    計算機(jī)視覺與人工智能的關(guān)系是什么

    、交流等方面。計算機(jī)視覺與人工智能之間存在著密切的聯(lián)系,計算機(jī)視覺是人工智能的一個重要分支,也是實現(xiàn)人工智能的關(guān)鍵技術(shù)之一。
    的頭像 發(fā)表于 07-09 09:25 ?484次閱讀

    計算機(jī)視覺與智能感知是干嘛的

    引言 計算機(jī)視覺(Computer Vision)是一門研究如何使計算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?654次閱讀

    計算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    ,旨在實現(xiàn)對圖像和視頻的自動分析和理解。 機(jī)器視覺 機(jī)器視覺計算機(jī)視覺的一個分支,主要應(yīng)用于工業(yè)自動化領(lǐng)域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?384次閱讀

    計算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程計算機(jī)視覺的目標(biāo)是使計算機(jī)能夠像人類一樣“看到”和理解圖像或視頻內(nèi)容。 1.2 圖像處理 圖像處理,也稱為數(shù)字圖像處理,是應(yīng)用數(shù)學(xué)和計算
    的頭像 發(fā)表于 07-09 09:16 ?1088次閱讀

    計算機(jī)視覺屬于人工智能嗎

    和解釋視覺信息,從而實現(xiàn)對圖像和視頻的自動分析和處理。 計算機(jī)視覺的基本概念 2.1 計算機(jī)視覺
    的頭像 發(fā)表于 07-09 09:11 ?1027次閱讀

    計算機(jī)視覺的主要研究方向

    計算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計算機(jī)
    的頭像 發(fā)表于 06-06 17:17 ?774次閱讀

    計算機(jī)視覺的十大算法

    隨著科技的不斷發(fā)展,計算機(jī)視覺領(lǐng)域也取得了長足的進(jìn)步。本文將介紹計算機(jī)視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)檢測、人臉識別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1177次閱讀
    <b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計算機(jī)視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進(jìn)行的工件的定位、測量、檢測等重復(fù)性勞動;計算機(jī)視覺的主要任務(wù)是賦予智能機(jī)器人視覺,利用測距、物體標(biāo)定與識別等功能實現(xiàn)
    發(fā)表于 01-16 10:06 ?514次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的區(qū)別

    什么是計算機(jī)視覺?計算機(jī)視覺的三種方法

    計算機(jī)視覺是指通過為計算機(jī)賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計算機(jī)缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-16 16:38 ?4409次閱讀
    什么是<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>?<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的三種方法

    最適合AI應(yīng)用的計算機(jī)視覺類型是什么?

    計算機(jī)視覺是指為計算機(jī)賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計算機(jī)缺乏像人類一樣憑直覺產(chǎn)生
    的頭像 發(fā)表于 11-15 16:38 ?407次閱讀
    最適合AI應(yīng)用的<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>類型是什么?