0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器視覺入門經(jīng)典書籍推薦

ss ? 來源:網(wǎng)絡整理 ? 作者:工程師譚軍 ? 2018-09-26 14:44 ? 次閱讀

本文主要是關于機器視覺的相關介紹,并著重對機器視覺入門經(jīng)典書籍進行了詳盡的闡述。

機器視覺

機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結果來控制現(xiàn)場的設備動作。

一個典型的工業(yè)機器視覺系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠心鏡頭、顯微鏡頭)、 相機(包括CCD相機和COMS相機)、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。

系統(tǒng)可再分為

一、采集和分析分開的系統(tǒng)。

主端電腦(Host Computer)

影像擷取卡(Frame Grabber)與影像處理器

影像攝影機

定焦鏡頭鏡頭

顯微鏡頭

照明設備

Halogen光源LED光源

高周波螢光燈源

閃光燈源

其他特殊光源

影像顯示器

LCD

機構及控制系統(tǒng)

PLC、PC-Base控制器

精密桌臺

伺服運動機臺

二、采集和分析一體的系統(tǒng)

智能相機(圖像采集和分析一體)

其他配套外圍設備:光源、顯示、PLC控制系統(tǒng)等等。

工作原理編輯

機器視覺檢測系統(tǒng)采用CCD照相機將被檢測的目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號,圖像處理系統(tǒng)對這些信號進行各種運算來抽取目標的特征,如面積、數(shù)量、位置、長度,再根據(jù)預設的允許度和其他條件輸出結果,包括尺寸、角度、個數(shù)、合格 / 不合格、有 / 無等,實現(xiàn)自動識別功能。

典型結構

一個典型的機器視覺系統(tǒng)包括以下五大塊:

照明

照明是影響機器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質量和應用效果。由于沒有通用的機器視覺照明設備,所以針對每個特定的應用實例,要選擇相應的照明裝置,以達到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈??梢姽獾娜秉c是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實用化過程中急需要解決的問題。另一方面,環(huán)境光有可能影響圖像的質量,所以可采用加防護屏的方法來減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結構光和頻閃光照明等。其中,背向照明是被測物放在光源和攝像機之間,它的優(yōu)點是能獲得高對比度的圖像。前向照明是光源和攝像機位于被測物的同側,這種方式便于安裝。結構光照明是將光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變,解調出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。

鏡頭

FOV(Field of Vision)=所需分辨率*亞象素*相機尺寸/PRTM(零件測量公差比)

鏡頭選擇應注意:

①焦距②目標高度 ③影像高度 ④放大倍數(shù) ⑤影像至目標的距離 ⑥中心點 /節(jié)點⑦畸變

視覺檢測中如何確定鏡頭的焦距

為特定的應用場合選擇合適的工業(yè)鏡頭時必須考慮以下因素:

· 視野 - 被成像區(qū)域的大小。

· 工作距離 (WD) - 攝像機鏡頭與被觀察物體或區(qū)域之間的距離。

· CCD - 攝像機成像傳感器裝置的尺寸。

· 這些因素必須采取一致的方式對待。如果在測量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進行測量,則以英尺進行計算,最后再轉換為毫米。

參考如下例子:有一臺 1/3” C 型安裝的 CCD 攝像機(水平方向為 4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過圓整)。

FL = 4.8 毫米 x 305 毫米 / 64 毫米

FL = 1464 毫米 / 64 毫米

FL = 按 23 毫米鏡頭的要求

FL = 0.19” x 12” / 2.5”

FL = 2.28” / 2.5”

FL = 0.912” x 25.4 毫米/inch

FL = 按 23 毫米鏡頭的要求

注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計算要求的工業(yè)鏡頭焦距時,必須使用工作距離

高速相機

按照不同標準可分為:標準分辨率數(shù)字相機和模擬相機等

。要根據(jù)不同的實際應用場合選不同的相機和高分辨率相機:

按成像色彩劃分,可分為彩色相機和黑白相機;

按分辨率劃分,像素數(shù)在38萬以下的為普通型,像素數(shù)在38萬以上的高分辨率型;

按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機;

按掃描方式劃分,可分為行掃描相機(線陣相機)和面掃描相機(面陣相機)兩種方式;(面掃描相機又可分為隔行掃描相機和逐行掃描相機);

按同步方式劃分,可分為普通相機(內同步)和具有外同步功能的相機等。

圖像采集卡

圖像采集卡只是完整的機器視覺系統(tǒng)的一個部件,但是

它扮演一個非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。

比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內置的多路開關。例如,可以連接8個不同的攝像機,然后告訴采集卡采用那一個相機抓拍到的信息。有些采集卡有內置的數(shù)字輸入以觸發(fā)采集卡進行捕捉,當采集卡抓拍圖像時數(shù)字輸出口就觸發(fā)閘門。

機器視覺入門經(jīng)典書籍推薦

1. 線性代數(shù) (Linear Algebra):

我想國內的大學生都會學過這門課程,但是,未必每一位老師都能貫徹它的精要。這門學科對于Learning是必備的基礎,對它的透徹掌握是必不可少 的。我在科大一年級的時候就學習了這門課,后來到了香港后,又重新把線性代數(shù)讀了一遍,所讀的是

Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.

這本書是MIT的線性代數(shù)課使用的教材,也是被很多其它大學選用的經(jīng)典教材。它的難度適中,講解清晰,重要的是對許多核心的概念討論得比較 透徹。我個人覺得,學習線性代數(shù),最重要的不是去熟練矩陣運算和解方程的方法——這些在實際工作中MATLAB可以代勞,關鍵的是要深入理解幾個基礎而又 重要的概念:子空間(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和線性變換(Linear transform)。從我的角度看來,一本線代教科書的質量,就在于它能否給這些根本概念以足夠的重視,能否把它們的聯(lián)系講清楚。Strang的這本書 在這方面是做得很好的。

而且,這本書有個得天獨厚的優(yōu)勢。書的作者長期在MIT講授線性代數(shù)課(18.06),課程的video在MIT的Open courseware網(wǎng)站上有提供。有時間的朋友可以一邊看著名師授課的錄像,一邊對照課本學習或者復習。

http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm

2. 概率和統(tǒng)計 (Probability and Statistics):

概率論和統(tǒng)計的入門教科書很多,我目前也沒有特別的推薦。我在這里想介紹的是一本關于多元統(tǒng)計的基礎教科書:

Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern

這本書是我在剛接觸向量統(tǒng)計的時候用于學習的,我在香港時做研究的基礎就是從此打下了。實驗室的一些同學也借用這本書學習向量統(tǒng)計。這本書 沒有特別追求數(shù)學上的深度,而是以通俗易懂的方式講述主要的基本概念,讀起來很舒服,內容也很實用。對于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)這些Learning中的基本方法也展開了初步的論述。

之后就可以進一步深入學習貝葉斯統(tǒng)計和Graphical models。一本理想的書是

Introduction to Graphical Models (draft version)。 by M. Jordan and C. Bishop.

我不知道這本書是不是已經(jīng)出版了(不要和Learning in Graphical Models混淆,那是個論文集,不適合初學)。這本書從基本的貝葉斯統(tǒng)計模型出發(fā)一直深入到復雜的統(tǒng)計網(wǎng)絡的估計和推斷,深入淺 出,statistical learning的許多重要方面都在此書有清楚論述和詳細講解。MIT內部可以access,至于外面,好像也是有電子版的。

3. 分析 (Analysis):

我想大家基本都在大學就學過微積分或者數(shù)學分析,深度和廣度則隨各個學校而異了。這個領域是很多學科的基礎,值得推薦的教科書莫過于

Principles of Mathematical Analysis, by Walter Rudin

有點老,但是絕對經(jīng)典,深入透徹。缺點就是比較艱深——這是Rudin的書的一貫風格,適合于有一定基礎后回頭去看。

在分析這個方向,接下來就是泛函分析(Functional Analysis)。

Introductory Functional Analysis with Applications, by Erwin Kreyszig.

適合作為泛函的基礎教材,容易切入而不失全面。我特別喜歡它對于譜論和算子理論的特別關注,這對于做learning的研究是特別重要的。 Rudin也有一本關于functional analysis的書,那本書在數(shù)學上可能更為深刻,但是不易于上手,所講內容和learning的切合度不如此書。

在分析這個方向,還有一個重要的學科是測度理論(Measure theory),但是我看過的書里面目前還沒有感覺有特別值得介紹的。

4. 拓撲 (Topology):

在我讀過的基本拓撲書各有特色,但是綜合而言,我最推崇:

Topology (2nd Ed.) by James Munkres

這本書是Munkres教授長期執(zhí)教MIT拓撲課的心血所凝。對于一般拓撲學(General topology)有全面介紹,而對于代數(shù)拓撲(Algebraic topology)也有適度的探討。此書不需要特別的數(shù)學知識就可以開始學習,由淺入深,從最基本的集合論概念(很多書不屑講這個)到Nagata- Smirnov Theorem和Tychonoff theorem等較深的定理(很多書避開了這個)都覆蓋了。講述方式思想性很強,對于很多定理,除了給出證明過程和引導你思考其背后的原理脈絡,很多令人 贊嘆的亮點——我常讀得忘卻饑餓,不愿釋手。很多習題很有水平。

5. 流形理論 (Manifold theory):

對于拓撲和分析有一定把握時,方可開始學習流形理論,否則所學只能流于浮淺。我所使用的書是

Introduction to Smooth Manifolds. by John M. Lee

雖然書名有introduction這個單詞,但是實際上此書涉入很深,除了講授了基本的manifold, tangent space, bundle, sub-manifold等,還探討了諸如綱理論(Category theory),德拉姆上同調(De Rham cohomology)和積分流形等一些比較高級的專題。對于李群和李代數(shù)也有相當多的討論。行文通俗而又不失嚴謹,不過對某些記號方式需要熟悉一下。

雖然李群論是建基于平滑流形的概念之上,不過,也可能從矩陣出發(fā)直接學習李群和李代數(shù)——這種方法對于急需使用李群論解決問題的朋友可能更加實用。 而且,對于一個問題從不同角度看待也利于加深理解。下面一本書就是這個方向的典范:

Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall

此書從開始即從矩陣切入,從代數(shù)而非幾何角度引入矩陣李群的概念。并通過定義運算的方式建立exponential mapping,并就此引入李代數(shù)。這種方式比起傳統(tǒng)的通過“左不變向量場(Left-invariant vector field)“的方式定義李代數(shù)更容易為人所接受,也更容易揭示李代數(shù)的意義。最后,也有專門的論述把這種新的定義方式和傳統(tǒng)方式聯(lián)系起來。

結語

關于機器視覺的相關介紹就到這了,如有不足之處歡迎指正。

相關閱讀推薦:什么是機器視覺,有何實際意義

相關閱讀推薦:關于機器視覺的一些事

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 控制器
    +關注

    關注

    112

    文章

    16103

    瀏覽量

    177067
  • 機器視覺
    +關注

    關注

    161

    文章

    4320

    瀏覽量

    119991
收藏 人收藏

    評論

    相關推薦

    Linux學習書籍入門

    想學習嵌入式Linux的初學者,如果你想深入了解Linux,作為凌陽教育的老師為大家推薦幾本關于Linux入門學習的書籍,希望能幫助到你們哦!  入門篇  《LINUX權威指南》書不錯,寫的很全面也
    發(fā)表于 01-20 17:01

    Linux學習書籍入門

    想學習嵌入式Linux的初學者,如果你想深入了解Linux,作為凌陽教育的老師為大家推薦幾本關于Linux入門學習的書籍,希望能幫助到你們哦!  入門篇  《LINUX權威指南》書不錯,寫的很全面也
    發(fā)表于 01-20 17:01

    機器人基礎書籍

    列舉部分學習過程中接觸的部分書籍,部分有中文版,部分有更新版本。1.機器人基礎書籍適合入門書籍機器
    發(fā)表于 05-22 06:53

    7本百看不厭的Matlab入門經(jīng)典教程書籍推薦!

    收藏 7本 Matlab入門經(jīng)典教程書籍,不可錯過!
    發(fā)表于 07-22 16:59

    ucos-ii中文書籍

    ucos-ii中文書(邵貝貝).rar 入門經(jīng)典書籍
    發(fā)表于 03-11 11:02 ?6次下載

    c語言經(jīng)典書籍_英版

    C complete reference,c語言經(jīng)典書籍。
    發(fā)表于 03-22 15:44 ?0次下載

    Protel DXP2004經(jīng)典教程

    經(jīng)典的電子設計入門書籍
    發(fā)表于 12-20 22:40 ?0次下載

    java入門經(jīng)典書籍推薦

    本文首先介紹了關于java語言的優(yōu)點,其次介紹了java入門學習的基礎,最后推薦了學習java的書籍。
    的頭像 發(fā)表于 04-13 09:13 ?1.9w次閱讀

    c語言入門書籍推薦

    本文主要介紹c語言入門書籍,首先講解了C語言的優(yōu)點,其次詳細的推薦了幾款適合C語言入門書籍
    的頭像 發(fā)表于 04-13 09:52 ?4.7w次閱讀

    7本Matlab入門經(jīng)典教程書籍介紹

    大家推薦幾款實用的參考書,讓我們一起打怪升級吧。 小編今天在這里推薦7本百看不厭的matlab入門經(jīng)典教程書籍! 第一本:《Matlab經(jīng)典教程—從
    發(fā)表于 05-08 16:25 ?1439次閱讀

    python入門書籍推薦

    本視頻主要詳細介紹了python入門書籍推薦,分別是python入門書籍推薦、笨辦法學Python、Python核心編程第三版(中文版)、Python算法教程、Python科學計算(第
    的頭像 發(fā)表于 12-27 16:42 ?3.3w次閱讀

    機器視覺系統(tǒng)的經(jīng)典應用

    機器視覺系統(tǒng)的經(jīng)典應用。
    發(fā)表于 05-28 10:25 ?15次下載

    機器視覺檢測系統(tǒng)的最經(jīng)典結構簡介

    機器視覺檢測系統(tǒng)的最經(jīng)典結構資料免費下載。
    發(fā)表于 06-01 09:49 ?14次下載

    入門必看機器視覺詳解1

    機器視覺詳解及入門必看 機器視覺系統(tǒng)具有高效率、高度自動化的特點,可以實現(xiàn)很高的分辨率精度和速度。
    的頭像 發(fā)表于 02-07 13:47 ?1056次閱讀
    <b class='flag-5'>入門</b>必看<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>詳解1

    入門必看機器視覺詳解2

    機器視覺詳解及入門必看 機器視覺系統(tǒng)具有高效率、高度自動化的特點,可以實現(xiàn)很高的分辨率精度和速度。
    的頭像 發(fā)表于 02-07 13:47 ?773次閱讀