本文主要是關于機器視覺的相關介紹,并著重對機器視覺入門經(jīng)典書籍進行了詳盡的闡述。
機器視覺
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結果來控制現(xiàn)場的設備動作。
一個典型的工業(yè)機器視覺系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠心鏡頭、顯微鏡頭)、 相機(包括CCD相機和COMS相機)、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。
系統(tǒng)可再分為
一、采集和分析分開的系統(tǒng)。
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機
定焦鏡頭鏡頭
顯微鏡頭
照明設備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機構及控制系統(tǒng)
精密桌臺
伺服運動機臺
二、采集和分析一體的系統(tǒng)
智能相機(圖像采集和分析一體)
其他配套外圍設備:光源、顯示、PLC控制系統(tǒng)等等。
工作原理編輯
機器視覺檢測系統(tǒng)采用CCD照相機將被檢測的目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號,圖像處理系統(tǒng)對這些信號進行各種運算來抽取目標的特征,如面積、數(shù)量、位置、長度,再根據(jù)預設的允許度和其他條件輸出結果,包括尺寸、角度、個數(shù)、合格 / 不合格、有 / 無等,實現(xiàn)自動識別功能。
典型結構
一個典型的機器視覺系統(tǒng)包括以下五大塊:
照明
照明是影響機器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質量和應用效果。由于沒有通用的機器視覺照明設備,所以針對每個特定的應用實例,要選擇相應的照明裝置,以達到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈??梢姽獾娜秉c是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實用化過程中急需要解決的問題。另一方面,環(huán)境光有可能影響圖像的質量,所以可采用加防護屏的方法來減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結構光和頻閃光照明等。其中,背向照明是被測物放在光源和攝像機之間,它的優(yōu)點是能獲得高對比度的圖像。前向照明是光源和攝像機位于被測物的同側,這種方式便于安裝。結構光照明是將光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變,解調出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機尺寸/PRTM(零件測量公差比)
鏡頭選擇應注意:
①焦距②目標高度 ③影像高度 ④放大倍數(shù) ⑤影像至目標的距離 ⑥中心點 /節(jié)點⑦畸變
視覺檢測中如何確定鏡頭的焦距
為特定的應用場合選擇合適的工業(yè)鏡頭時必須考慮以下因素:
· 視野 - 被成像區(qū)域的大小。
· 工作距離 (WD) - 攝像機鏡頭與被觀察物體或區(qū)域之間的距離。
· CCD - 攝像機成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對待。如果在測量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進行測量,則以英尺進行計算,最后再轉換為毫米。
參考如下例子:有一臺 1/3” C 型安裝的 CCD 攝像機(水平方向為 4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計算要求的工業(yè)鏡頭焦距時,必須使用工作距離
高速相機
按照不同標準可分為:標準分辨率數(shù)字相機和模擬相機等
。要根據(jù)不同的實際應用場合選不同的相機和高分辨率相機:
按成像色彩劃分,可分為彩色相機和黑白相機;
按分辨率劃分,像素數(shù)在38萬以下的為普通型,像素數(shù)在38萬以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機;
按掃描方式劃分,可分為行掃描相機(線陣相機)和面掃描相機(面陣相機)兩種方式;(面掃描相機又可分為隔行掃描相機和逐行掃描相機);
按同步方式劃分,可分為普通相機(內同步)和具有外同步功能的相機等。
圖像采集卡
圖像采集卡只是完整的機器視覺系統(tǒng)的一個部件,但是
它扮演一個非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內置的多路開關。例如,可以連接8個不同的攝像機,然后告訴采集卡采用那一個相機抓拍到的信息。有些采集卡有內置的數(shù)字輸入以觸發(fā)采集卡進行捕捉,當采集卡抓拍圖像時數(shù)字輸出口就觸發(fā)閘門。
機器視覺入門經(jīng)典書籍推薦
1. 線性代數(shù) (Linear Algebra):
我想國內的大學生都會學過這門課程,但是,未必每一位老師都能貫徹它的精要。這門學科對于Learning是必備的基礎,對它的透徹掌握是必不可少 的。我在科大一年級的時候就學習了這門課,后來到了香港后,又重新把線性代數(shù)讀了一遍,所讀的是
Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.
這本書是MIT的線性代數(shù)課使用的教材,也是被很多其它大學選用的經(jīng)典教材。它的難度適中,講解清晰,重要的是對許多核心的概念討論得比較 透徹。我個人覺得,學習線性代數(shù),最重要的不是去熟練矩陣運算和解方程的方法——這些在實際工作中MATLAB可以代勞,關鍵的是要深入理解幾個基礎而又 重要的概念:子空間(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和線性變換(Linear transform)。從我的角度看來,一本線代教科書的質量,就在于它能否給這些根本概念以足夠的重視,能否把它們的聯(lián)系講清楚。Strang的這本書 在這方面是做得很好的。
而且,這本書有個得天獨厚的優(yōu)勢。書的作者長期在MIT講授線性代數(shù)課(18.06),課程的video在MIT的Open courseware網(wǎng)站上有提供。有時間的朋友可以一邊看著名師授課的錄像,一邊對照課本學習或者復習。
http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm
2. 概率和統(tǒng)計 (Probability and Statistics):
概率論和統(tǒng)計的入門教科書很多,我目前也沒有特別的推薦。我在這里想介紹的是一本關于多元統(tǒng)計的基礎教科書:
Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern
這本書是我在剛接觸向量統(tǒng)計的時候用于學習的,我在香港時做研究的基礎就是從此打下了。實驗室的一些同學也借用這本書學習向量統(tǒng)計。這本書 沒有特別追求數(shù)學上的深度,而是以通俗易懂的方式講述主要的基本概念,讀起來很舒服,內容也很實用。對于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)這些Learning中的基本方法也展開了初步的論述。
之后就可以進一步深入學習貝葉斯統(tǒng)計和Graphical models。一本理想的書是
Introduction to Graphical Models (draft version)。 by M. Jordan and C. Bishop.
我不知道這本書是不是已經(jīng)出版了(不要和Learning in Graphical Models混淆,那是個論文集,不適合初學)。這本書從基本的貝葉斯統(tǒng)計模型出發(fā)一直深入到復雜的統(tǒng)計網(wǎng)絡的估計和推斷,深入淺 出,statistical learning的許多重要方面都在此書有清楚論述和詳細講解。MIT內部可以access,至于外面,好像也是有電子版的。
3. 分析 (Analysis):
我想大家基本都在大學就學過微積分或者數(shù)學分析,深度和廣度則隨各個學校而異了。這個領域是很多學科的基礎,值得推薦的教科書莫過于
Principles of Mathematical Analysis, by Walter Rudin
有點老,但是絕對經(jīng)典,深入透徹。缺點就是比較艱深——這是Rudin的書的一貫風格,適合于有一定基礎后回頭去看。
在分析這個方向,接下來就是泛函分析(Functional Analysis)。
Introductory Functional Analysis with Applications, by Erwin Kreyszig.
適合作為泛函的基礎教材,容易切入而不失全面。我特別喜歡它對于譜論和算子理論的特別關注,這對于做learning的研究是特別重要的。 Rudin也有一本關于functional analysis的書,那本書在數(shù)學上可能更為深刻,但是不易于上手,所講內容和learning的切合度不如此書。
在分析這個方向,還有一個重要的學科是測度理論(Measure theory),但是我看過的書里面目前還沒有感覺有特別值得介紹的。
4. 拓撲 (Topology):
在我讀過的基本拓撲書各有特色,但是綜合而言,我最推崇:
Topology (2nd Ed.) by James Munkres
這本書是Munkres教授長期執(zhí)教MIT拓撲課的心血所凝。對于一般拓撲學(General topology)有全面介紹,而對于代數(shù)拓撲(Algebraic topology)也有適度的探討。此書不需要特別的數(shù)學知識就可以開始學習,由淺入深,從最基本的集合論概念(很多書不屑講這個)到Nagata- Smirnov Theorem和Tychonoff theorem等較深的定理(很多書避開了這個)都覆蓋了。講述方式思想性很強,對于很多定理,除了給出證明過程和引導你思考其背后的原理脈絡,很多令人 贊嘆的亮點——我常讀得忘卻饑餓,不愿釋手。很多習題很有水平。
5. 流形理論 (Manifold theory):
對于拓撲和分析有一定把握時,方可開始學習流形理論,否則所學只能流于浮淺。我所使用的書是
Introduction to Smooth Manifolds. by John M. Lee
雖然書名有introduction這個單詞,但是實際上此書涉入很深,除了講授了基本的manifold, tangent space, bundle, sub-manifold等,還探討了諸如綱理論(Category theory),德拉姆上同調(De Rham cohomology)和積分流形等一些比較高級的專題。對于李群和李代數(shù)也有相當多的討論。行文通俗而又不失嚴謹,不過對某些記號方式需要熟悉一下。
雖然李群論是建基于平滑流形的概念之上,不過,也可能從矩陣出發(fā)直接學習李群和李代數(shù)——這種方法對于急需使用李群論解決問題的朋友可能更加實用。 而且,對于一個問題從不同角度看待也利于加深理解。下面一本書就是這個方向的典范:
Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall
此書從開始即從矩陣切入,從代數(shù)而非幾何角度引入矩陣李群的概念。并通過定義運算的方式建立exponential mapping,并就此引入李代數(shù)。這種方式比起傳統(tǒng)的通過“左不變向量場(Left-invariant vector field)“的方式定義李代數(shù)更容易為人所接受,也更容易揭示李代數(shù)的意義。最后,也有專門的論述把這種新的定義方式和傳統(tǒng)方式聯(lián)系起來。
結語
關于機器視覺的相關介紹就到這了,如有不足之處歡迎指正。
-
控制器
+關注
關注
112文章
16103瀏覽量
177067 -
機器視覺
+關注
關注
161文章
4320瀏覽量
119991
發(fā)布評論請先 登錄
相關推薦
評論