0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用人工智能開發(fā)機器視覺系統(tǒng)可能存在的十大誤區(qū)

指南車機器人科技 ? 來源:指南車機器人科技 ? 2023-04-24 10:42 ? 次閱讀

機器視覺 (MV) 和人工智能 (AI) 為各類前沿應用程序提供了寶貴的檢測和分析功能。與所有先進技術一樣,該領域也存在一些陷阱,需要小心防范。

借助機器視覺,電子系統(tǒng)可以使用一個或多個電子攝像機、高級光傳感器模數(shù)轉換器 (ADC) 和數(shù)字信號處理器 (DSP) 觀察周圍的環(huán)境和物體。這項技術的原型已經使用數(shù)十年,大多數(shù)應用都在醫(yī)療、國防/航空航天和工業(yè)自動化領域。

近年來,3D 傳感技術不斷改進,組件模塊日趨緊湊,高質量 CMOS 圖像傳感器和功能強大的數(shù)據處理器價格大幅跳水,機器視覺的應用也呈現(xiàn)出井噴態(tài)勢。美國知名咨詢公司Grandview 研究預計,全球機器視覺市場將延續(xù)目前的爆炸式增長,在 2025 年達到 182.5 億美元,復合年均增長率 (CAGR) 達 7.7%。

機器視覺系統(tǒng)的新市場包括:

工廠自動化和機器人技術:外觀檢驗、診斷、組裝、移動方式機器人、數(shù)字制作、服務機器人、救援機器人

智能交通系統(tǒng):交通監(jiān)控、自動駕駛車輛、駕駛員安全輔助

安全與執(zhí)法:安全監(jiān)控、攝像網絡、遙控感應、水下和惡劣環(huán)境作業(yè)

生命科學:農業(yè)、林業(yè)、漁業(yè)、土木/建筑工程、商業(yè)、體育、時尚、家居等

多媒體:數(shù)據庫存檔/檢索、文檔、文化/遺產、虛擬現(xiàn)實 (VR)/混合現(xiàn)實 (MR)/增強現(xiàn)實 (AR)、娛樂

生物醫(yī)學:斷層掃描、內窺鏡檢查、計算機輔助診斷、計算機輔助手術、計算解剖學、生物信息學、護理

人機交互:面部/手勢/行為/步態(tài)/凝視分析、生物識別、可穿戴計算、第一人稱視覺系統(tǒng)

咨詢公司Gartner 的最新研究稱,到 2025 年:

集成機器視覺的高級駕駛員輔助系統(tǒng) (ADAS) 在汽車中的滲透率將從目前的 10% 提高到 35%。

零售商店使用應用機器視覺技術之后,可以通過針對性促銷活動促使客流量增長 20%,店鋪利潤率增長 10%。

五大消費類電子產品制造商銷售的所有智能家電中,20% 將配備機器視覺技術。

接近所有高端智能手機以及 30% 的基礎智能手機都將具備機器視覺功能,面部或手勢識別將成為標準的身份驗證機制。

機器視覺最早可以追溯至上世紀 50 年代,當時任職于 RCA 的 P. K. Weimer、S. V. Forgue 和 R. R. Goodrich 合作開發(fā)了用于早期電子相機的光導攝像管。光導攝像管借助光電導體作為目標材料來捕獲圖像。上世紀 70 年代末之前,NASA 在大多數(shù)具有遙感功能的無人深空探測器上都部署了 RCA 的攝像管相機。

若要成功開發(fā)和實施機器視覺解決方案,關鍵是選擇值得信賴的技術合作伙伴,建立必要的硬件組件和軟件框架,提供視覺算法、攝像頭接口標準、高級分析、人工智能和機器學習。對于任何企業(yè)來說,都有可為之事和不可為之事。我們在此列出了開發(fā)現(xiàn)代機器視覺解決方案時需要考慮的 10 大注意事項。

1. 人工智能開發(fā),數(shù)據質量先行:機器視覺系統(tǒng)若要正常運行,需要獲取、處理、分析和理解圖像,而這些工作均需依靠人工智能完成。為 實現(xiàn)這種理解,首先需要編譯信息,亦即讓人工智能用來學習的訓練數(shù)據。訓練數(shù)據質量越好,人工智能的質量就越好。由此也可以提高機器視覺系統(tǒng)的性能。如果訓練數(shù)據質量低劣或數(shù)量不足,將妨礙人工智能和機器視覺應用取得成功。如果缺乏適當?shù)挠柧殧?shù)據,即使編程再好,人工智能也無法達到預期效果。

2. 功能不斷疊加,漸漸脫離初衷:開始每個項目時,都要設定一系列合乎實際的期望和有望實現(xiàn)的目標。人類大腦能夠同時處理來自五種感官的數(shù)據,并根據這些數(shù)據立即采取行動,這是真正意義上的一心多用。通過編程處理,機器通常能夠很好地完成單一任務,但在需要學習和執(zhí)行多項任務時,人工智能可能遇到困難。初始規(guī)劃階段,需要重點關注關系到成敗的主要功能。人工智能應用的初始版本便執(zhí)行種類繁多的任務,可能會導致任務無法正確執(zhí)行,并導致初始結果滿意度欠缺。

3. 視覺的語言:成功的機器視覺應用不僅需要功能強大的硬件,還離不開高超的編程技能。編程可以采用人工智能框架和編碼語言的形式。人工智能框架可以簡化、加速人工智能應用開發(fā),包括機器學習、深度學習、神經網絡和自然語言處理 (NLP)。人工智能框架可以充當人工智能系統(tǒng)的開發(fā)模板。與從頭開始開發(fā)人工智能應用相比,這種方法的開發(fā)、部署和管理難度都大大降低。有幾種編程語言可以與人工智能配合使用,每種語言都有獨到的優(yōu)勢。其中包括 Caffe、Python、Pytorch、TensorFlow、C++、Lisp、Java、R、Prolog 和 Model Zoo。

在機器視覺應用規(guī)劃階段,必須確定使用內部資源還是外包編程。程序員的技能水平如何?打算使用哪種編程語言?所選編程語言的最佳開發(fā)工具是哪種?人工智能程序和后續(xù)更新的編譯難度如何?如何發(fā)布更新?

4. 選擇合適的硬件主器件:選擇運行機器視覺人工智能應用程序的硬件時,存在諸多選項。現(xiàn)場可編程邏輯門陣列 (FPGA)、圖形處理單元 (GPU) 以及微控制器 (MCU) 都各有所長。

FPGA: FPGA 是非常強大的處理單元,配置后可以滿足幾乎所有應用程序的需求??梢詣?chuàng)建定制的 FPGA 架構來處理特定的應用程序。與其他選項(如 GPU 和 CPU)相比,可以實現(xiàn)更高的性能、更低的成本和更好的能效。

GPU: GPU 是專用處理器,主要用于處理圖像和視頻。與 CPU 相比,其處理單元更簡單,但承載更多的內核。因此,GPU 非常適合需要并行處理大量數(shù)據的應用程序,例如圖像像素或視頻編解碼器。然而,GPU 也存在一些局限性:能耗高,同時由于使用 CUDA 和 OpenCL 等語言進行編程,靈活性不及 CPU。

CPUs: CPU 的核心數(shù)量有限,無法快速處理人工智能所需的大量數(shù)據。因此,CPU 僅適用于有效批量較小的小模型。CPU 的優(yōu)點是易于編程、成本較低,同時廣泛支持各類編程框架。

除此之外,選擇硬件時還需要考慮能效、設備移動性、IO 數(shù)量、操作環(huán)境,以及最重要因素 - 成本。最初的計劃階段全面調查并周全考慮,可以避免日后的麻煩。借助所有的處理器和支持組件,獲取足夠的處理能力,為將來需要實現(xiàn)的功能做好鋪墊,同時預備足夠的板載內存,用于處理固件升級和人工智能算法增長。

5. 圖像傳感器和照明:CMOS 傳感器的前照式 (FSI) 和背照式 (BSI) 技術取得了巨大的進步,即使在低光照水平下也可以獲得更高分辨率的圖像。適當?shù)恼彰饕彩侵匾目紤]因素。所有照明性能的基礎都可以歸結為三種主要的圖像傳感器特性:量子效率 (QE)、暗電流和飽和容量。量子效率是設備為特定數(shù)量的入射光子所產生的電荷的比率。由于 QE 在不同的波長上會發(fā)生變化,因此最好將其繪制為波長的函數(shù)。由此,可以實現(xiàn)設備靈敏度的精準測量。安裝在相機內時,由于外部光學和電子效應,相機的最大 QE 應小于傳感器。

此外,暗電流和飽和容量也是機器視覺系統(tǒng)設計的重要考慮因素。暗電流測量 CMOS 成像器內熱產生的電子數(shù)量變化,以及同時可能帶來的噪聲。飽和容量表示單個像素可以存儲的電子數(shù)。盡管這些參數(shù)通常未在相機制造商的數(shù)據表中說明,但可以與QE測量值一起,用以計算最大信噪比 (S/N)、絕對靈敏度和應用的動態(tài)范圍。

適當?shù)恼彰饔兄谔岣邫C器視覺應用程序的準確性和效率。照明需要考慮的其他因素包括波長(例如紅外線)、固定照明甚至照明放置。研究證明,直接照射到機器視覺系統(tǒng)攝像機上的光源和反射物會降低物體檢測的準確性。

412c08ee-e021-11ed-bfe3-dac502259ad0.png

6. 背景識別:背景可能給機器視覺系統(tǒng)帶來特殊的問題。想象一下,安全系統(tǒng)無法偵察到壞人深色外套中的黑色槍支。同樣,工廠環(huán)境中的反光金屬物體也可能導致視覺檢測算法無法正常運行,從而出現(xiàn)此類困難。輔助算法可以通過關注電磁波 (EM) 光譜的不同波長(例如紅外和自適應光)來緩解這種情況。

7. 對象的定位和方向:人工智能可以幫助機器視覺解決方案識別從訓練數(shù)據中學習到的物體。如果您使用相同的物體但更改其方向,一些機器視覺系統(tǒng)就會出錯。這種情況可以通過為人工智能提供精確的訓練集來緩解,但也會導致數(shù)據量變得密集。

8. 物體縮放:我們分別從兩英尺遠和 10 英尺遠的距離看籃球時,知道兩次看到的是同一物體,只是距離不同。在這一點上,多樣化的訓練集和人工智能的準確測試有助于確保某個距離的物體可以被正確識別。鏡頭和焦距的選擇也直接影響到應用程序的性能。大多數(shù)機器視覺系統(tǒng)都讀取像素值,但若要成功部署到移動應用,縮放方面的考慮同樣不可或缺。

9. 物體變形:機器視覺系統(tǒng)能夠識別存在微小偏差的同一物體,這種能力在機器視覺應用中至關重要,特別是在交通和安全方面。對于應用的準確性和操作安全性而言,識別四肢有關節(jié)的行人極其重要。此處需要再次強調為人工智能學習提供高質量訓練集的必要性,但同樣導致數(shù)據量更密集。

10. 動作和運動:快速運動/移動會給機器視覺系統(tǒng)帶來問題。對于安全性至關重要的應用而言,這可能帶來致命的危險。這種情況可以通過選擇適當?shù)某上衿骺扉T、特殊的編程算法和照明來緩解。廉價的圖像傳感器通常使用卷簾快門,這會破壞快速移動的圖像。全局快門可能增加圖像傳感器的成本,但卻是適當捕捉快速運動的必要功能。預測和準備能力是判斷人類智力的兩大標準。人工智能應用程序同樣如此。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關注

    關注

    161

    文章

    4269

    瀏覽量

    119571
  • 人工智能
    +關注

    關注

    1787

    文章

    46074

    瀏覽量

    235203
  • 信號處理器
    +關注

    關注

    1

    文章

    250

    瀏覽量

    25175

原文標題:【深度】利用人工智能開發(fā)機器視覺系統(tǒng) 可能存在的十大誤區(qū)

文章出處:【微信號:指南車機器人科技,微信公眾號:指南車機器人科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產品
    發(fā)表于 08-22 15:00

    機器視覺人工智能的關系與應用

    視覺信息的技術。它涉及到圖像的獲取、處理、分析和解釋,以實現(xiàn)對物體、場景和事件的識別、定位、測量和分類。機器視覺系統(tǒng)通常由圖像采集設備、圖像處理軟件和執(zhí)行器組成,可以應用于各種自動化和智能
    的頭像 發(fā)表于 07-16 10:27 ?450次閱讀

    CCD機器視覺系統(tǒng)的工作原理和特性

    隨著科技的飛速發(fā)展,機器視覺技術已成為工業(yè)自動化、質量檢測、智能監(jiān)控等領域的重要支撐。CCD機器視覺系統(tǒng)作為
    的頭像 發(fā)表于 06-06 16:27 ?766次閱讀

    機器視覺系統(tǒng)與運動控制系統(tǒng)的區(qū)別

      在工業(yè)自動化和智能制造的浪潮中,機器視覺系統(tǒng)和運動控制系統(tǒng)作為兩大關鍵技術,各自扮演著不可或缺的角色。它們雖然都是為了實現(xiàn)更高效、更精確的自動化操作,但在技術原理、功能定位、應用領
    的頭像 發(fā)表于 06-06 14:10 ?510次閱讀

    機器視覺系統(tǒng)的工作原理和應用領域

      隨著科技的飛速發(fā)展,機器視覺系統(tǒng)已成為工業(yè)自動化領域不可或缺的一部分。機器視覺系統(tǒng),顧名思義,就是使用機器來模擬和實現(xiàn)人類
    的頭像 發(fā)表于 06-06 14:04 ?549次閱讀

    5G智能物聯(lián)網課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    /25611.html *附件:芯片模組外觀檢測實訓.pdf 人工智能 機器人:基于融合系統(tǒng)機器人仿真實訓 38分02秒 https://t.elecfans.com/v/25521
    發(fā)表于 04-01 10:40

    機器視覺系統(tǒng)人工智能有什么區(qū)別

    機器視覺系統(tǒng)的特點是:非接觸測量,對于觀測者與被觀測者都不會產生任何損傷,從而提高系統(tǒng)的可靠性;具有較寬的光譜響應范圍,例如使用人眼看不見的紅外測量,擴展了人眼的
    的頭像 發(fā)表于 02-27 18:12 ?1435次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>和<b class='flag-5'>人工智能</b>有什么區(qū)別

    嵌入式人工智能的就業(yè)方向有哪些?

    聯(lián)網ARM開發(fā) NB-IoT開發(fā)及實戰(zhàn) 七:python工程師,人工智能工程師 python語法基礎 python核心編程 基于OpenCV的機器
    發(fā)表于 02-26 10:17

    英特爾、谷歌、英偉達運用人工智能推動處理器設計與生產

    兩家著名的芯片設計軟件企業(yè),Cadence和Synopsys,均利用人工智能強化設計工具。谷歌展示了使用人工智能開發(fā)AI加速度器的方法。英偉達亦在產品制造過程中運用大量人工智能,替代低效的傳統(tǒng)計算程序。
    的頭像 發(fā)表于 12-15 10:16 ?495次閱讀

    機器視覺系統(tǒng)中前光源與背光源的應用實例

    機器視覺系統(tǒng)中光源是關鍵組成部分之一,在機器視覺系統(tǒng)中具有分重要的作用。
    的頭像 發(fā)表于 11-14 11:10 ?688次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>中前光源與背光源的應用實例

    工業(yè)機器視覺系統(tǒng)中光源設計應用

    機器視覺系統(tǒng)主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。而圖像的獲取是機器視覺的核心,圖像的獲取系統(tǒng)則是由光源、鏡頭、相機三
    發(fā)表于 11-03 12:34 ?631次閱讀
    工業(yè)<b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>中光源設計應用

    完整的機器視覺系統(tǒng)包括哪些?機器視覺的工作原理

    機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是指通過機器
    發(fā)表于 10-19 14:16 ?968次閱讀
    完整的<b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>包括哪些?<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>的工作原理

    機器視覺系統(tǒng)基本原理及應用分類

    機器視覺(machine vision)是由計算機或圖像處理器以及相關設備來模擬人的視覺行為,完成得到人的視覺系統(tǒng)所得到的信息。 簡單說來,機器
    發(fā)表于 10-08 10:40 ?701次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>基本原理及應用分類

    如何快速設計和部署智能機器視覺系統(tǒng)

    和子系統(tǒng),包括高性能硬件和先進的人工智能/機器學習(AI/ML) 軟件。機器視覺從優(yōu)化視頻采集技術和視覺
    的頭像 發(fā)表于 10-03 14:31 ?774次閱讀
    如何快速設計和部署<b class='flag-5'>智能</b><b class='flag-5'>機器</b><b class='flag-5'>視覺系統(tǒng)</b>