0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何實現(xiàn)遙感圖像等超大尺寸圖像快速識別

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-07-14 09:47 ? 次閱讀

一般情況下,遙感目標檢測中,遙感圖像的圖片尺寸都會很大,且圖像中元素極為復(fù)雜,近期開賽的亞馬遜科技AI For Good - 2022 遙感光學(xué)影像目標檢測挑戰(zhàn)賽】也不例外,動輒超過10000 x 10000的衛(wèi)星遙感圖像讓許多選手感到頭疼。同時遙感影像中目標尺寸差別大、小而密集、角度各異也導(dǎo)致常見的CV框架難以實現(xiàn)快速精準的目標識別。所以,如何實現(xiàn)遙感圖像等超大尺寸圖像快速識別?

目前比較成熟的衛(wèi)星圖像識別算法并不少,但大多依托于強大的計算資源,為了用有限的計算資源實現(xiàn)大尺寸圖像識別,我們找到了一個可行的開源框架,給大尺寸圖像識別提供了不錯的思路。

YOLT 是一個基于YOLO v2的衛(wèi)星圖像識別開源算法,核心思路是:

1. 通過圖片裁切和圖像網(wǎng)絡(luò)重構(gòu)解決圖像尺寸問題;

2. 通過“上采樣”提升小而聚集的目標的檢測精度;

3. 通過將不同尺寸模型融合,提升整體檢測精度。

YOLT項目地址:GitHub - avanetten/yolt: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是經(jīng)典的圖像識別算法,YOLT在YOLO的基礎(chǔ)上針對衛(wèi)星圖像特有的問題提出了特定的解決思路。詳細思路參見論文「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」(GitHub項目中附有論文鏈接)。

e58432fc-0310-11ed-ba43-dac502259ad0.png

▲左側(cè)為常見問題,右側(cè)為解決辦法

1. 針對物體尺寸不規(guī)則、方向多樣的問題,YOLT對衛(wèi)星圖像數(shù)據(jù)進行尺寸變換與旋轉(zhuǎn)等數(shù)據(jù)增強的處理。

2. 針對目標尺寸過小并聚集的問題,YOLT框架主要采用3種方式進行處理:

(1) 修改圖像網(wǎng)絡(luò)結(jié)構(gòu),將YOLO v2框架中的stride由32改為16,有利于檢測出大小在32 x 32以下的目標

(2) 對圖像進行上采樣,完成圖片的“解壓縮”操作,即把原先的圖片放大,以便檢測小而密集的物體

(3) 將不同尺寸的檢測模型進行融合,即Ensemble操作,由于不同目標的尺寸差異可能較大,如海港與船只、機場與飛機,Ensemble操作能夠提升大尺寸差異下的識別精度。

針對衛(wèi)星圖像尺寸過大的問題,YOLT采用切塊的方式,將原始圖像切割成小塊后輸入模型進行訓(xùn)練,并結(jié)合2-(3)進行模型融合。

e5b76f8c-0310-11ed-ba43-dac502259ad0.png

▲ YOLT的網(wǎng)絡(luò)結(jié)構(gòu),輸出特征尺寸多為26 x 26,可以提升檢測精度

應(yīng)用實例

從下面的檢測實例中,我們可以看到Y(jié)OLT是如何工作的:

首先,開發(fā)團隊將一張衛(wèi)星圖片調(diào)整至416 x 416大小(如上左),發(fā)現(xiàn)無法檢測出車輛目標;而從原圖中切割出416 x 416的區(qū)域(稱其為Chips)則可以實現(xiàn)部分車輛目標的檢測。

順著這個思路,開發(fā)團隊采用劃窗方式將原始圖像切割為許多chips,并使相鄰chips之間有一定重合(如上圖),以確保圖像檢測的完整性。再利用NMS算法將重復(fù)檢測過濾,最后將各塊的檢測結(jié)果進行融合,即可得出最后的結(jié)果。

▲ 檢測實例:采用YOLT v4識別機場中的飛機

YOLT的思路不止可以應(yīng)用于衛(wèi)星圖像識別,同樣可以在目標尺寸小且密集的其他類圖像識別問題中發(fā)揮作用。

對本次亞馬遜【AI For Good - 2022 遙感光學(xué)影像目標檢測挑戰(zhàn)賽】的選手而言,YOLT的解決思路能夠幫助大家越過圖片尺寸過大的第一道坎。

原文標題:如何實現(xiàn)超大尺寸圖像快速識別

文章出處:【微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 衛(wèi)星
    +關(guān)注

    關(guān)注

    18

    文章

    1680

    瀏覽量

    66526
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3032

    瀏覽量

    48369
  • 遙感圖像
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    10080

原文標題:如何實現(xiàn)超大尺寸圖像快速識別

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基于FPGA+GPU異構(gòu)平臺的遙感圖像切片解決方案

    大型遙感圖像分割成圖像切片信息,以便更有效地處理和分析圖像數(shù)據(jù)。中科億海微自主研制的AI目標識別加速卡,基于FPGA+GPU異構(gòu)并行計算處理
    的頭像 發(fā)表于 09-20 08:05 ?122次閱讀
    基于FPGA+GPU異構(gòu)平臺的<b class='flag-5'>遙感</b><b class='flag-5'>圖像</b>切片解決方案

    圖像檢測和圖像識別的原理、方法及應(yīng)用場景

    圖像檢測和圖像識別是計算機視覺領(lǐng)域的兩個重要概念,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?1388次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識別算法已經(jīng)取得了顯著的進展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?3866次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法是一種利用計算機視覺技術(shù)對圖像進行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控。然而,圖像識別算法也存在一些優(yōu)缺點。 一、
    的頭像 發(fā)表于 07-16 11:09 ?597次閱讀

    圖像識別算法的核心技術(shù)是什么

    中提取出有用的信息,為后續(xù)的分類和識別提供依據(jù)。特征提取的方法有很多,常見的有: 1.1 顏色特征:顏色是圖像最基本的屬性之一,常見的顏色特征有顏色直方圖、顏色矩。 1.2 紋理特征:紋理是
    的頭像 發(fā)表于 07-16 11:02 ?370次閱讀

    圖像識別技術(shù)包括自然語言處理嗎

    計算機視覺技術(shù)對圖像進行處理、分析和理解,從而實現(xiàn)圖像中的目標、場景、行為信息的識別和理解。圖像識別
    的頭像 發(fā)表于 07-16 10:54 ?394次閱讀

    圖像識別技術(shù)的原理是什么

    圖像識別技術(shù)是一種利用計算機視覺和機器學(xué)習(xí)技術(shù)對圖像進行分析和理解的技術(shù)。它可以幫助計算機識別和理解圖像中的對象、場景和活動。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?594次閱讀

    圖像識別屬于人工智能嗎

    的過程。它涉及到圖像的獲取、預(yù)處理、特征提取、分類和識別多個環(huán)節(jié)。 1.2 重要性 圖像識別技術(shù)在人工智能領(lǐng)域具有重要的地位,它使計算機能夠“看”和“理解”
    的頭像 發(fā)表于 07-16 10:44 ?501次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊緣檢測器和Laplacian邊緣檢測器。 特
    的頭像 發(fā)表于 07-16 10:40 ?375次閱讀

    如何利用CNN實現(xiàn)圖像識別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化操作,自動提取圖像中的特征,進而實現(xiàn)高效的
    的頭像 發(fā)表于 07-03 16:16 ?479次閱讀

    圖像檢測與識別技術(shù)的關(guān)系

    檢測技術(shù)是指利用計算機視覺技術(shù),對圖像中的特定目標進行定位和識別的過程。它通常包括圖像預(yù)處理、特征提取、目標檢測和后處理步驟。圖像檢測技術(shù)
    的頭像 發(fā)表于 07-03 14:43 ?343次閱讀

    圖像檢測和圖像識別的區(qū)別是什么

    詳細的比較和分析。 定義和概念 圖像檢測(Image Detection)是指利用計算機視覺技術(shù)對圖像中的特定目標進行定位和識別的過程。它通常包括目標的檢測、分類和定位三個步驟。圖像
    的頭像 發(fā)表于 07-03 14:41 ?483次閱讀

    圖像識別技術(shù)原理 圖像識別技術(shù)的應(yīng)用領(lǐng)域

    圖像識別技術(shù)是一種通過計算機對圖像進行分析和理解的技術(shù)。它借助計算機視覺、模式識別、人工智能相關(guān)技術(shù),通過對圖像進行特征提取和匹配,找出
    的頭像 發(fā)表于 02-02 11:01 ?1781次閱讀

    如何使用Python進行圖像識別的自動學(xué)習(xí)自動訓(xùn)練?

    如何使用Python進行圖像識別的自動學(xué)習(xí)自動訓(xùn)練? 使用Python進行圖像識別的自動學(xué)習(xí)和自動訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫和算法來實現(xiàn)
    的頭像 發(fā)表于 01-12 16:06 ?446次閱讀

    如何用單片機實現(xiàn)圖像識別?

    如何用單片機實現(xiàn)圖像識別
    發(fā)表于 10-25 06:43