0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用OpenCV中的簡單計算機視覺技術(shù)創(chuàng)建我們自己的“隱形衣”

gVTR_Unf ? 來源:AI算法與圖像處理 ? 作者:AI_study ? 2020-09-07 16:29 ? 次閱讀

我計劃分享一些有趣的實戰(zhàn)項目,或許達不到商用的級別,但是希望能在大家做項目的時候能夠提供一些思路!如果對你有所幫助,給我點贊 & 在看,讓我知道對你有幫助哈!

基于OpenCV的顏色檢測和分割的隱形斗篷

如果你是個哈利波特迷,你就會知道什么是隱形衣。是的!這是哈利波特用來隱身的隱形衣。當然,我們都知道隱形衣不是真的——它都是圖形上的詭計。

在這篇文章中,我們將學習如何使用OpenCV中的簡單計算機視覺技術(shù)創(chuàng)建我們自己的“隱形衣”。文末會分享 C++python的代碼。

那是哈利·波特在試他的隱形衣!

事實上,你可以用一種叫做顏色檢測和分割的圖像處理技術(shù)來創(chuàng)造這種神奇的體驗。好消息是,你不需要成為霍格沃茨的一員!你所需要的是一塊紅色的布,并遵循這篇文章。

它的原理是什么?

算法在原理上與綠幕非常相似。但與我們刪除背景的綠幕不同,在這個應用中,我們刪除了前景!

我們用一塊紅色的布做我們的斗篷。為什么是紅色呢?為什么不綠色的嗎?當然,我們可以用綠色,紅色不是魔術(shù)師的顏色嗎?除了此之外,像綠色或藍色這樣的顏色也可以稍微調(diào)整一下。

其基本思想如下:

1. 捕獲并存儲背景幀。

2. 使用顏色檢測算法檢測紅色布料。

3. 將紅色的布料分割成一個mask。

4. 生成最后的增廣輸出,創(chuàng)造神奇的效果。

上面的GIF簡單地解釋了算法的所有階段?,F(xiàn)在我們將詳細討論每一步。

步驟1:捕捉并存儲背景幀

如上所述,關(guān)鍵思想是將當前與布料相對應的幀像素替換為背景像素,從而產(chǎn)生一件隱身衣的效果。為此,我們需要存儲一個背景幀。

C++

//CreateaVideoCaptureobjectandopentheinputfile// If the input is the web camera, pass 0 instead of the video file nameVideoCapture cap("video4.mp4");// Check if camera opened successfullyif(!cap.isOpened()){ cout << "Error opening video stream or file" << endl; return -1;} Mat background;for(int i=0;i<30;i++){ cap >> background;}//Laterally invert the image / flip the image.flip(background,background,1);

Python

# Creating a VideoCapture object# This will be used for image acquisition later in the code.cap = cv2.VideoCapture("video.mp4") # We give some time for the camera to warm-up!time.sleep(3) background=0 for i in range(30): ret,background = cap.read() # Laterally invert the image / flip the image.background = np.flip(background,axis=1)

在上面的代碼中,cap.read()方法使我們能夠通過相機捕獲最新的幀(存儲在變量‘background’中),它還返回一個布爾值(True/False存儲在‘ret’中)。如果一個幀被正確讀取,它將為真。所以你可以通過檢查這個返回值來檢查視頻的結(jié)束。

為什么捕獲背景圖像使用'循環(huán)' ?

因為背景是靜態(tài)的,我們不能簡單地使用一個幀嗎?當然,但是與多幀圖像相比,捕獲的圖像有點暗。這是因為相機剛剛開始捕捉幀,因此它的參數(shù)還不穩(wěn)定。因此,使用for循環(huán)捕獲靜態(tài)背景的多個圖像就可以完成這個任務。

多幀平均也可以降低噪聲。

第二步:檢測紅色

因為我們使用了一塊紅色的布來將它轉(zhuǎn)換成一件隱形斗篷,所以我們將著重于在框架中檢測紅色。

聽起來簡單嗎?我們有一個RGB(紅-綠-藍)圖像,使用簡單閾值的R通道來得到我們的mask。結(jié)果證明,這將并不會特別有效,因為RGB值是高度敏感的照明。因此,即使斗篷是紅色的,也可能有一些區(qū)域,由于陰影,相應像素的紅色通道值相當?shù)汀?/p>

正確的方法是將圖像的顏色空間從RGB轉(zhuǎn)換為HSV(色相-飽和度-亮度)。

HSV顏色空間是什么?

HSV顏色空間表示使用三個值的顏色

1.色相(Hue):這個通道對顏色信息進行編碼。色相可以被認為是一個角度,0度對應紅色,120度對應綠色,240度對應藍色。

2.飽和度(Saturation):這個通道編碼顏色的強度/純度。例如,粉色比紅色的飽和度低。

3.值(Value):該通道對顏色的亮度進行編碼。圖像的陰影和光澤成分出現(xiàn)在這個通道中。

不像RGB是根據(jù)三原色來定義的,HSV的定義方式類似于人類感知顏色的方式。

對于我們的應用而言,使用HSV顏色空間的主要優(yōu)點是顏色/色調(diào)/波長僅由色相組件表示。

要了解不同的色彩空間,請參考我們關(guān)于色彩空間的詳細博客。

https://www.learnopencv.com/color-spaces-in-opencv-cpp-python/

所以當我說,我需要一個特定的顏色,選擇色相組件,然后根據(jù)飽和度組件,我得到了那個顏色的不同的陰影,進一步根據(jù)值組件,我得到了一個顏色的特定陰影的不同的強度。

在下面的代碼中,我們首先捕獲一個活動幀,將圖像從RGB轉(zhuǎn)換為HSV顏色空間,然后定義一個特定范圍的H-S-V值來檢測紅色。

C++

Mat frame;// Capture frame-by-framecap >> frame; // Laterally invert the image / flip the imageflip(frame,frame,1); //Converting image from BGR to HSV color space.Mat hsv;cvtColor(frame, hsv, COLOR_BGR2HSV); Mat mask1,mask2;// Creating masks to detect the upper and lower red color.inRange(hsv, Scalar(0, 120, 70), Scalar(10, 255, 255), mask1);inRange(hsv, Scalar(170, 120, 70), Scalar(180, 255, 255), mask2); // Generating the final maskmask1 = mask1 + mask2;

Python

# Capturing the live frameret, img = cap.read() # Laterally invert the image / flip the imageimg = np.flip(imgaxis=1) # converting from BGR to HSV color spacehsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV) # Range for lower redlower_red = np.array([0,120,70])upper_red = np.array([10,255,255])mask1 = cv2.inRange(hsv, lower_red, upper_red) # Range for upper rangelower_red = np.array([170,120,70])upper_red = np.array([180,255,255])mask2 = cv2.inRange(hsv,lower_red,upper_red) # Generating the final mask to detect red colormask1 = mask1+mask2

inRange函數(shù)簡單地返回一個二值化掩碼,其中白色像素(255)表示屬于上限和下限范圍的像素,黑色像素(0)不屬于上限和下限范圍的像素。

色相值實際上分布在一個圓上(范圍在0-360度之間),但在OpenCV中為了適應8bit 值,其范圍是0-180度。紅色由0-30和150-180值表示。

我們使用范圍0-10和170-180,以避免檢測皮膚為紅色。飽和度使用較高范圍120-255的值,因為我們的布料應該是高度飽和的紅色。亮度值在的較低范圍是70,這樣我們也可以在布料的褶皺中檢測到紅色。

mask1 = mask1 + mask2

使用上面的線,我們合并兩個紅色范圍生成的mask。它基本上是在像素上進行OR操作。這是一個操作符重載+的簡單例子。

現(xiàn)在,您已經(jīng)了解了如何進行顏色檢測,您可以更改H-S-V范圍,并使用一些其他的單色布來代替紅色。事實上,綠色的布比紅色的效果更好,因為綠色離人的膚色差異最大。

第三步:將檢測到的紅色布料分割開來

在上一步中,我們生成了一個mask來確定幀中與檢測到的顏色相對應的區(qū)域。我們精煉這個mask,然后用它從frame上分割布料。下面的代碼說明了它是如何實現(xiàn)的。

C++

Mat kernel = Mat::ones(3,3, CV_32F);morphologyEx(mask1,mask1,cv::MORPH_OPEN,kernel);morphologyEx(mask1,mask1,cv::MORPH_DILATE,kernel); // creating an inverted mask to segment out the cloth from the framebitwise_not(mask1,mask2);Mat res1, res2, final_output; // Segmenting the cloth out of the frame using bitwise and with the inverted maskbitwise_and(frame,frame,res1,mask2);

Python

mask1 = cv2.morphologyEx(mask, cv2.MORPH_OPEN, np.ones((3,3),np.uint8))mask1 = cv2.morphologyEx(mask, cv2.MORPH_DILATE, np.ones((3,3),np.uint8)) #creating an inverted mask to segment out the cloth from the framemask2 = cv2.bitwise_not(mask1) #Segmenting the cloth out of the frame using bitwise and with the inverted maskres1 = cv2.bitwise_and(img,img,mask=mask2)

步驟4:生成最終的增強輸出,以創(chuàng)建一個神奇的效果。

最后,我們將檢測到的紅色區(qū)域的像素值替換為靜態(tài)背景對應的像素值,最后生成一個增強輸出,產(chǎn)生神奇的效果,將我們的布料變成了一件隱身斗篷。為此,我們首先使用bitwise_and操作創(chuàng)建一個像素值對應于檢測區(qū)域的圖像,像素值等于靜態(tài)背景的像素值,然后將輸出添加到我們從中分割出紅布的圖像(res1)中。

C++

// creating image showing static background frame pixels only for the masked regionbitwise_and(background,background,res2,mask1); // Generating the final augmented output.addWeighted(res1,1,res2,1,0,final_output);imshow("magic", final_output);waitKey(1);

Python

# creating image showing static background frame pixels only for the masked regionres2 = cv2.bitwise_and(background, background, mask = mask1) #Generating the final outputfinal_output = cv2.addWeighted(res1,1,res2,1,0)imshow("magic",final_output)cv2.waitKey(1)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40278
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1685

    瀏覽量

    45814
  • OpenCV
    +關(guān)注

    關(guān)注

    29

    文章

    622

    瀏覽量

    41091

原文標題:OpenCV黑魔法之隱身衣

文章出處:【微信號:Unfinished_coder,微信公眾號:機器視覺CV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也
    的頭像 發(fā)表于 08-14 09:49 ?290次閱讀

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻的信息。為了實現(xiàn)這一目標,
    的頭像 發(fā)表于 07-24 12:46 ?356次閱讀

    什么是機器視覺opencv?它有哪些優(yōu)勢?

    機器視覺(Machine Vision)是一種利用計算機和圖像處理技術(shù)來模擬人類視覺系統(tǒng)的功能,實現(xiàn)對圖像的識別、分析和理解的技術(shù)
    的頭像 發(fā)表于 07-16 10:33 ?367次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?289次閱讀

    計算機視覺的五大技術(shù)

    計算機視覺作為深度學習領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大
    的頭像 發(fā)表于 07-10 18:26 ?904次閱讀

    計算機視覺的工作原理和應用

    圖像和視頻中提取有用信息,進而進行決策和行動。自1960年代第一批學術(shù)論文問世以來,計算機視覺技術(shù)已經(jīng)取得了長足的發(fā)展,并在多個領(lǐng)域展現(xiàn)出巨大的應用潛力和價值。
    的頭像 發(fā)表于 07-10 18:24 ?1077次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    、交流等方面。計算機視覺與人工智能之間存在著密切的聯(lián)系,計算機視覺是人工智能的一個重要分支,也是實現(xiàn)人工智能的關(guān)鍵技術(shù)之一。
    的頭像 發(fā)表于 07-09 09:25 ?315次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    ,旨在實現(xiàn)對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工業(yè)自動化領(lǐng)域。它利用計算機和圖像處理
    的頭像 發(fā)表于 07-09 09:22 ?290次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?588次閱讀

    深度學習在計算機視覺領(lǐng)域的應用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學習作為其中的核心技術(shù)之一,已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機
    的頭像 發(fā)表于 07-01 11:38 ?434次閱讀

    機器視覺計算機視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作
    的頭像 發(fā)表于 06-06 17:24 ?837次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻的信息。隨著深度學習、大數(shù)據(jù)等
    的頭像 發(fā)表于 06-06 17:17 ?524次閱讀

    計算機視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動作用。一、圖像分割算法圖像分割算法是計算機視覺領(lǐng)域的基礎算法之一,它的主要任務是將圖像分割成不同的區(qū)域或?qū)ο?。常見的圖像分割算法包括基
    的頭像 發(fā)表于 02-19 13:26 ?1048次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    什么是計算機視覺?計算機視覺的三種方法

    計算機視覺是指通過為計算機賦予人類視覺這一技術(shù)目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 11-16 16:38 ?4168次閱讀
    什么是<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>?<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的三種方法

    最適合AI應用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺這一技術(shù)目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 11-15 16:38 ?348次閱讀
    最適合AI應用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?