0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于opencv對(duì)高空拍攝視頻消抖處理

新機(jī)器視覺 ? 來(lái)源:AI算法與圖像處理 ? 作者:AI算法與圖像處理 ? 2021-03-20 10:29 ? 次閱讀

一、問(wèn)題背景

無(wú)人機(jī)在拍攝視頻時(shí),由于風(fēng)向等影響因素,不可避免會(huì)出現(xiàn)位移和旋轉(zhuǎn),導(dǎo)致拍攝出的畫面存在平移和旋轉(zhuǎn)的幀間變換, 即“抖動(dòng)” 抖動(dòng)會(huì)改變目標(biāo)物體 (車輛、行人) 的坐標(biāo),給后續(xù)的檢測(cè)、跟蹤任務(wù)引入額外誤差,造成數(shù)據(jù)集不可用。

原效果

目標(biāo)效果

理想的無(wú)抖動(dòng)視頻中,對(duì)應(yīng)于真實(shí)世界同一位置的背景點(diǎn)在不同幀中的坐標(biāo)應(yīng)保持一致,從而使車輛、行人等目標(biāo)物體的坐標(biāo)變化只由物體本身的運(yùn)動(dòng)導(dǎo)致,而不包含相機(jī)的運(yùn)動(dòng) 抖動(dòng)可以由不同幀中對(duì)應(yīng)背景點(diǎn)的坐標(biāo)變換來(lái)描述

二、量化指標(biāo)

抖動(dòng)可以用相鄰幀之間的 x 方向平移像素 dx,y 方向平移像素 dy,旋轉(zhuǎn)角度 da,縮放比例 s 來(lái)描述,分別繪制出 4 個(gè)折線圖,根據(jù)折線圖的走勢(shì)可以判斷抖動(dòng)的程度 理想的無(wú)抖動(dòng)視頻中,dx、dy、da 幾乎始終為 0,s 幾乎始終為 1。

三、技術(shù)思路

我們最終實(shí)現(xiàn),將視頻的所有幀都對(duì)齊到第一幀,以達(dá)到視頻消抖問(wèn)題,實(shí)現(xiàn)邏輯如下圖所示。

97fc0916-88ef-11eb-8b86-12bb97331649.png

(1)首先對(duì)視頻進(jìn)行抽第一幀與最后一幀,為什么抽取兩幀?這樣做的主要目的是,我們?cè)谧鰩瑢?duì)齊時(shí),使用幀中靜態(tài)物的關(guān)鍵點(diǎn)做對(duì)齊,如果特征點(diǎn)來(lái)源于動(dòng)態(tài)物上,那么對(duì)齊后就會(huì)產(chǎn)生形變,我們選取第一幀與最后一幀,提取特征點(diǎn),留下交集部分,則可以得到靜態(tài)特征點(diǎn)我們這里稱為特征模板,然后將特征模板應(yīng)用到每一幀上,這樣可以做有效對(duì)齊。

(2)常用特征點(diǎn)檢測(cè)器:

SIFT: 04 年提出,廣泛應(yīng)用于各種跟蹤和識(shí)別算法,表現(xiàn)能力強(qiáng),但計(jì)算復(fù)雜度高。

SURF: 06 年提出,是 SIFT 的演進(jìn)版本,保持強(qiáng)表現(xiàn)能力的同時(shí)大大減少了計(jì)算量。

BRISK: BRIEF 的演進(jìn)版本,壓縮了特征的表示,提高了匹配速度。ORB: 以速度著稱,是 SURF 的演進(jìn)版本,多用于實(shí)時(shí)應(yīng)用。

GFTT: 最早提出的 Harris 角點(diǎn)的改進(jìn)版本,經(jīng)常合稱為 Harris-Shi-Tomasi 角點(diǎn)。

SimpleBlob: 使用 blob 的概念來(lái)抽取圖像中的特征點(diǎn),相對(duì)于角點(diǎn)的一種創(chuàng)新。FAST: 相比其他方法特征點(diǎn)數(shù)量最多,但也容易得到距離過(guò)近的點(diǎn),需要經(jīng)過(guò) NMS。

Star: 最初用于視覺測(cè)距,后來(lái)也成為一種通用的特征點(diǎn)檢測(cè)方法。

我們這里使用的是SURF特征點(diǎn)檢測(cè)器

第一幀特特征點(diǎn)提取

最后一幀特征點(diǎn)提取

(3)在上圖中,我們發(fā)現(xiàn)所提取的特征點(diǎn)中部分來(lái)自于車身,由于車是運(yùn)動(dòng)的,所以我們不能使用,我們用第一幀與最后一幀做靜態(tài)特幀點(diǎn)匹配,生成靜態(tài)特征模板,在下圖中,我們發(fā)現(xiàn)只有所有的特征點(diǎn)只選取在靜態(tài)物上

靜態(tài)特征點(diǎn)模板

(4)靜態(tài)特征模板匹配 ,我們這里使用Flann算法,匹配結(jié)果如下

特征匹配

(5)使用匹配成功的兩組特征點(diǎn),估計(jì)兩幀之間的透視變換 (Perspective Transformation)。估計(jì)矩陣 H,其中 (x_i, y_i) 和 (x_i^′, y_i^′) 分別是兩幀的特征點(diǎn)。

第一幀

最后一幀對(duì)齊到第一幀

四、實(shí)現(xiàn)代碼

代碼基于python實(shí)現(xiàn),如下所示

import cv2import timeimport numpy as npimport os class Stable: # 處理視頻文件路徑 __video_path = None # surf 特征提取 __surf = { # surf算法 'surf': None, # 提取的特征點(diǎn) 'kp': None, # 描述符 'des': None, # 過(guò)濾后的特征模板 'template_kp': None } # capture __capture = { # 捕捉器 'cap': None, # 視頻大小 'size': None, # 視頻總幀 'frame_count': None, # 視頻幀率 'fps': None, 'video': None } # 配置 __config = { # 要保留的最佳特征的數(shù)量 'key_point_count': 5000, # Flann特征匹配 'index_params': dict(algorithm=0, trees=5), 'search_params': dict(checks=50), 'ratio': 0.5, 'frame_count': 9999 } # 當(dāng)前處理幀數(shù) __current_frame = 0 # 需要處理幀數(shù) __handle_count = 0 # 處理時(shí)間 __handle_timer = { 'init': 0, 'handle': 0, 'read': 0, 'key': 0, 'matrix': 0, 'flann': 0, 'perspective': 0, 'write': 0, 'other': 0, } # 幀隊(duì)列 __frame_queue = None # 需要寫入的幀隊(duì)列 __write_frame_queue = None # 特征提取列表 __surf_list = [] def __init__(self): pass # 初始化capture def __init_capture(self): self.__capture['cap'] = cv2.VideoCapture(self.__video_path) self.__capture['size'] = (int(self.__capture['cap'].get(cv2.CAP_PROP_FRAME_WIDTH)), int(self.__capture['cap'].get(cv2.CAP_PROP_FRAME_HEIGHT))) self.__capture['fps'] = self.__capture['cap'].get(cv2.CAP_PROP_FPS) self.__capture['video'] = cv2.VideoWriter(self.__video_path.replace('.', '_stable.'), cv2.VideoWriter_fourcc(*"mp4v"), self.__capture['fps'], self.__capture['size']) self.__capture['frame_count'] = int(self.__capture['cap'].get(cv2.CAP_PROP_FRAME_COUNT)) self.__handle_count = min(self.__config['frame_count'], self.__capture['frame_count']) # 初始化surf def __init_surf(self): st = time.time() self.__capture['cap'].set(cv2.CAP_PROP_POS_FRAMES, 0) state, first_frame = self.__capture['cap'].read() self.__capture['cap'].set(cv2.CAP_PROP_POS_FRAMES, self.__capture['frame_count'] - 20) state, last_frame = self.__capture['cap'].read() self.__surf['surf'] = cv2.xfeatures2d.SURF_create(self.__config['key_point_count'], 1, 1, 1, 1) # nfeatures:默認(rèn)為0,要保留的最佳特征的數(shù)量。特征按其分?jǐn)?shù)排名(在SIFT算法中按局部對(duì)比度排序) # nOctaveLayers:默認(rèn)為3,金字塔每組(Octave)有多少層。3是D. Lowe紙中使用的值。 # contrastThreshold:默認(rèn)為0.04,對(duì)比度閾值,用于濾除半均勻(低對(duì)比度)區(qū)域中的弱特征。閾值越大,檢測(cè)器產(chǎn)生的特征越少。 # edgeThreshold:默認(rèn)為10,用來(lái)過(guò)濾邊緣特征的閾值。注意,它的意思與contrastThreshold不同,edgeThreshold越大,濾出的特征越少(保留更多特征)。 # sigma:默認(rèn)為1.6,高斯金字塔中的σ。如果使用帶有軟鏡頭的弱相機(jī)拍攝圖像,則可能需要減少數(shù)量。 self.__surf['kp'], self.__surf['des'] = self.__surf['surf'].detectAndCompute(first_frame, None) kp, des = self.__surf['surf'].detectAndCompute(last_frame, None) # 快速臨近匹配 flann = cv2.FlannBasedMatcher(self.__config['index_params'], self.__config['search_params']) matches = flann.knnMatch(self.__surf['des'], des, k=2) good_match = [] for m, n in matches: if m.distance < self.__config['ratio'] * n.distance: good_match.append(m) self.__surf['template_kp'] = [] for f in good_match: self.__surf['template_kp'].append(self.__surf['kp'][f.queryIdx]) self.__capture['cap'].set(cv2.CAP_PROP_POS_FRAMES, 0) self.__handle_timer['init'] = int((time.time() - st) * 1000) print("[INFO] init time:{}ms".format(self.__handle_timer['init'])) # 初始化 隊(duì)列 def __init_data(self): pass # 初始化 def __init(self): self.__init_capture() self.__init_surf() self.__init_data() # 處理 def __process(self): self.__current_frame = 1 while True: if self.__current_frame > self.__handle_count: break start_time = time.time() # 抽幀 success, frame = self.__capture['cap'].read() self.__handle_timer['read'] = int((time.time() - start_time) * 1000) if not success: return # 計(jì)算 frame = self.detect_compute(frame) # 寫幀 st = time.time() self.__capture['video'].write(frame) self.__handle_timer['write'] = int((time.time() - st) * 1000) self.__handle_timer['handle'] = int((time.time() - start_time) * 1000) self.__current_frame += 1 self.print_handle_time() # 視頻穩(wěn)像 def stable(self, path): self.__video_path = path self.__init() self.__process() # 打印耗時(shí) def print_handle_time(self): print( "[INFO] handle frame:{}/{} time:{}ms(read:{}ms key:{}ms flann:{}ms matrix:{}ms perspective:{}ms write:{}ms)". format(self.__current_frame, self.__handle_count, self.__handle_timer['handle'], self.__handle_timer['read'], self.__handle_timer['key'], self.__handle_timer['flann'], self.__handle_timer['matrix'], self.__handle_timer['perspective'], self.__handle_timer['write'])) # 特征點(diǎn)提取 def detect_compute(self, frame): frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 計(jì)算特征點(diǎn) st = time.time() kp, des = self.__surf['surf'].detectAndCompute(frame_gray, None) self.__handle_timer['key'] = int((time.time() - st) * 1000) # 快速臨近匹配 st = time.time() flann = cv2.FlannBasedMatcher(self.__config['index_params'], self.__config['search_params']) matches = flann.knnMatch(self.__surf['des'], des, k=2) self.__handle_timer['flann'] = int((time.time() - st) * 1000) # 計(jì)算單應(yīng)性矩陣 st = time.time() good_match = [] for m, n in matches: if m.distance < self.__config['ratio'] * n.distance: good_match.append(m) p1, p2 = [], [] for f in good_match: # 存在與模板特征點(diǎn)中 if self.__surf['kp'][f.queryIdx] in self.__surf['template_kp']: p1.append(self.__surf['kp'][f.queryIdx].pt) p2.append(kp[f.trainIdx].pt) H, _ = cv2.findHomography(np.float32(p2), np.float32(p1), cv2.RHO) self.__handle_timer['matrix'] = int((time.time() - st) * 1000) # 透視變換 st = time.time() output_frame = cv2.warpPerspective(frame, H, self.__capture['size'], borderMode=cv2.BORDER_REPLICATE) self.__handle_timer['perspective'] = int((time.time() - st) * 1000) return output_frame s = Stable() s.stable('video/test10.mov')

五、效果展示

我們消抖后的視頻道路完全沒有晃動(dòng),但是在邊界有馬賽克一樣的東西,那是因?yàn)閳D片對(duì)齊后后出現(xiàn)黑邊,我們采用邊緣點(diǎn)重復(fù)來(lái)彌補(bǔ)黑邊。

消抖前

消抖后

六、效率優(yōu)化

目前的處理效率(原視頻尺寸3840*2160),我們可以看出主要時(shí)間是花費(fèi)在特征點(diǎn)(key)提取上。
可以采用異步處理+GPU提高計(jì)算效率

ae4ac39c-88ef-11eb-8b86-12bb97331649.png

處理效率

七、存在問(wèn)題

目前存在的問(wèn)題 還不能完全消除視頻中的所有抖動(dòng)

(1)尤其是對(duì)于原來(lái)的抖動(dòng)比較劇烈的視頻,目前只能去除大部分明顯抖動(dòng);

(2)由于畫面旋轉(zhuǎn)造成的邊緣畫面缺失,目前采取了復(fù)制邊緣點(diǎn) (replicate) 的操作,是否會(huì)對(duì)數(shù)據(jù)集的使用造成影響還需要進(jìn)行實(shí)驗(yàn)。

改進(jìn)思路

(1)對(duì)于抖動(dòng)問(wèn)題,計(jì)劃通過(guò)調(diào)整關(guān)鍵點(diǎn)檢測(cè)器參數(shù)、盡可能過(guò)濾掉運(yùn)動(dòng)物體的特征點(diǎn)、調(diào)整特征點(diǎn)匹配參數(shù)來(lái)解決;

(2)對(duì)于邊緣畫面缺失問(wèn)題,可以使用基于 CNN 的圖像修復(fù)算法,盡可能讓缺失的邊緣表現(xiàn)得更自然 后續(xù)進(jìn)一步增加運(yùn)動(dòng)平滑等算法,實(shí)現(xiàn)對(duì)整體運(yùn)動(dòng)的進(jìn)一步平滑。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    857

    瀏覽量

    47632
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4678

    瀏覽量

    128616
  • OpenCV
    +關(guān)注

    關(guān)注

    29

    文章

    625

    瀏覽量

    41218

原文標(biāo)題:基于opencv對(duì)高空拍攝視頻消抖處理

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于FPGA實(shí)現(xiàn)按鍵處理

    引言: 按鍵在電子產(chǎn)品中經(jīng)常用到,由于按鍵的機(jī)械特性,按鍵在閉合或松開的瞬間伴隨著一連串的抖動(dòng),這樣的抖動(dòng)將直接影響設(shè)計(jì)系統(tǒng)的穩(wěn)定性。因此,必須對(duì)抖動(dòng)進(jìn)行處理。本文介紹如何在FPGA中實(shí)現(xiàn)按鍵
    的頭像 發(fā)表于 10-24 14:54 ?141次閱讀
    基于FPGA實(shí)現(xiàn)按鍵<b class='flag-5'>消</b><b class='flag-5'>抖</b><b class='flag-5'>處理</b>

    兩種常見的硬件實(shí)現(xiàn)方式

    由于機(jī)械按鍵在操作過(guò)程中會(huì)產(chǎn)生抖動(dòng)現(xiàn)象,這種抖動(dòng)信號(hào)如果不加以處理,就可能導(dǎo)致單片機(jī)等電子設(shè)備誤判按鍵狀態(tài),從而引發(fā)錯(cuò)誤操作。本文將詳細(xì)介紹兩種常見的硬件實(shí)現(xiàn)方式:RS觸發(fā)器和電容濾波。 RS
    的頭像 發(fā)表于 09-25 16:54 ?713次閱讀
    兩種常見的硬件<b class='flag-5'>消</b><b class='flag-5'>抖</b>實(shí)現(xiàn)方式

    為什么按鍵那么重要

    和錯(cuò)誤操作。因此,進(jìn)行按鍵處理顯得尤為重要。 按鍵抖動(dòng)的產(chǎn)生是由于機(jī)械觸點(diǎn)的彈性特性所決定的。當(dāng)按鍵被按下或釋放時(shí),觸點(diǎn)并不會(huì)立即穩(wěn)定地接通或斷開,而是會(huì)在閉合和斷開的瞬間產(chǎn)生一連串的抖動(dòng)信號(hào)。這些抖動(dòng)信號(hào)
    的頭像 發(fā)表于 09-25 16:50 ?365次閱讀
    為什么按鍵<b class='flag-5'>消</b><b class='flag-5'>抖</b>那么重要

    如何在FPGA中實(shí)現(xiàn)按鍵

    在FPGA(現(xiàn)場(chǎng)可編程門陣列)中實(shí)現(xiàn)按鍵是一個(gè)重要的設(shè)計(jì)環(huán)節(jié),特別是在處理用戶輸入時(shí),由于物理按鍵的機(jī)械特性和電氣特性,按鍵在按下和釋放的瞬間會(huì)產(chǎn)生抖動(dòng)現(xiàn)象,這種抖動(dòng)可能導(dǎo)致系統(tǒng)錯(cuò)誤地識(shí)別為多次
    的頭像 發(fā)表于 08-19 18:15 ?1288次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件庫(kù),它提供了大量的圖像和視頻處理功能。OpenCV
    的頭像 發(fā)表于 07-16 10:38 ?889次閱讀

    opencv的主要功能有哪些

    OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺庫(kù),提供了大量的計(jì)算機(jī)視覺算法和工具。以下是OpenCV的主要功能: 圖像處理
    的頭像 發(fā)表于 07-16 10:35 ?1257次閱讀

    虹軟PSAI上線店微應(yīng)用,提供一站式電商拍攝解決方案

    聚焦商拍領(lǐng)域的虹軟PhotoStudio AI(簡(jiǎn)稱PSAI)正式入駐店微應(yīng)用,助力該平臺(tái)用戶一站式解決商業(yè)拍攝、商品圖優(yōu)化處理需求。
    的頭像 發(fā)表于 05-21 10:32 ?432次閱讀
    虹軟PSAI上線<b class='flag-5'>抖</b>店微應(yīng)用,提供一站式電商<b class='flag-5'>拍攝</b>解決方案

    怎么做按鍵

    大家是怎么做按鍵的 我是用一定時(shí)器做20ms定時(shí),定時(shí)到在中斷里設(shè)專門標(biāo)志(20ms是否到,初始化為0),在主循環(huán)里當(dāng)按鍵按下時(shí)在判斷此標(biāo)志,為0,就開啟定時(shí)中斷,而后返回主流程,當(dāng)此標(biāo)志為1
    發(fā)表于 04-28 07:39

    stm32外部中斷存在自身內(nèi)部的嗎?

    請(qǐng)問(wèn)stm32外部中斷存在自身內(nèi)部的嗎? 若存在請(qǐng)問(wèn)如何配置
    發(fā)表于 03-11 06:15

    為什么要進(jìn)行按鍵?按鍵抖動(dòng)的原理 按鍵的方法

    按鍵通常的按鍵所用開關(guān)為機(jī)械彈性開關(guān),當(dāng)機(jī)械觸點(diǎn)斷開、閉合時(shí),由于機(jī)械觸點(diǎn)的彈性作用,一個(gè)按鍵開關(guān)在閉合時(shí)不會(huì)馬上穩(wěn)定地接通,在斷開時(shí)也不會(huì)一下子斷開。
    的頭像 發(fā)表于 02-17 17:07 ?1.7w次閱讀
    為什么要進(jìn)行按鍵<b class='flag-5'>消</b><b class='flag-5'>抖</b>?按鍵抖動(dòng)的原理 按鍵<b class='flag-5'>消</b><b class='flag-5'>抖</b>的方法

    微機(jī)諧裝置報(bào)接地怎么處理

    微機(jī)諧裝置報(bào)接地要分兩種情況來(lái)處理,一種是真正存在接地問(wèn)題的情況下的處理方法,另一種是誤報(bào)接地的情況下的處理方法。 首先,我們來(lái)看真正存在接地問(wèn)題的情況下的
    的頭像 發(fā)表于 01-12 11:00 ?1329次閱讀

    使用圖像處理庫(kù)OpenCV從攝像頭獲取數(shù)據(jù)并在PyQt5上顯示出來(lái)

    OpenCV能夠處理圖像、視頻、深度圖像等各種類型的視覺數(shù)據(jù)
    的頭像 發(fā)表于 01-05 17:32 ?2272次閱讀
    使用圖像<b class='flag-5'>處理</b>庫(kù)<b class='flag-5'>OpenCV</b>從攝像頭獲取數(shù)據(jù)并在PyQt5上顯示出來(lái)

    單片機(jī)按鍵的原理和方法詳解

    通常的按鍵所用開關(guān)為機(jī)械彈性開關(guān),當(dāng)機(jī)械觸點(diǎn)斷開、閉合時(shí),由于機(jī)械觸點(diǎn)的彈性作用,一個(gè)按鍵開關(guān)在閉合時(shí)不會(huì)馬上穩(wěn)定地接通,在斷開時(shí)也不會(huì)一下子斷開。因而在閉合及斷開的瞬間均伴隨有一連串的抖動(dòng),為了不產(chǎn)生這種現(xiàn)象而作的措施就是按鍵。
    的頭像 發(fā)表于 12-22 10:06 ?8367次閱讀
    單片機(jī)按鍵<b class='flag-5'>消</b><b class='flag-5'>抖</b>的原理和方法詳解

    復(fù)位電路具體長(zhǎng)什么樣子呢?

    復(fù)位信號(hào)在使用前一般需要進(jìn)行處理,也稱為復(fù)位濾毛刺。復(fù)位的抖動(dòng)可能會(huì)導(dǎo)致芯片產(chǎn)生多次復(fù)位動(dòng)作,給系統(tǒng)帶來(lái)不確定性和誤差。
    的頭像 發(fā)表于 12-04 14:53 ?1179次閱讀
    復(fù)位<b class='flag-5'>消</b><b class='flag-5'>抖</b>電路具體長(zhǎng)什么樣子呢?

    油式接地變弧線圈的檢修與維護(hù)處理

    油式接地變弧線圈的檢修與維護(hù)處理
    的頭像 發(fā)表于 12-01 14:08 ?596次閱讀