計(jì)算機(jī)視覺研究方向有哪些
1、圖像分類
圖像分類是計(jì)算機(jī)視覺中最基礎(chǔ)的一個任務(wù),也是幾乎所有的基準(zhǔn)模型進(jìn)行比較的任務(wù),從最開始比較簡單的10分類的灰度圖像手寫數(shù)字識別mnist,到后來更大一點(diǎn)的10分類的cifar10和100分類的cifar100,到后來的imagenet,圖像分類任務(wù)伴隨著數(shù)據(jù)庫的增長,一步一步提升到了今天的水平。圖像分類,顧名思義,就是一個模式分類問題,它的目標(biāo)是將不同的圖像,劃分到不同的類別,實(shí)現(xiàn)最小的分類誤差。
2、目標(biāo)檢測
分類任務(wù)給出的是整張圖片的內(nèi)容描述,而目標(biāo)檢測任務(wù)則關(guān)注圖片中特定的目標(biāo)。檢測任務(wù)包含兩個子任務(wù),其一是這一目標(biāo)的類別信息和概率,它是一個分類任務(wù)。其二是目標(biāo)的具體位置信息,這是一個定位任務(wù)。與計(jì)算機(jī)視覺領(lǐng)域里大部分的算法一樣,目標(biāo)檢測也經(jīng)歷了從傳統(tǒng)的人工設(shè)計(jì)特征和淺層分類器的思路(以),到大數(shù)據(jù)時代使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí)的思路。
3、 圖像分割
圖像分割屬于圖像處理領(lǐng)域最高層次的圖像理解范疇。所謂圖像分割就是把圖像分割成具有相似的顏色或紋理特性的若干子區(qū)域,并使它們對應(yīng)不同的物體或物體的不同部分的技術(shù)。這些子區(qū)域,組成圖像的完備子集,又相互之間不重疊。在圖像處理中,研究者往往只對圖像中的某些區(qū)域感興趣,在此基礎(chǔ)上才有可能對目標(biāo)進(jìn)行更深層次的處理與分析,包括對象的數(shù)學(xué)模型表示、幾何形狀參數(shù)提取、統(tǒng)計(jì)特征提取、目標(biāo)識別等。
4、目標(biāo)跟蹤
目標(biāo)跟蹤,指的其實(shí)就是視頻中運(yùn)動目標(biāo)的跟蹤,跟蹤的結(jié)果通常就是一個框。目標(biāo)跟蹤是視頻監(jiān)控系統(tǒng)中不可缺少的環(huán)節(jié)。 根據(jù)目標(biāo)跟蹤方法建模方式的不同,可以分為生成式模型方法與判別式模型方法。
生成式模型跟蹤算法以均值漂移目標(biāo)跟蹤方法和粒子濾波目標(biāo)跟蹤方法為代表,判別式模型跟蹤算法以相關(guān)濾波目標(biāo)跟蹤方法和深度學(xué)習(xí)目標(biāo)跟蹤方法為代表。
5、 圖像濾波與降噪
現(xiàn)實(shí)中的數(shù)字圖像在數(shù)字化和傳輸過程中常受到成像設(shè)備與外部環(huán)境噪聲干擾等影響,稱為含噪圖像或噪聲圖像。減少數(shù)字圖像中噪聲的過程稱為圖像降噪,有時候又稱為圖像去噪。 降噪可以應(yīng)用于圖像增強(qiáng)和美顏等領(lǐng)域。
6、圖像增強(qiáng)
圖像增強(qiáng),即增強(qiáng)圖像中的有用信息,改善圖像的視覺效果。圖像增強(qiáng)實(shí)際上包含了很多的內(nèi)容,上面的降噪也屬于其中,只是因?yàn)榻翟攵嗔嗣李佭@一個應(yīng)用單獨(dú)拿出來說一下。
7、 風(fēng)格化
圖像風(fēng)格化之所以引起我們的注意,完全是因?yàn)?015年的一個研究,可以將任意的圖像轉(zhuǎn)換為梵高的畫作風(fēng)格。?也是得益于深度學(xué)習(xí)技術(shù)的發(fā)展,傳統(tǒng)的方法做不到這么好的效果。而隨著美圖秀秀,天天P圖等app層出不窮的濾鏡,風(fēng)格化已經(jīng)成為了單獨(dú)的一個研究領(lǐng)域。?圖像風(fēng)格化是一個綜述性的技術(shù)應(yīng)用,為了簡單起見,就理解為藝術(shù)類濾鏡把,它指通過算法,將數(shù)碼相機(jī)拍攝的照片,變成繪畫、素描等藝術(shù)類的非數(shù)碼相機(jī)效果,是后期程度最深的操作,將徹底改變相片的風(fēng)格。
8、 三維重建
三維重建廣義上來說,是建立真實(shí)世界的三維模型。隨著軟硬件的成熟,在電影,游戲,安防,地圖等領(lǐng)域,三維重建技術(shù)的應(yīng)用越來越多。目前獲取三維模型的方法主要包括三種,手工建模,儀器采集與基于圖像的建模。
9、 圖像檢索
圖像檢索的研究從20世紀(jì)70年代就已經(jīng)開始,在早期是基于文本的圖像檢索技術(shù)(簡稱TBIR),利用文本來描述圖像的特征,如繪畫作品的作者、年代、流派、尺寸等。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,90年代開始出現(xiàn)了對圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),也就是基于內(nèi)容的圖像檢索(簡稱CBIR)技術(shù),本小節(jié)的圖像檢索就特指基于內(nèi)容的圖像檢索。
10、 GAN
GAN被譽(yù)為新的深度學(xué)習(xí),涉及的研究非常多,可以單列為一個方向。GAN的原理很簡單,它包括兩個網(wǎng)絡(luò),一個生成網(wǎng)絡(luò),不斷生成數(shù)據(jù)分布。一個判別網(wǎng)絡(luò),判斷生成的數(shù)據(jù)是否為真實(shí)數(shù)據(jù)。
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1694瀏覽量
45901
發(fā)布評論請先 登錄
相關(guān)推薦
評論