0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

紋理分析以及結(jié)合深度學習來提升紋理分類效果

穎脈Imgtec ? 2022-09-28 10:20 ? 次閱讀

來源:AI公園,作者:Trapti Kalra

編譯:ronghuaiyang

導讀

紋理分析的介紹,各種紋理分析方法,并結(jié)合深度學習提升紋理分類。

人工智能的一個獨特應(yīng)用領(lǐng)域是幫助驗證和評估材料和產(chǎn)品的質(zhì)量。在IBM,我們開發(fā)了創(chuàng)新技術(shù),利用本地移動設(shè)備,專業(yè)的微型傳感器技術(shù),和AI,提供實時、解決方案,利用智能手機技術(shù),來代替易于出錯的視覺檢查設(shè)備和實驗室里昂貴的設(shè)備。

在開發(fā)質(zhì)量和可靠性檢查的人工智能能力的同時,產(chǎn)品和材料的圖像需要是高清晰度的或者是微觀尺度的,因此,設(shè)計能夠同時代表采樣圖像的局部和全局獨特性的特征變得極為重要。利用來自紋理分析方法的特征來豐富基于深度CNN的模型是一種非常有效的方法來實現(xiàn)更好的訓練模型。

為了更好地理解紋理分析方法在深度學習中的應(yīng)用,我們先來了解一下什么是紋理分析。

什么是紋理?

紋理是粗糙度、對比度、方向性、線條相似性、規(guī)則性和粗糙度的度量,有助于我們理解圖像中顏色或強度的空間排列。紋理是圖像強度中局部變化的重復(fù)模式(圖1)。

606a754a-3e43-11ed-b180-dac502259ad0.png

圖1,紋理圖像示例 (a)原始圖像,(b)紋理重復(fù)模式

紋理由紋理原語或紋理元素組成,有時被稱為元紋理。元紋理用于從圖像中找到對象的色調(diào)和紋理。圖像的色調(diào)取決于元紋理的像素強度屬性,而紋理處理元紋理之間的空間連接。

例如,如果元紋理之間的色調(diào)差異很大,而元紋理的尺寸很小,它就像一個精細的紋理,如果一個元紋理包含很多像素,那么它就像一個粗糙的紋理。

我們需要了解不同類型的紋理才能正確地分析它們。在開始任何與紋理相關(guān)的項目之前,最好知道你將處理什么樣的紋理。

不同類型的紋理

紋理的分類是困難的,因為它的一些屬性,如規(guī)律性、隨機性、均勻性和變形沒有得到適當?shù)亩x,以及紋理類型是廣泛的和復(fù)雜的。

通常,紋理像粗糙,凹凸,干燥,光澤,沙質(zhì),硬,尖銳等,屬于粗糙類別,而紋理像細,光滑,濕,皺,絲滑,軟,暗等,屬于光滑類別。

廣義上,紋理分為兩類,即觸覺視覺紋理。

觸覺指的是一個表面的直接有形的感覺,即觸覺紋理就像一個真實的對象。當一個物體被觸摸時,我們可以感覺到它的質(zhì)地。手感可以是光滑、柔軟、堅硬、黏滑、粗糙、粘滑、絲滑等。自然紋理的例子有木頭、巖石、玻璃、金屬、樹葉等,如圖2所示。

6086297a-3e43-11ed-b180-dac502259ad0.png

圖2,自然紋理的例子

視覺紋理被定義為紋理產(chǎn)生給人類觀察者的視覺印象,也就是說,它不是真正的紋理,但它是人從圖像中檢查紋理的方法。照片中的物體可能看起來很粗糙,但是,照片的感覺總是平坦和光滑的。

根據(jù)視覺紋理的隨機性程度,可以進一步將視覺紋理分為規(guī)則紋理和隨機紋理。

將簡單可識別的小尺寸的部分平貼到固體周期模式中,形成“規(guī)則紋理”(圖3),而隨機模式中較難識別部分組成“隨機紋理”(圖4)。

60bdb57a-3e43-11ed-b180-dac502259ad0.png

圖3,規(guī)則紋理的例子

60e5bd4a-3e43-11ed-b180-dac502259ad0.png

圖4,隨機紋理的例子

那么,現(xiàn)在最大的問題是,紋理分析在提高計算機視覺任務(wù)中深度學習的有效性方面的意義是什么?

紋理分析用在哪里?

如今,紋理分析是許多任務(wù)的重要組成部分,從醫(yī)學影像遙感,也被用于大型圖像數(shù)據(jù)庫的內(nèi)容查詢。

工業(yè)檢測,當現(xiàn)有的技術(shù)無法解決的時候,紋理分析是一個強大的工具。讓我們以木材制造為例,在這種情況下,不使用紋理分析很難檢測裂紋。

紋理檢測還用于對地毯進行分級中,根據(jù)地毯因磨損引起的外觀變化。紋理分析用于皮革檢查,通過評估顏色、厚度和灰度變化。有缺陷的碎片通常會在皮革上留下疤痕或褶皺。

紋理分析的應(yīng)用范圍包括紋理分類,如遙感(圖5),紋理分割,如生物醫(yī)學成像(圖6)。它還被用于圖像合成和模式識別任務(wù),如從照片中識別繪畫。

當圖像中的物體是通過紋理屬性而不是強度進行分類,或者閾值技術(shù)無法對其進行正確分類時,紋理分析就發(fā)揮了重要作用。

613d588e-3e43-11ed-b180-dac502259ad0.png

圖5,利用紋理分析的遙感圖像。由遙感領(lǐng)域的專家對這些紋理模式進行聚類識別和標記

下圖(圖6)顯示了二流腔靜脈的超聲圖像(圖的下三分之一處為鈍區(qū))。肝臟的分割,被白色斑點包圍的區(qū)域,顯示出與周圍組織相比獨特的紋理。

615ffc36-3e43-11ed-b180-dac502259ad0.png

圖6,利用紋理分析的醫(yī)學圖像

如今,紋理分析也被用于食品制造行業(yè),以了解食品的質(zhì)量。硬糖、耐嚼的巧克力曲奇、脆餅干、粘稠的太妃糖、脆芹菜、嫩牛排等食物都含有多種紋理。紋理分析在這一領(lǐng)域有很大的應(yīng)用,例如食物的口感特性可以通過紋理分析很容易地測量出來。

它也被用于一項名為“流變學”的研究,這是一門研究物質(zhì)變形和流動的科學,換句話說,是研究物體受到外力作用時的反應(yīng)。

除了所有這些,紋理分析可以用來測量/評估許多產(chǎn)品的質(zhì)量,如粘合劑,藥品,皮膚/頭發(fā)護理產(chǎn)品,聚合物等。

到目前為止,我們已經(jīng)了解了紋理分析可以應(yīng)用在哪里,在下一節(jié)讓我們看看如何根據(jù)紋理對圖像進行分類。

紋理分析如何應(yīng)用到分類問題中以及為何它如此重要?

到目前為止,我們已經(jīng)了解了不同類型的紋理,并看到了現(xiàn)實生活中紋理分析很有用的例子。讓我們了解如何在分類問題中使用它,分類器的主要目標是通過為每個圖像提供描述符來對紋理圖像進行分類。換句話說,

分配一個未知的樣本到一個預(yù)定義的紋理類被稱為紋理分類

在進行紋理分類時,考慮了圖像的圖案和紋理內(nèi)容?;诩y理的分類是基于紋理特征(如粗糙度、不規(guī)則性、均勻性、平滑度等)進行的。任何圖像數(shù)據(jù)集中的每個類都很可能具有不同的紋理,這使得它成為一個獨特的屬性,有助于模型更準確地對圖像進行分類。

提取紋理的不同技術(shù)和方法

有多種方法用于從圖像中提取紋理。在本文中,我們將討論最常用和最重要的紋理提取方法。

GLCM (Grey Level Co-occurrence Matrix,灰度共生矩陣)是一種常用的、基本的紋理分析統(tǒng)計方法。GLCM特征基于二階統(tǒng)計量,用于從均勻性、同質(zhì)性等角度了解像素間的平均相關(guān)程度。

LBP是一種結(jié)合了結(jié)構(gòu)和統(tǒng)計方法的方法,使紋理分析更有效?,F(xiàn)實中LBP的一個重要特征是它對不同光照條件引起的單調(diào)的灰度變化的容忍度。它的簡單計算允許在實時場景中使用。

小波是一種基于變換的方法,可以捕捉局部的頻率和空間信息。GLCM和LBP關(guān)注的是紋理的空間排列,但紋理的關(guān)鍵要素是尺度,根據(jù)一項心理-視覺研究,我們的大腦處理圖像的方式是多尺度的。我們的大腦會進行不同的空間頻率分析來識別紋理?;谶@一思想,小波分析關(guān)注的是頻率和空間信息。

分形是圖像自相似性和粗糙度的重要度量。它能夠表征其他紋理分析方法所不能表征的紋理。有各種各樣的技術(shù)來測量圖像的平滑度、均勻度、平均值和標準差,但分形方法主要關(guān)注圖像紋理的“粗糙度”,并相應(yīng)地對紋理進行分類。

圖像梯度是一種檢測圖像邊緣的完美技術(shù),因為它變得更容易識別紋理時,邊緣高亮。紋理邊界用于自然邊界的有效劃分,一旦這些邊界被正確識別,基于這些邊界的紋理區(qū)分就很簡單了。

這五種方法對不同的紋理數(shù)據(jù)集都取得了滿意的結(jié)果。每種技術(shù)都強調(diào)紋理的獨特屬性。在下面的部分中,我們將研究這些技術(shù)的特征構(gòu)造方法。

灰度共生矩陣 (GLCM):

GLCM提供了關(guān)于圖像像素之間如何相互關(guān)聯(lián)的信息,這種關(guān)系幫助我們根據(jù)從GLCM中提取的多個特征對紋理進行分類。矩陣給出了具有相似強度的像素的位置信息。可能的強度值集合是二維數(shù)組的行和列標簽(P)

GLCM的P[i,j]首先通過指定一個位移向量= (dx, dy),并在位移向量的角度上統(tǒng)計由分隔的所有像素對,并進行初始化,灰度級別為j和i(其中j是列,i是行)。

一般來說,GLCM表示為P[i,j] = n??,其中n??是圖像中位于距離處的像素值(i,j)的出現(xiàn)次數(shù)。共生矩陣P的維數(shù)為n*n,其中n是圖像中的灰度級數(shù)。

GLCM是根據(jù)位移矢量中提到的距離和角度計算的。對于一個像素x,我們可以計算8個不同方向的GLCM值,如圖7所示。

61845dc4-3e43-11ed-b180-dac502259ad0.png

圖7,像素x的最近鄰像素

為了更好地理解下面的例子(圖8),一個4x4的圖像是由4個灰度級組成的。這里,在圖8中,0°角下,i=2,j=3,d=1的GLCM值為4。圖8中頂部的矩陣表明,在我們的圖像中有4個實例,灰度級別3的像素與灰度級別2的像素水平分離(即0°)。

61a3a2d8-3e43-11ed-b180-dac502259ad0.png

圖8,共生矩陣的例子,4個灰度級別的4x4的圖像

該矩陣可以進一步用于數(shù)值計算全局紋理特征,如相關(guān)性、能量、熵、同質(zhì)性、對比度、顯著性和陰影。為了進一步了解這些特征是如何從GLCM中提取的,請查看這篇論文:http://www.ijsrp.org/research-paper-0513/ijsrp-p1750.pdf,其中詳細討論了GLCM。

Local Binary Pattern (LBP):

GLCM側(cè)重于從整體圖像獲取信息,而LBP側(cè)重于局部特征而非全局特征。因為紋理是模式的重復(fù),所以LBP嘗試根據(jù)這些模式對紋理進行分類。紋理的局部表示是通過比較一個像素與其鄰域的所有像素來計算的。

在構(gòu)造LBP之前,我們需要將圖像轉(zhuǎn)換為灰度。對于灰度中的每個像素,我們在中心像素周圍選擇一個大小為r的鄰域。通過將相鄰像素標記為0和1來確定中心像素的LBP值,只要像素的強度等于或大于中心像素,它就標記為1,否則標記為0(如圖9所示,其固定的鄰域為3 x 3)。

61db558e-3e43-11ed-b180-dac502259ad0.png

圖9,構(gòu)建LBP的第一步

在下一步計算LBP中,我們從任何相鄰的像素開始,順時針或逆時針方向工作,這個順序必須對數(shù)據(jù)集中所有圖片的所有像素保持相同。這個輸出保存在一個8位數(shù)組中,它被轉(zhuǎn)換成小數(shù),如圖10所示。以8個周圍像素為例,LBP碼的潛在組合為2 - 256種。

61f7587e-3e43-11ed-b180-dac502259ad0.png

圖10,中心像素的8位二進制鄰域,并將其轉(zhuǎn)換為十進制表示

一旦我們對圖像的所有像素重復(fù)上述方法,我們就得到了LBP圖像。僅供參考,參見圖11原始圖像(左)的LBP表示示例(右)。

62144cc2-3e43-11ed-b180-dac502259ad0.png

圖11,原始圖(左)LBP轉(zhuǎn)換后的圖(右)

在使用LBP之后,將提取紋理,以便捕獲紋理的極細粒度細節(jié),并且對紋理進行分類要簡單得多。

小波

在此之前,紋理分析的基本問題是缺乏滿意的工具來描述不同尺寸的紋理。多分辨率分析的進步,如Gabor和小波變換方法有助于解決這一缺陷。小波變換作用于圖像的頻域。你可能想知道圖像的頻域是什么?

一幅圖像有兩個域,一個是空間域,另一個是頻率域。用像素矩陣表示的圖像稱為空間域,而頻域表示像素值在空間域中變化的速率。

頻率指的是圖像中顏色成分的變化速率,頻率高的地方顏色變化快,頻率低的地方顏色變化慢。

高頻分量對應(yīng)圖像邊緣,低頻分量對應(yīng)平滑區(qū)域。小波分析用于將圖像中的信息分成兩個離散的部分-近似和細節(jié)。

一旦將小波變換應(yīng)用于圖像,它將產(chǎn)生四個象限(如圖12所示)的圖像。每個象限代表以下內(nèi)容:

LL (low - low):左上象限沿圖像的行和列使用低通濾波器濾波。這個子塊擁有原始圖像的一半分辨率。

HL(高-低)/LH(低-高):右上和左下象限沿行和列使用高通濾波器和低通濾波器交替過濾。HL子塊顯示圖像的水平邊緣,而LH子塊顯示原始圖像的垂直邊緣。

HH (high - high):右下象限使用高通濾波器沿圖像的行和列進行濾波。該子塊沿著對角線方向描述了原始圖像的邊緣。

然后再對一半分辨率的圖像做小波變換,這是遞歸地完成的,這樣原始圖像的鄰近像素越來越不相關(guān)。

623b3eae-3e43-11ed-b180-dac502259ad0.png

圖12

參考圖13了解小波變換的不同層次。

628fe792-3e43-11ed-b180-dac502259ad0.png

圖13,經(jīng)過幾級小波變換,得到了多分辨率圖

上述圖像分解后的表示方法被稱為多尺度表示和多分辨率方案。經(jīng)過小波變換(小波圖像分解)后的輸出很容易解釋。圖像的每個子部分都提供了方向和特定尺度的信息,這些信息很容易分離出來。小波變換后的子圖像保留了空間信息。

分形

利用分形維數(shù)可以識別圖像的紋理粗糙度、平滑度、固體度和面積等特征。

在歐幾里得n空間中,如果閉集XN?不同的不相交副本的并集,N?的每個元素按比例r縮小都與X相同,則X被稱為自相似。我們可以用下面的表達式為X寫出分形維數(shù)D

62a3ca64-3e43-11ed-b180-dac502259ad0.png

盒計數(shù)法計算分形維數(shù)的算法如下:

目的:分形維數(shù)(FD)的計算。

輸入:二維圖像I

輸出:FD

1.Reada2-DinputimageI
2.[P,Q]=SIZE[I]
3.IfP>Qthenr=p
Elser=q
4.ComputefractaldimensionusingEquation1
5.Stop

采用盒計數(shù)算法計算所有圖像的分形維數(shù)。圖14中l(wèi)ena、bird和rice的圖像是為了說明問題。下表1中列出了分形維數(shù)得到的結(jié)果。

62c40ce8-3e43-11ed-b180-dac502259ad0.png

圖14,原圖:(a) Lena (b) bird (c ) rice;40% 損壞的圖:(d) Lena (e) bird (f)rice

63bdbea0-3e43-11ed-b180-dac502259ad0.png

表1,使用盒計數(shù)法得到的分形維數(shù)

在不同的噪聲水平下,計算了被破壞的Lena, bird和rice圖像的分形維數(shù)。其結(jié)果見表2

63e851e2-3e43-11ed-b180-dac502259ad0.png

表2,Lena, bird和rice的損壞圖像的分形維數(shù)

由表2可知,圖像的分形維數(shù)與粗糙度成正比增加。圖像的粗糙度與噪聲密度成正比,在這種情況下,由于椒鹽噪聲的增加,粗糙度增加了。

由以上結(jié)果可知,分形維數(shù)是比較圖像粗糙度的一種合適的度量。

由于粗糙度在紋理分析中起著重要的作用,分形是一種很好的基于粗糙度的紋理分類方法。

圖像梯度

圖像梯度是許多計算機視覺任務(wù)的基本組成部分之一,也是紋理分類的一項重要技術(shù)。圖像梯度的主要應(yīng)用是在邊緣檢測中。當紋理在不合適的光照下被捕獲時,邊緣檢測對于尋找紋理的邊界是很有用的。

由于圖像梯度是圖像強度的方向變化,為了計算圖像的梯度,我們需要大小和方向,即梯度大?。簣D像強度變化的強度的度量,和梯度方向:圖像強度變化的方向的度量。

為了測量大小,我們計算垂直變化(G?)和水平變化(G?),

641db94a-3e43-11ed-b180-dac502259ad0.png

現(xiàn)在梯度大小(G)和梯度方向(θ)可以用6431ffa4-3e43-11ed-b180-dac502259ad0.pngSobel方法是一種用于尋找圖像梯度的技術(shù)。在這種技術(shù)中,所有圖像的垂直和水平核都是預(yù)先定義的,它們被用來計算圖像梯度(結(jié)果顯示在圖15中)。

6449d764-3e43-11ed-b180-dac502259ad0.png

圖15,左:原始lena圖像,右:Sobel實現(xiàn)的圖像梯度

現(xiàn)在這個圖像梯度已經(jīng)突出了所有的邊緣,以類似的方式,圖像梯度識別所有圖像的邊緣,這將確保不同的紋理區(qū)域?qū)⒈挥行Х指睢?/p>

在深度學習中使用這些技術(shù)

到目前為止,我們已經(jīng)了解了各種紋理提取特征。讓我們看看如何將這些技術(shù)與深度學習相結(jié)合,這樣我們越來越接近使用紋理分類解決現(xiàn)實生活中的用例。

紋理分類可以使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)實現(xiàn)。一個基本的CNN如圖16所示。CNN具有非凡的感知模式的能力,很可能是最精通的深度學習方法。唯一的缺點是,找到不同超參數(shù)的理想值仍然是一個主要的挑戰(zhàn)。

6462ddea-3e43-11ed-b180-dac502259ad0.png

圖16,基本CNN模型

由于紋理分類是一項復(fù)雜的任務(wù),基本的CNN模型可能不適用于高度基于紋理的數(shù)據(jù)集。因此,如圖17所示,我們在做實驗時使用了一個稍微高級的架構(gòu)。該架構(gòu)是2-D卷積層、池化(最大、最小或平均)和批歸一化層的組合,使模型能夠有效地訓練。我們利用2D卷積層,以便更好地進行特征提取。根據(jù)數(shù)據(jù)集的復(fù)雜性,我們可以有更多的層。

64a52470-3e43-11ed-b180-dac502259ad0.png

圖17,一個輸入的紋理分類的CNN模型

我們還嘗試了另一種方法,如圖18所示,我們將輸入圖像與紋理(轉(zhuǎn)換)圖像結(jié)合起來,并使用共享權(quán)重機制將它們傳遞到卷積層。通過使用這種方法,更容易從變換后的圖像中提取特征,因為它們有預(yù)先計算的特征值,并給網(wǎng)絡(luò)關(guān)于圖像代表什么的想法。無論是一個GLCM矩陣,或一個LBP矩陣,或一個圖像梯度矩陣,或兩個轉(zhuǎn)換后的輸入的組合,或三者的組合都可以作為輸入的一部分與原始圖像一起傳遞。

64cd8ab4-3e43-11ed-b180-dac502259ad0.png

圖18,3個輸入的CNN紋理分類模型

在圖18中,原始圖像的一個輸入后面跟著一個lambda層,用于第二個輸入和轉(zhuǎn)換后的圖像的第三個輸入。在它們旁邊是卷積層,輸入大小為128×128,輸出大小為126×126。卷積層的輸出被送入三個Max-Pooling層,一個Max-Pooling層用于每個輸出大小為63×63的輸入。遵循相同的過程,直到使用Add層來連接所有三個輸出,并產(chǎn)生30×30大小的輸出。Flatten層用于115200個輸出,然后是輸出為512的dense層,隨后是批歸一化和Dropout層,以相同的順序添加了兩次。最后,添加一個有11個輸出神經(jīng)元的dense層。

我們在基于紋理的KTH數(shù)據(jù)集,包含11個材質(zhì)的圖像上進行了紋理分類任務(wù)的實驗。

表3,不同的方法的對比

655bedfe-3e43-11ed-b180-dac502259ad0.png

圖19,對表3的可視化圖

從表3和圖19中,我們可以看到,當更相關(guān)(紋理豐富)的信息作為輸入傳遞給深度學習模型時,準確率顯著提高。這些技術(shù)包括兩個以上的特征作為輸入,如GLCM矩陣、LBP矩陣、小波和分形維數(shù),以及原始輸入圖像。

這主要是因為模型也從紋理特征中學習,證明了監(jiān)督預(yù)訓練和幾個轉(zhuǎn)換后的特征矩陣的直接相關(guān)性,可以提高精度

一般來說,信息轉(zhuǎn)換后的輸入代表相關(guān)特征,從而導致更好的準確性。然而,在這種關(guān)系中也有一些例外——例如,當原始輸入與GLCM結(jié)合時,在特定情況下,精度會下降一小部分(圖19)。

在本博客中,我們詳細解釋了紋理特征的主要類型及其分析,并演示了提供更多信息數(shù)據(jù)(以紋理特征的形式)的方法可以有助于提高CNN模型的性能。我們將在接下來的文章中進一步探討這個概念。

英文原文:https://medium.com/@trapti.kalra_ibm/texture-analysis-with-deep-learning-for-improved-computer-vision-aa627c8bb133

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120593
收藏 人收藏

    評論

    相關(guān)推薦

    利用Matlab函數(shù)實現(xiàn)深度學習算法

    在Matlab中實現(xiàn)深度學習算法是一個復(fù)雜但強大的過程,可以應(yīng)用于各種領(lǐng)域,如圖像識別、自然語言處理、時間序列預(yù)測等。這里,我將概述一個基本的流程,包括環(huán)境設(shè)置、數(shù)據(jù)準備、模型設(shè)計、訓練過程、以及測試和評估,并提供一個基于Mat
    的頭像 發(fā)表于 07-14 14:21 ?1167次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個領(lǐng)域。隨
    的頭像 發(fā)表于 07-09 15:54 ?376次閱讀

    深度學習中的無監(jiān)督學習方法綜述

    應(yīng)用中往往難以實現(xiàn)。因此,無監(jiān)督學習深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監(jiān)督
    的頭像 發(fā)表于 07-09 10:50 ?216次閱讀

    基于深度學習的小目標檢測

    )的廣泛應(yīng)用,小目標檢測的性能得到了顯著提升。本文將詳細探討基于深度學習的小目標檢測技術(shù),包括其定義、挑戰(zhàn)、常用方法以及未來發(fā)展方向。
    的頭像 發(fā)表于 07-04 17:25 ?419次閱讀

    深度學習常用的Python庫

    深度學習常用的Python庫,包括核心庫、可視化工具、深度學習框架、自然語言處理庫以及數(shù)據(jù)抓取庫等,并詳細
    的頭像 發(fā)表于 07-03 16:04 ?390次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復(fù)雜且關(guān)鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法。訓練一個深度學習模型,本質(zhì)上是通過優(yōu)化算法調(diào)整模型參數(shù),使模型能夠更好地擬合數(shù)據(jù),提高預(yù)測或
    的頭像 發(fā)表于 07-01 16:13 ?488次閱讀

    一種利用光電容積描記(PPG)信號和深度學習模型對高血壓分類的新方法

    學習方法來對高血壓的四個階段進行分類。這里采用的分類方法是:Alexnet、Resnet -50、VGG-16和新的模型:AvgPool_VGG-16。使用這些算法時要考慮到數(shù)據(jù)集的數(shù)量和多樣性。所
    發(fā)表于 05-11 20:01

    深度解析深度學習下的語義SLAM

    隨著深度學習技術(shù)的興起,計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展,例如目標的檢測、識別和分類等領(lǐng)域。近年來,研究人員開始在視覺SLAM算法中引入深度
    發(fā)表于 04-23 17:18 ?994次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    深度學習檢測小目標常用方法

    深度學習效果在某種意義上是靠大量數(shù)據(jù)喂出來的,小目標檢測的性能同樣也可以通過增加訓練集中小目標樣本的種類和數(shù)量提升
    發(fā)表于 03-18 09:57 ?621次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>檢測小目標常用方法

    為什么深度學習效果更好?

    導讀深度學習是機器學習的一個子集,已成為人工智能領(lǐng)域的一項變革性技術(shù),在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應(yīng)用中取得了顯著的成功。深度
    的頭像 發(fā)表于 03-09 08:26 ?502次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>效果</b>更好?

    用光學拓撲紋理實現(xiàn)亞波長尺度的超精密操控

    近日,同濟大學物理科學與工程學院王占山教授、程鑫彬教授團隊的施宇智教授提出了一種具有光學半子(meron)紋理特征的能流陣列,通過類多星系耦合機制實現(xiàn)了金納米顆粒多軌道旋轉(zhuǎn),以及10nm精度分選
    的頭像 發(fā)表于 01-16 10:45 ?319次閱讀
    用光學拓撲<b class='flag-5'>紋理</b>實現(xiàn)亞波長尺度的超精密操控

    詳解深度學習、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    處理技術(shù)也可以通過深度學習獲得更優(yōu)異的效果,比如去噪、超分辨率和跟蹤算法等。為了跟上時代的步伐,必須對深度
    的頭像 發(fā)表于 01-11 10:51 ?1605次閱讀
    詳解<b class='flag-5'>深度</b><b class='flag-5'>學習</b>、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    北京大學提出Repaint123:紋理質(zhì)量、多視角一致性新SOTA!

    之前,將圖像轉(zhuǎn)換為3D的方法通常采用Score Distillation Sampling (SDS)。盡管該方法的結(jié)果令人印象深刻,但存在一些問題,如多視角不一致、過度飽和、過度平滑的紋理以及生成速度緩慢。
    的頭像 發(fā)表于 01-08 16:13 ?417次閱讀
    北京大學提出Repaint123:<b class='flag-5'>紋理</b>質(zhì)量、多視角一致性新SOTA!

    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用生成式 AI 進行交互式紋理繪制

    在悉尼舉行的 SIGGRAPH Asia Real-Time Live 活動中,NVIDIA 研究人員展示了集成在交互式紋理繪制工作流中的生成式 AI,以及其如何支持藝術(shù)家直接在 3D 物體表面繪制
    的頭像 發(fā)表于 12-26 18:05 ?503次閱讀
    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用生成式 AI 進行交互式<b class='flag-5'>紋理</b>繪制

    神經(jīng)渲染:圖形學與深度學習的完美結(jié)合

    的原理神經(jīng)渲染的原理是利用深度學習模型模擬圖形學渲染的過程,從而實現(xiàn)從輸入到輸出的端到端映射。神經(jīng)渲染是一種基于數(shù)據(jù)驅(qū)動和統(tǒng)計推斷的概率模型,它只需要對場景中的信息進行
    的頭像 發(fā)表于 09-23 08:30 ?902次閱讀
    神經(jīng)渲染:圖形學與<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的完美<b class='flag-5'>結(jié)合</b>