0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

掌握基于Transformer的目標(biāo)檢測算法的3個(gè)難點(diǎn)

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-08-22 14:52 ? 次閱讀

說到純視覺的自動(dòng)駕駛方案,大家第一個(gè)想到的就是Tesla吧。的確,早在2021年,Tesla就已經(jīng)實(shí)現(xiàn)了純視覺的BEV檢測方案,而且效果非常好。

849d2c6e-4077-11ee-ac96-dac502259ad0.png

細(xì)心的同學(xué)可能發(fā)現(xiàn)了,這套BEV方案中將相機(jī)空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。

Transformer來源于自然語言處理領(lǐng)域,首先被應(yīng)用于機(jī)器翻譯。后來,大家發(fā)現(xiàn)它在計(jì)算機(jī)視覺領(lǐng)域效果也很不錯(cuò),而且在各大排行榜上碾壓CNN網(wǎng)絡(luò)。

84cb9392-4077-11ee-ac96-dac502259ad0.png

目標(biāo)檢測領(lǐng)域中,視覺Transformer不僅可以實(shí)現(xiàn)2D檢測、3D檢測,還可以實(shí)現(xiàn)多模態(tài)檢測,BEV視角下的檢測,性能也非常出色。

84ec0938-4077-11ee-ac96-dac502259ad0.png

因此,掌握Transformer相關(guān)知識(shí)和工程基礎(chǔ)成為了企業(yè)招聘算法工程師的一個(gè)技能要求點(diǎn),也是簡歷上的一個(gè)很大的加分項(xiàng)。

然而,想要掌握基于Transformer的目標(biāo)檢測算法,有以下3個(gè)難點(diǎn):

理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會(huì)貫通。

85767a5a-4077-11ee-ac96-dac502259ad0.png

掌握基于Transformer的目標(biāo)檢測算法的思路和創(chuàng)新點(diǎn),一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文仍然不理解算法的細(xì)節(jié)部分。

858fef4e-4077-11ee-ac96-dac502259ad0.png

2

Transformer代碼不易看懂,因?yàn)樽饔脵C(jī)制與CNN有不少差別,所以完全理解代碼并實(shí)踐應(yīng)用需要花費(fèi)很大功夫。

85c18b12-4077-11ee-ac96-dac502259ad0.png

3

那么如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測算法呢?

3D視覺工坊聯(lián)合講師「語嫣」,為大家精心準(zhǔn)備了課程「目標(biāo)檢測中的視覺Transformer」,主要幫助各位同學(xué)解決以上這些難點(diǎn)。

不僅為大家詳細(xì)講解視覺Transformer的基礎(chǔ)知識(shí),各種經(jīng)典的基于Transformer的目標(biāo)檢測算法,還配有代碼解讀和實(shí)踐課程,讓大家真正活學(xué)活用,理解和掌握這些知識(shí)理論。

實(shí)踐部分

85d60704-4077-11ee-ac96-dac502259ad0.png

85ebf30c-4077-11ee-ac96-dac502259ad0.png


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    14862
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    5968
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    596

    瀏覽量

    13483

原文標(biāo)題:視覺Transformer,火了

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于深度學(xué)習(xí)的目標(biāo)檢測算法解析

    本節(jié)主要將近年來基于候選區(qū)域的目標(biāo)檢測算法分為五個(gè)部分進(jìn)行綜述,首先介紹了Faster R-CNN[14]框架的發(fā)展歷程,然后綜述了對(duì)Faster R-CNN算法的四
    發(fā)表于 01-09 10:52 ?1103次閱讀

    PowerPC小目標(biāo)檢測算法怎么實(shí)現(xiàn)?

    檢測系統(tǒng)在低功耗、輕小型化等方面提出了更高的要求。因此,完成小目標(biāo)檢測任務(wù)不僅需要尋求合理的小目標(biāo)檢測算法,在實(shí)現(xiàn)時(shí)還需要考慮處理性能和體積
    發(fā)表于 08-09 07:07

    求一種基于機(jī)載單通道SAR數(shù)據(jù)的地面運(yùn)動(dòng)目標(biāo)檢測算法

    兩通道DPCA動(dòng)目標(biāo)檢測原理是什么?基于機(jī)載單通道SAR數(shù)據(jù)的地面運(yùn)動(dòng)目標(biāo)檢測算法
    發(fā)表于 06-03 06:04

    基于YOLOX目標(biāo)檢測算法的改進(jìn)

    實(shí)時(shí)性的前提下,進(jìn)一步提升了近兩個(gè)百分點(diǎn)的精度。在本文的研究中,基于 YOLOX 目標(biāo)檢測算法 進(jìn)行損失函數(shù)的優(yōu)化,以改善遮擋目標(biāo)和小目標(biāo)
    發(fā)表于 03-06 13:55

    基于像素分類的運(yùn)動(dòng)目標(biāo)檢測算法

    針對(duì)復(fù)雜環(huán)境下運(yùn)動(dòng)目標(biāo)檢測提出一種基于像素分類的運(yùn)動(dòng)目標(biāo)檢測算法。該算法通過亮度歸一化對(duì)圖像序列進(jìn)行預(yù)處理,用以降低光照變化造成的誤檢,根據(jù)
    發(fā)表于 04-10 08:51 ?4次下載

    基于碼本模型的運(yùn)動(dòng)目標(biāo)檢測算法

    本內(nèi)容提供了基于碼本模型的運(yùn)動(dòng)目標(biāo)檢測算法
    發(fā)表于 05-19 10:54 ?32次下載
    基于碼本模型的運(yùn)動(dòng)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>

    改進(jìn)的ViBe運(yùn)動(dòng)目標(biāo)檢測算法_劉春

    改進(jìn)的ViBe運(yùn)動(dòng)目標(biāo)檢測算法_劉春
    發(fā)表于 03-19 11:41 ?0次下載

    基于深度學(xué)習(xí)的目標(biāo)檢測算法

    整體框架 目標(biāo)檢測算法主要包括:【兩階段】目標(biāo)檢測算法、【多階段】目標(biāo)檢測算法、【單階段】
    的頭像 發(fā)表于 04-30 10:22 ?1w次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>

    淺談紅外弱小目標(biāo)檢測算法

    紅外單幀弱小目標(biāo)檢測算法主要通過圖像預(yù)處理突出小目標(biāo)同時(shí)抑制背景噪聲干擾,之后采用閾值分割提取疑似目標(biāo),最后根據(jù)特征信息進(jìn)行目標(biāo)確認(rèn)。
    的頭像 發(fā)表于 08-04 17:20 ?5875次閱讀

    快速入門自動(dòng)駕駛中目標(biāo)檢測算法

    現(xiàn)在目標(biāo)檢測算法總結(jié) 1. 目標(biāo)檢測算法在機(jī)動(dòng)車和行人檢測識(shí)別上應(yīng)用較多,在非機(jī)動(dòng)車上應(yīng)用較少 2. 對(duì)于
    發(fā)表于 06-06 09:40 ?0次下載
    快速入門自動(dòng)駕駛中<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>

    無Anchor的目標(biāo)檢測算法邊框回歸策略

    導(dǎo)讀 本文主要講述:1.無Anchor的目標(biāo)檢測算法:YOLOv1,CenterNet,CornerNet的邊框回歸策略;2.有Anchor的目標(biāo)檢測算法:SSD,YOLOv2,F(xiàn)as
    的頭像 發(fā)表于 07-17 11:17 ?1003次閱讀
    無Anchor的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>邊框回歸策略

    基于Transformer目標(biāo)檢測算法3個(gè)難點(diǎn)

    理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會(huì)貫通。
    發(fā)表于 07-18 12:54 ?640次閱讀
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>的<b class='flag-5'>3</b><b class='flag-5'>個(gè)</b><b class='flag-5'>難點(diǎn)</b>

    基于強(qiáng)化學(xué)習(xí)的目標(biāo)檢測算法案例

    強(qiáng)化學(xué)習(xí)的目標(biāo)檢測算法。首先,深度強(qiáng)化學(xué)習(xí)agent根據(jù)初始候選區(qū)域所提取的信息決定相應(yīng)搜索行動(dòng),根據(jù)行動(dòng)選擇下一個(gè)逼近真實(shí)目標(biāo)的候選區(qū)域;然后,重復(fù)上述過程,直至agent能確定當(dāng)前
    發(fā)表于 07-19 14:35 ?0次下載

    基于Transformer目標(biāo)檢測算法

    掌握基于Transformer目標(biāo)檢測算法的思路和創(chuàng)新點(diǎn),一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文
    發(fā)表于 08-16 10:51 ?618次閱讀
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>

    基于Transformer目標(biāo)檢測算法難點(diǎn)

    理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會(huì)貫通。
    發(fā)表于 08-24 11:19 ?296次閱讀
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法難點(diǎn)</b>