如何去使用深度學(xué)習(xí)的model SLAM位姿估計的自訓(xùn)練方法

一、背景

Object-based SLAM: SLAM就是機(jī)器人同步定位與建圖，通過一些傳感器的測量數(shù)據(jù)同時去建立環(huán)境的地圖，且利用這個地圖對于機(jī)器人的狀態(tài)進(jìn)行估計，機(jī)器人的狀態(tài)包括機(jī)器人的位姿、速度和機(jī)器人的參數(shù)，比如內(nèi)參。環(huán)境地圖包括比如點(diǎn)的位置，線的位置，面的位置。常見的SLAM系統(tǒng)由前端和后端組成，如圖1所示，前端一般從一些原始的傳感器數(shù)據(jù)中采集一些特征，后端利用概率的推斷模型對采集的模型進(jìn)行融合生成全局一致的環(huán)境地圖。

圖1 SLAM結(jié)構(gòu)

要知道環(huán)境中有哪些物體，就需要進(jìn)行物體級SLAM，簡單而言就是以物體為目標(biāo)的SLAM系統(tǒng)，對物體和機(jī)器人的狀態(tài)進(jìn)行估計，如圖2所示。一個是對空間中的幾何體加上語義信息，對下游的任務(wù)有作用，另一個是非常節(jié)省存儲空間的表示。如果用稠密點(diǎn)云就需要用很多的存儲空間，但是基于物體級的SLAM形成的表示是非常輕量化的描述。

圖2 物體級SLAM

如何做Object SLAM? 和廣泛SLAM類似，首先要在原始的測量數(shù)據(jù)中提取特征，使用物體的感知模型，包括二維的目標(biāo)檢測，也包括實(shí)例分割。今天涉及的是六自由度物體估計目標(biāo)檢測，后端也是用概率推斷模型對于多幀進(jìn)行融合生成全局一致的地圖。圖3列舉了一些目標(biāo)SLAM的文章和方法。

圖3 相關(guān)SLAM方法和文章

為什么object SLAM是比較困難的問題？因?yàn)橛幸恍V泛的SLAM具有的挑戰(zhàn)，也面臨一些新的挑戰(zhàn)。廣泛的challenge包括ambiguous data assosiation的問題，比如在一個停車場檢測到一輛車，那么怎么把真的觀測和地圖里面的進(jìn)行關(guān)聯(lián)，那么哪一輛車是當(dāng)前被觀測的車呢？另外一個問題就是動態(tài)的問題，比如有一個車在行進(jìn)，如何判斷這輛車是在行進(jìn)，如何防止這個行進(jìn)的車對相機(jī)跟蹤產(chǎn)生影響，然后如何根據(jù)這個車的行進(jìn)去不斷地更新地圖，這些問題是比較難解決的。新的挑戰(zhàn)主要是源于引入了object perception model，這兩個模型結(jié)合的過程中就會產(chǎn)生一些information瓶頸，比如在deep learning model做出一些預(yù)測的時候，很難對不確定性進(jìn)行量化，很難知道預(yù)測是好是壞。在這種情況下如何去使用深度學(xué)習(xí)的model，如何給觀測賦權(quán)重是一個比較困難的問題。

另外，一個比較重要的在object SLAM領(lǐng)域中的問題就是domain gap問題，在新的環(huán)境中會有性能下降的問題。就是在訓(xùn)練perception model的時候，一般在特定環(huán)境中采取數(shù)據(jù)，給數(shù)據(jù)添加標(biāo)注，用這些標(biāo)注的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)。但當(dāng)使用或測試這個網(wǎng)絡(luò)時，往往在一個新環(huán)境中測試，訓(xùn)練和測試環(huán)境之間很可能有一些區(qū)別，比如光照的不同，背景的不同，噪聲情況的不同，這個差異會使測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)造成分布不匹配的問題，這個問題就是一個domain gap的問題。還會導(dǎo)致perception model性能下降的問題。合成數(shù)據(jù)在真實(shí)情況中使用時，它的效果會大打折扣。希望能夠做到的表現(xiàn)是機(jī)器人在探索不同環(huán)境的時候，能夠自動的適應(yīng)當(dāng)前的環(huán)境，把它的perception model調(diào)整到比較好的性能狀態(tài)。這里對于object SLAM的介紹告一段落，如果感興趣可以在面4的主頁中關(guān)注。

圖4 主頁

二、方法介紹

什么是6自由度物體位姿估計？如圖5所示，圖片中有物體，然后通過模型計算物體相對于相機(jī)的位姿，這個位姿包括3自由度的旋轉(zhuǎn)和3自由度的平移，所以稱它為6自由度的物體位姿估計。具有代表性的工作，比如說CNN和今天會涉及到的方法。

圖5 6自由度的物體位姿估計

今天要探討的不是如何去設(shè)計一個更好的6自由度位姿估計，而是在真實(shí)場景中的表現(xiàn)如何，把它從文章中拿出來，和其他的位姿模型在同樣的benchmark中進(jìn)行對比它們的表現(xiàn)最終如何。 BOP方法進(jìn)行6自由度位姿估計，然后這個benchmark它的目標(biāo)就是這樣的表現(xiàn)，模型對應(yīng)的物體是剛性物體，它們的輸入是RGB和RGBD的圖像。BOP challenge根據(jù)指標(biāo)對不同的model進(jìn)行打分，然后分?jǐn)?shù)比較高的就可以獲得獎項(xiàng)，每年的會議上都有BOP challenge的workshop，介紹如圖6所示。

圖6 BOP六維物體位姿估計 BOP challenge在2019年的結(jié)果，在這一年有很多方法在一些task上去競爭，表1列舉了不同方法的性能比較，按照性能從高到低排列。可以看到這一年的經(jīng)典方法就是基于這種特征的方法是由于基于深度學(xué)習(xí)方法的。表1 BOP challenge性能比較

針對上面的問題給出解釋，首先缺乏在真實(shí)世界中訓(xùn)練的圖片，還有真實(shí)的測試圖片和通常使用的合成的訓(xùn)練圖片之間有比較大的domain gap。這兩個原因?qū)儆谝粋€問題，就是缺少在真實(shí)環(huán)境或者測試環(huán)境中帶有6自由度物體標(biāo)注的數(shù)據(jù)。為了解決這個問題，有哪些方案呢？一種解決方案就是去提高合成數(shù)據(jù)的真實(shí)性，生成更加成熟的數(shù)據(jù)，另一種方案是可以利用test devirament沒有標(biāo)注的數(shù)據(jù)去提高表現(xiàn)。需要用到文章使用的self-training。Semi-supervised learning結(jié)合一些帶有標(biāo)簽和數(shù)據(jù)和不帶有標(biāo)簽的數(shù)據(jù)去提高模型的預(yù)測性能。為什么這樣的事情能夠成功呢？

為什么能夠用不帶有標(biāo)簽的數(shù)據(jù)去提高性能呢？因?yàn)椴粠?biāo)簽的數(shù)據(jù)上往往攜帶了對于預(yù)測的task有用的一些信息。比如霧天的數(shù)據(jù)是不帶標(biāo)簽的數(shù)據(jù)的話，那它就攜帶了這種background的信息，這樣的信息有可能被提出的semi-supervised learning的方法學(xué)習(xí)到，提高模型的表現(xiàn)。不幸的是，Semi-supervised learning大部分的方法都沒有對于收斂的一個保證，很可能越去訓(xùn)練它這個模型的表現(xiàn)越差，因?yàn)轭A(yù)報的一些錯誤的在這個訓(xùn)練過程中會不斷的加強(qiáng)自身導(dǎo)致的。

什么是self-training？ self-training是比較早期的方法，用學(xué)習(xí)模型的預(yù)測去提高模型預(yù)測的能力。圖7是具體的流程圖，首先從一些帶有標(biāo)簽的數(shù)據(jù)開始去訓(xùn)練Deep CNN model，然后用模型在不帶標(biāo)簽的數(shù)據(jù)上預(yù)測，再把這些預(yù)測當(dāng)做新的標(biāo)簽，這些標(biāo)簽就叫做偽標(biāo)簽，并不是真實(shí)的標(biāo)簽，是模型的預(yù)測。這些偽標(biāo)簽可能會有好有壞，為了選出好的偽標(biāo)簽，需要使用selection algorithm選出里面高質(zhì)量的label形成一些帶有偽標(biāo)簽的數(shù)據(jù)。把這些帶有偽標(biāo)簽的數(shù)據(jù)和原始的帶有真實(shí)標(biāo)簽的預(yù)訓(xùn)練的數(shù)據(jù)結(jié)合在一起，微調(diào)或重新訓(xùn)練網(wǎng)絡(luò)。可以看到，整個流程圖中比較重要的一環(huán)就是選擇算法，如果通過這個算法能夠成功的選擇出高質(zhì)量的數(shù)據(jù)的話，就可以提高性能表現(xiàn)，反之可能會降低性能表現(xiàn)。

圖7 self-training流程圖對于文章SLAM-supported self-training for 6D object pose estimation，首先是一些動機(jī)，為什么要做6自由度物體的位姿估計，因?yàn)樗梢越o出這些環(huán)境中的幾何和語義的信息，如圖8所示。

圖8 環(huán)境的幾何和語義信息

在一個環(huán)境中訓(xùn)練，在另外一個環(huán)境中測試，就會存在domain gap問題。這個問題的表現(xiàn)展示了一個video可視化問題，在合成數(shù)據(jù)上訓(xùn)練，有了真實(shí)數(shù)據(jù)再測試，可以看到它很難對這些物體進(jìn)行正確的預(yù)測。那么如何去解決這樣的問題呢？一種最簡單的方式就是在測試數(shù)據(jù)中采集一些數(shù)據(jù)，給這些數(shù)據(jù)加上物體位姿的標(biāo)注，然后微調(diào)6自由度位姿估計器。

但是，整個6自由度物體位姿標(biāo)注的過程非常費(fèi)時費(fèi)力，更重要的一點(diǎn)是希望機(jī)器人在探索不同環(huán)境的時候是不被打斷的，假如機(jī)器人進(jìn)入到新的環(huán)境，還要去標(biāo)注這個新環(huán)境的數(shù)據(jù)，那它對機(jī)器人的自主運(yùn)行就是一個很不利的事情。所以希望做的就是機(jī)器人能夠自己去給它采集到的數(shù)據(jù)進(jìn)行標(biāo)注，做一個self label。

圖9 domain gap問題

應(yīng)運(yùn)而生，有一些方法來解決問題，一般用合成帶有標(biāo)簽的數(shù)據(jù)和一些真實(shí)不帶標(biāo)簽的數(shù)據(jù)一起去提高位姿估計的性能。如圖10所示，它們可以分為single-view methods和Multi-view methods，前者輸入的數(shù)據(jù)是無序的，但是一般機(jī)器人采集的數(shù)據(jù)都是按照一定的次序采集的，會有時間和空間上的連續(xù)性。single-view不能利用連續(xù)性，于是利用Multi-view方法，融合不同視角對于物體位姿的估計來形成更加可靠的對于物體的理解，用這個更加可靠的位姿對一些數(shù)據(jù)做標(biāo)注，再微調(diào)，但大部分需要高精度相機(jī)的運(yùn)動信息。

圖10 single-view方法和multi-view方法

于是，提出了一種用SLAM來支持的方法，通過機(jī)器人采集的數(shù)據(jù)把它放到一個這種魯棒的物體級SLAM的系統(tǒng)里面，然后生成一個全局一致的，包括相機(jī)的位姿和物體的位姿，然后生成一些偽標(biāo)簽，利用一致性的標(biāo)簽作為新的訓(xùn)練數(shù)據(jù)去微調(diào)位姿估計模型，如圖11所示。

圖11 SLAM支持的方法

方法的流程圖如圖12所示，從帶有標(biāo)簽的圖片數(shù)據(jù)入手，預(yù)訓(xùn)練一個6D的物體位姿估計器，把這個估計器放在機(jī)器人上，在行進(jìn)過程中對物體的位姿進(jìn)行估計，然后聯(lián)合物體的位姿估計和機(jī)器人的里程計形成位姿圖。用提出的一些魯棒的優(yōu)化方法求解SLAM估計，包括機(jī)器人的位姿和物體的位姿，從這些模型所預(yù)測的物體位姿和優(yōu)化的位姿物體之中選出比較高質(zhì)量的物體位姿作為偽標(biāo)簽，把它和原始的帶有真實(shí)標(biāo)簽的數(shù)據(jù)進(jìn)行融合。整個流程圖和self-training是一樣的過程，從宏觀上來看，方法左半邊是在做一個魯棒的狀態(tài)估計，形成全局一致的場景地圖，右半邊實(shí)際上是在用semi-supervised learning提高物體位姿估計的性能，方法結(jié)合了兩方面的一個成果。

圖12 方法流程圖

如何進(jìn)行魯棒的位姿圖優(yōu)化來得到比較可靠的SLAM估計？提出了一種自動協(xié)方差調(diào)整的位姿圖優(yōu)化，這里如果展開講可能需要很長時間，在這邊只做一個比較宏觀的介紹。如果大家有興趣，可以去文章中的相關(guān)章節(jié)看到比較細(xì)節(jié)的公式推導(dǎo)。首先要考慮為什么要做這樣一個自動協(xié)方差的調(diào)整，一般在做位姿圖估計的過程中會假設(shè)觀測是符合高斯分布的，這樣就能把問題轉(zhuǎn)換為一個非線性最小二乘問題去求解，為了指定這樣的高斯分布，需要兩個量，一個是期望，一個是方差，對于高維的高斯分布需要一個期望和一個協(xié)方差矩陣。

期望很好得到，可以通過SLAM估計還有測量模型計算每個測量的期望值，但協(xié)方差一般都是經(jīng)驗(yàn)性的給出一個值，在實(shí)際中根據(jù)對于傳感器噪聲大小的一個理解去制定這樣的協(xié)方差值，比如傳感器的噪聲比較大，給一個比較大的協(xié)方差矩陣，反之給一個比較小的協(xié)方差矩陣。現(xiàn)在對于物體位姿的估計都是從深度學(xué)習(xí)模型得到的，也就是說傳感器變成了模型，對噪聲沒有非?？煽康睦斫猓A(yù)測沒有辦法很好的量化。

在這種情況下，如何指定協(xié)方差矩陣？提出的方案是不指定協(xié)方差矩陣，把協(xié)方差矩陣和SLAM的變量進(jìn)行聯(lián)合優(yōu)化，如圖13所示，在公式里展示。第一項(xiàng)代表物體位姿的損失值，最后一項(xiàng)是機(jī)器人里程計的損失值，第一項(xiàng)是正則化項(xiàng)，目的是防止值跑到正無窮，像零這個方向去正則化。求解聯(lián)合優(yōu)化的問題是用的alternating minimization方法，這個方法有兩個優(yōu)勢，第一個優(yōu)勢是對最優(yōu)的協(xié)方差矩陣有一個解析解，第二個好處是可以在分量級別對協(xié)方差矩陣進(jìn)行擬合。得到位姿預(yù)測時，對六個自由度的分量進(jìn)行不同程度的擬合，與傳統(tǒng)方法相比更加靈活，也能夠擬合更廣泛的噪聲模型。

圖13 自動協(xié)方差調(diào)整公式推導(dǎo)

如圖14所示是hybrid pseudo-labeling方法，在兩種位姿中選取高質(zhì)量的偽標(biāo)簽。

圖14 hybrid pseudo-labeling方法

如圖15所示，Hybrid model利用了兩種數(shù)據(jù)，一種數(shù)據(jù)是模型直接在圖片上預(yù)測的物體位姿，另一種是通過優(yōu)化得到的物體位姿，為了對位姿進(jìn)行好壞的評估，有兩種評估方法，一種利用幾何信息，另一種利用視覺信息，幾何信息使用卡方測試，預(yù)測的物體位姿是否和優(yōu)化的物體位姿有顯著的差異，如果有顯著差異可能是比較差的位姿估計，反之是比較好的位姿估計。視覺檢查根據(jù)物體位姿估計生成一個渲染圖片，把渲染物體和真實(shí)物體對比，轉(zhuǎn)換到特征空間，在特征空間上的向量看它們是不是相似。經(jīng)過這兩個check，就能得到比較高質(zhì)量的位姿標(biāo)簽數(shù)據(jù)。

圖15 Hybrid model 提出方法的結(jié)果

如圖16所示，在兩個數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)，并測試方法。第一個數(shù)據(jù)集是一個公開數(shù)據(jù)集，叫做YCB video experiment。首先用一些合成數(shù)據(jù)去預(yù)訓(xùn)練，然后拿到模型上進(jìn)行self-training。值得強(qiáng)調(diào)的是，在進(jìn)行self-training時，不去使用這些label標(biāo)注，完全通過self-training生成標(biāo)注，最后一步就是把self-training后的放在上面去評估表現(xiàn)。Video展示的是它們在測試集的表現(xiàn)，就是在self-training之前和之后進(jìn)行的對比，可以看到self-training后性能更加穩(wěn)定，能夠檢測出更多物體，也有更少離群的位姿估計。

圖16 提出方法的結(jié)果

如圖17所示，第二個實(shí)驗(yàn)是在真實(shí)車上面做的實(shí)驗(yàn)，把相機(jī)放在機(jī)器人上，圍繞物體進(jìn)行導(dǎo)航。做真實(shí)機(jī)器人實(shí)驗(yàn)的目的就是為了測試方法對于挑戰(zhàn)的可行性，提出方法在運(yùn)動模糊等情況下依然可以得到比較好的性能，比較多的提高訓(xùn)練后的表現(xiàn)，離群值很少。

圖17 真實(shí)車實(shí)驗(yàn)

三、總結(jié)和未來展望

提出的方法是魯棒性SLAM所支持的6自由度物體位姿估計的自訓(xùn)練方法，目的是希望做優(yōu)化，方法能夠適應(yīng)新的環(huán)境。最重要的一環(huán)是提出的自動協(xié)方差調(diào)整的位姿圖優(yōu)化方法，最后通過實(shí)驗(yàn)驗(yàn)證了方法的表現(xiàn)。如圖18所示，右上角有文章和代碼的鏈接，感興趣可以去看一下。

?最后就是如何去延伸工作，首先可以給系統(tǒng)加入對動態(tài)物體的處理，如何考慮它的影響，或者某些物體有對稱性的物體位姿如何處理，以及魯棒性的半監(jiān)督學(xué)習(xí)，還有很多更新的方法進(jìn)一步提高表現(xiàn)，最后可以把對于物體級別的性能提升擴(kuò)展到對于物體位姿形狀和類別進(jìn)行估計，用更加可靠的結(jié)果訓(xùn)練，然后估計。當(dāng)然可以很多其他的方面，由于時間的分享，討論告一段落。

四、問題：

1.深度學(xué)習(xí)對于堆疊物體位姿估計有什么建議嗎？可以看一些對于這塊研究的設(shè)計方法的文章，如果對這塊理解的不是特別深入，也可以看一下深藍(lán)學(xué)院的相關(guān)課程。

2.在利用深度學(xué)習(xí)的方法進(jìn)行6自由度物體位姿估計時，如果要建立RGBD數(shù)據(jù)集的話，有什么好的方法推薦嗎？我的理解是如何選擇采集到的RGBD圖片對不對，可以在網(wǎng)上找一些圖，然后放在tool中進(jìn)行學(xué)習(xí)產(chǎn)生標(biāo)注?？梢允褂脙?yōu)化方法只采用標(biāo)注關(guān)鍵幀的方法，利用優(yōu)化進(jìn)行復(fù)制，有效快速的標(biāo)注。

3.得到偽標(biāo)簽以后，再訓(xùn)練網(wǎng)絡(luò)是不是需要離線進(jìn)行？這樣SLAM是否就要停下了？是的，這個說法是正確的，采集到偽標(biāo)簽數(shù)據(jù)時，需要訓(xùn)練位姿估計的模型，需要較長的時間，當(dāng)前大多數(shù)模型都需要較長時間，如果未來有更好的方法在短時間內(nèi)進(jìn)行訓(xùn)練，也希望可以在線進(jìn)行。

4.實(shí)驗(yàn)小車的處理器什么配置？方法實(shí)現(xiàn)在線實(shí)時嗎？在實(shí)驗(yàn)中采取的小車是jerk robot，只是去用它作為一個相機(jī)支架圍繞物體變成目標(biāo)，如果要了解的話可以了解這個機(jī)器人的內(nèi)部構(gòu)造。

5.實(shí)現(xiàn)的方法是單目還是rgbd的？方法是單目的。

6.如果SLAM需要停止的話，那么SLAM的作用不就相當(dāng)于收集數(shù)據(jù)集嗎？是的，這個方法的提出自動收集數(shù)據(jù)集的過程，可能傳到云端，有服務(wù)的話可以很快的訓(xùn)練，也就不需要停止很久。

7.最后檢測的物體仍然是預(yù)訓(xùn)練里面已有的物體嗎？是的。

8.即使不使用SLAM，手動收集數(shù)據(jù)集也可以，另外方法對SLAM的過程有哪些提高？手動收集是可以的，但大部分都是在公開數(shù)據(jù)集中進(jìn)行分析，然后對它進(jìn)行使用。它的問題在于在真實(shí)環(huán)境中對機(jī)器人環(huán)境探索，很難有人一直跟著機(jī)器人，希望機(jī)器人自主做label的。提高主要是自動的產(chǎn)生標(biāo)簽，可以用這個過程優(yōu)化協(xié)方差模型。

編輯：黃飛

閱讀全文

SLAM(31569) SLAM(31569)
深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)

如何才能高效地進(jìn)行深度學(xué)習(xí)模型訓(xùn)練？

分布式深度學(xué)習(xí)框架中，包括數(shù)據(jù)/模型切分、本地單機(jī)優(yōu)化算法訓(xùn)練、通信機(jī)制、和數(shù)據(jù)/模型聚合等模塊。現(xiàn)有的算法一般采用隨機(jī)置亂切分的數(shù)據(jù)分配方式，隨機(jī)優(yōu)化算法（例如隨機(jī)梯度法）的本地訓(xùn)練算法，同步或者異步通信機(jī)制，以及參數(shù)平均的模型聚合方式。

2018-07-09 08:48:22

13609

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法

基于深度學(xué)習(xí)的三維點(diǎn)云配準(zhǔn)方法成為研究的主流，并隨之誕生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

深入分析深度學(xué)習(xí)三維重建的網(wǎng)絡(luò)架構(gòu)和訓(xùn)練技巧

本文章專注于從RGB圖像估計三維物體形狀的深度學(xué)習(xí)方法。除此之外我們還回顧了關(guān)于特定物體（如人臉）的近期研究。

2023-03-10 10:20:45

609

2017全國深度學(xué)習(xí)技術(shù)應(yīng)用大會

學(xué)習(xí)的手寫文字識別新方法，介紹面向文字識別的DropSample、DropSegment等深度學(xué)習(xí)訓(xùn)練技術(shù)，并展示我們基于深度學(xué)習(xí)的幾個應(yīng)用演示系統(tǒng)，包括在線大類別文字識別、人臉美麗顏值打分、面向特定

2017-03-22 17:16:00

SLAM大法之回環(huán)檢測

主動式的閉環(huán)檢測。當(dāng)發(fā)現(xiàn)了新的閉環(huán)信息后，SLAM 3.0使用Bundle Adjuestment(BA)等算法對原先的位姿拓?fù)涞貓D進(jìn)行修正（即進(jìn)行圖優(yōu)化），從而能有效的進(jìn)行閉環(huán)后地圖的修正，實(shí)現(xiàn)更加

2019-03-06 15:38:04

SLAM技術(shù)的應(yīng)用及發(fā)展現(xiàn)狀

結(jié)合激光雷達(dá)或者攝像頭的方法，讓掃地機(jī)可以高效繪制室內(nèi)地圖，智能分析和規(guī)劃掃地環(huán)境，成功讓自己步入了智能導(dǎo)航的陣列。除了掃地機(jī)之外，SLAM技術(shù)在其他服務(wù)機(jī)器人（例如商場導(dǎo)購機(jī)器人、銀行機(jī)器人

2018-12-06 10:25:32

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

;而深度學(xué)習(xí)使用獨(dú)立的層、連接，還有數(shù)據(jù)傳播方向，比如最近大火的卷積神經(jīng)網(wǎng)絡(luò)是第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法，它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能，讓機(jī)器認(rèn)知過程逐層進(jìn)行，逐步抽象，從而大幅度提升

2018-07-04 16:07:53

深度學(xué)習(xí)中過擬合/欠擬合的問題及解決方案

的數(shù)據(jù)可以對未來的數(shù)據(jù)進(jìn)行推測與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經(jīng)產(chǎn)生的數(shù)據(jù)去訓(xùn)練，然后使用該模型去擬合未來的數(shù)據(jù)。在我們機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的訓(xùn)練過程中，經(jīng)常會出現(xiàn)過擬合和欠擬合的現(xiàn)象。訓(xùn)練一開始，模型通常會欠擬合，所以會對模型進(jìn)行優(yōu)化，然而等到訓(xùn)練到一定程度的時候，就需要解決過擬合的問題了。

2021-01-28 06:57:47

深度學(xué)習(xí)介紹

在未來的某個時候，人們必定能夠相對自如地運(yùn)用人工智能，安全地駕車出行。這個時刻何時到來我無法預(yù)見；但我相信，彼時“智能”會顯現(xiàn)出更“切實(shí)”的意義。與此同時，通過深度學(xué)習(xí)方法，人工智能的實(shí)際應(yīng)用能夠在

2022-11-11 07:55:50

深度學(xué)習(xí)入門之中根據(jù)源代碼下載到mnist數(shù)據(jù)集,訓(xùn)練識別率超級低問題

深度學(xué)習(xí)入門中根據(jù)源代碼下載到mnist數(shù)據(jù)集,訓(xùn)練識別率超級低問題

2020-07-08 16:53:17

深度學(xué)習(xí)在醫(yī)學(xué)圖像分割與病變識別中的應(yīng)用實(shí)戰(zhàn)

等方面具有重要意義。本文將介紹這一領(lǐng)域的背景、挑戰(zhàn)，以及通過一個代碼實(shí)例展示如何利用深度學(xué)習(xí)方法進(jìn)行醫(yī)學(xué)圖像分割與病變識別。背景與挑戰(zhàn)醫(yī)學(xué)圖像分割是將醫(yī)學(xué)影像中的結(jié)構(gòu)區(qū)域分離出來，以便醫(yī)生能夠更清晰

2023-09-04 11:11:23

深度學(xué)習(xí)存在哪些問題？

深度學(xué)習(xí)常用模型有哪些？深度學(xué)習(xí)常用軟件工具及平臺有哪些？深度學(xué)習(xí)存在哪些問題？

2021-10-14 08:20:47

深度學(xué)習(xí)技術(shù)的開發(fā)與應(yīng)用

時間安排大綱具體內(nèi)容實(shí)操案例三天關(guān)鍵點(diǎn)1.強(qiáng)化學(xué)習(xí)的發(fā)展歷程2.馬爾可夫決策過程3.動態(tài)規(guī)劃4.無模型預(yù)測學(xué)習(xí)5.無模型控制學(xué)習(xí)6.價值函數(shù)逼近7.策略梯度方法8.深度強(qiáng)化學(xué)習(xí)-DQN算法系列9.

2022-04-21 14:57:39

深度學(xué)習(xí)模型是如何創(chuàng)建的？

到準(zhǔn)備模型，然后再在邊緣的嵌入式系統(tǒng)上運(yùn)行。訓(xùn)練深度學(xué)習(xí)模型是過程的工作量和時間密集型部分，其中通過提供需要時間和

2021-10-27 06:34:15

AGV激光雷達(dá)SLAM定位導(dǎo)航技術(shù)

地實(shí)現(xiàn)多AGV小車的協(xié)調(diào)控制?！　　黾す饫走_(dá)在AGV小車中的使用　　SLAM中可以進(jìn)行環(huán)境信息感知的主要傳感器有激光雷達(dá)、攝像頭等。其中，基于激光雷達(dá)的AGV小車自主定位與建圖的方法，由于其測量精度高

2018-11-09 15:59:01

AI工程師 10 個深度學(xué)習(xí)方法

學(xué)到了大量關(guān)于深度學(xué)習(xí)的相關(guān)知識。在這里，我想分享人工智能工程師 10 個用于解決機(jī)器學(xué)習(xí)問題的強(qiáng)大的深度學(xué)習(xí)方法。但是，我們首先需要定義什么是深度學(xué)習(xí)。如何定義深度學(xué)習(xí)是很多人面臨的一個挑戰(zhàn)，因?yàn)樗?/div>

2019-03-07 20:17:28

AlphaGo為何精通圍棋？圍棋論文曝光【中文翻譯】-原來它是這樣深度學(xué)習(xí)和思考的，難怪老贏！

算法實(shí)現(xiàn)。這些深度神經(jīng)網(wǎng)絡(luò)創(chuàng)造性的通過合并了監(jiān)督式學(xué)習(xí)（通過人類專家棋手的棋譜學(xué)習(xí)）和強(qiáng)化式學(xué)習(xí)（通過自我對弈的方式）來訓(xùn)練。沒有任何的超前搜索，這些神經(jīng)網(wǎng)絡(luò)已經(jīng)通過自我對弈的方式模擬成千上萬的對局并使

2017-06-06 18:25:55

Gaudi Training系統(tǒng)介紹

，這就轉(zhuǎn)化為對訓(xùn)練系統(tǒng)高效擴(kuò)展的日益增長的需求。典型的深度學(xué)習(xí)訓(xùn)練算法包括多種類型的算子，這些算子加起來要進(jìn)行數(shù)十億次運(yùn)算。這些大量的操作可以通過使用先進(jìn)GPU提供的固有并行處理來加速。然而，GPU主要

2023-08-04 06:48:48

LabVIEW自帶深度學(xué)習(xí)，凍結(jié)Tensorflow完成深度學(xué)習(xí)。資料下載

本帖最后由 wcl86 于 2021-5-14 15:26 編輯概述這個例子演示了在Vision開發(fā)模塊中使用Model Importer API來使用深度學(xué)習(xí)為缺陷檢查應(yīng)用程序執(zhí)行對象檢測

2020-07-29 17:41:31

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

著手，使用Nanopi2部署已訓(xùn)練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應(yīng)用，會在復(fù)雜的深度學(xué)習(xí)歷程中有些成就感。目前已有幾十種流行的深度學(xué)習(xí)算法庫，參考網(wǎng)址：https

2018-06-04 22:32:12

gensim增量訓(xùn)練方法

使用gensim訓(xùn)練詞向量

2019-07-31 14:12:54

labview深度學(xué)習(xí)應(yīng)用于缺陷檢測

標(biāo)注產(chǎn)品后通過訓(xùn)練平臺完成模型訓(xùn)練經(jīng)過少量樣品訓(xùn)練得到測試結(jié)果，表明深度學(xué)習(xí)對傳統(tǒng)視覺算法比較棘手的缺陷檢測方面，能簡單粗暴的解決問題，后續(xù)就是增加缺陷樣品的收集，標(biāo)注，以及模型的訓(xùn)練。龍哥手把手教

2020-08-16 18:12:01

labview實(shí)現(xiàn)深度學(xué)習(xí)，還在用python？

如何使用labview實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用。ok樣本ng樣本這些圖片的特征是：ok與ok，ng與ng之間都有差異，傳統(tǒng)的方法要實(shí)現(xiàn)，就需要復(fù)雜的算法編程實(shí)現(xiàn)，如果用深度學(xué)習(xí)，則非常簡單。1.準(zhǔn)備好樣本庫

2020-07-23 20:33:10

　　華為云深度學(xué)習(xí)服務(wù)，讓企業(yè)智能從此不求人

　　近日，華為云發(fā)布了深度學(xué)習(xí)服務(wù)，要讓企業(yè)智能從此不求人。那么企業(yè)云的深度學(xué)習(xí)服務(wù)有哪些能力，為什么能夠做到讓企業(yè)智能從此不求人呢?！　　　』睘楹啞獰o需編程，自動訓(xùn)練企業(yè)業(yè)務(wù)模型　　　　企業(yè)進(jìn)行

2018-08-02 20:44:09

【NanoPi K1 Plus試用體驗(yàn)】深度學(xué)習(xí)---快速開始函數(shù)式（Functional）

今天開始繼續(xù)研究深度學(xué)習(xí)keras的模型Functional。起初將Functional一詞譯作泛型，想要表達(dá)該類模型能夠表達(dá)任意張量映射的含義，但表達(dá)的不是很精確，在Keras 2里我們將這個詞改

2018-07-23 11:15:51

【NanoPi K1 Plus試用體驗(yàn)】深度學(xué)習(xí)---快速開始序貫（Sequential）模型

.add(Dense(32, input_shape=(784,)))model.add(Activation('relu'))在訓(xùn)練模型之前，我們需要通過compile來對學(xué)習(xí)過程進(jìn)行配置。開始訓(xùn)練，Keras以

2018-07-20 15:55:35

【詳解】FPGA：深度學(xué)習(xí)的未來？

的model zoo庫，也很容易用預(yù)先訓(xùn)練好的模型進(jìn)行試驗(yàn)。4.2. 增加訓(xùn)練自由度有人或許以為訓(xùn)練機(jī)器學(xué)習(xí)算法的過程是完全自動的，實(shí)際上有一些超參數(shù)需要調(diào)整。對于深度學(xué)習(xí)尤為如此，模型在參數(shù)量上的復(fù)雜

2018-08-13 09:33:30

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

，即使使用具有一定低位寬的數(shù)據(jù)，深度學(xué)習(xí)推理也不會降低最終精度。目前據(jù)說8位左右可以提供穩(wěn)定的準(zhǔn)確率，但最新的研究表明，已經(jīng)出現(xiàn)了即使降低到4位或2位也能獲得很好準(zhǔn)確率的模型和學(xué)習(xí)方法，越來越多的正在

2023-02-17 16:56:59

優(yōu)化神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法有哪些？

優(yōu)化神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法有哪些？

2022-09-06 09:52:36

全網(wǎng)唯一一套labview深度學(xué)習(xí)教程：tensorflow+目標(biāo)檢測：龍哥教你學(xué)視覺—LabVIEW深度學(xué)習(xí)教程

，labview訓(xùn)練和調(diào)用的編程方法，還講解了大量的案例，手把手幫助學(xué)員學(xué)會如何在labview中應(yīng)用深度學(xué)習(xí)6、課程贈送相關(guān)工業(yè)圖像數(shù)據(jù)集，其價值遠(yuǎn)遠(yuǎn)大于課程本身。2、用戶購買后，將會獲得哪些收益？1

2020-08-10 10:38:12

基于深度學(xué)習(xí)的異常檢測的研究方法

ABSTRACT1.基于深度學(xué)習(xí)的異常檢測的研究方法進(jìn)行結(jié)構(gòu)化和全面的概述2.回顧這些方法在各個領(lǐng)域這個中的應(yīng)用情況，并評估他們的有效性。3.根據(jù)基本假設(shè)和采用的方法將最先進(jìn)的深度異常檢測技術(shù)分為

2021-07-12 06:36:22

基于深度學(xué)習(xí)的異常檢測的研究方法

異常檢測的深度學(xué)習(xí)研究綜述原文：arXiv:1901.03407摘要異常檢測是一個重要的問題，在不同的研究領(lǐng)域和應(yīng)用領(lǐng)域都得到了很好的研究。本文的研究目的有兩個：首先，我們對基于深度學(xué)習(xí)的異常檢測

2021-07-12 07:10:19

基于小波去噪與變換域的信道估計方法

之后加入小波閾值去噪過程,再通過變換域低通濾波插值估計進(jìn)行雙重去噪處理。計算機(jī)仿真結(jié)果表明,該估計方法能夠有效地去除加性高斯白噪聲,比一般的LS估計算法性能要好,在一定程度上彌補(bǔ)了LS估計算法對噪聲

2010-05-06 09:01:31

嵌入式AI的相關(guān)資料下載

，小網(wǎng)絡(luò)是一個學(xué)生讓小網(wǎng)絡(luò)逐漸學(xué)習(xí)到大網(wǎng)絡(luò)的能力三、邊緣側(cè)的訓(xùn)練方法傳統(tǒng)的機(jī)器學(xué)習(xí)訓(xùn)練方法是把數(shù)據(jù)在服務(wù)器上訓(xùn)練好，然后使用聯(lián)邦學(xué)習(xí)是用戶不把數(shù)據(jù)上傳，而是把模型下發(fā)到對應(yīng)的用戶那里用戶訓(xùn)練以后用戶會把訓(xùn)練好的模型上傳到服務(wù)器，服務(wù)器再把訓(xùn)練的模型進(jìn)行合成，

2021-12-14 06:57:15

我想學(xué)習(xí)SLAM技術(shù)有老師愿意教我嗎？

大家好，我想學(xué)習(xí)SLAM技術(shù)有資深的老師愿意教我嗎？qq：496397940

2018-11-09 13:42:27

探討一下深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

的高層表示( 屬性類別或特征) ，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。BP算法是訓(xùn)練多層網(wǎng)絡(luò)的典型算法，但實(shí)際上對于僅含幾層的網(wǎng)絡(luò)，該訓(xùn)練方法就已很不理想。深度結(jié)構(gòu)( 涉及多個非線性處理單元層) 非凸目標(biāo)代價函...

2021-10-27 08:02:31

機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法卷積神經(jīng)網(wǎng)絡(luò)介紹經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹章節(jié)目標(biāo)：深入了解神經(jīng)網(wǎng)絡(luò)的組成、訓(xùn)練和實(shí)現(xiàn)，掌握深度空間特征分布等關(guān)鍵概念，為深度遷移學(xué)習(xí)奠定知識基礎(chǔ)三、遷移學(xué)習(xí)基礎(chǔ)遷移學(xué)習(xí)緒論基于樣本的遷移學(xué)習(xí)

2022-04-28 18:56:07

匯總 |計算機(jī)視覺系統(tǒng)學(xué)習(xí)資料下載精選資料分享

計算機(jī)視覺干貨資料，涉及相機(jī)標(biāo)定、三維重建、立體視覺、SLAM、深度學(xué)習(xí)、點(diǎn)云后處理、姿態(tài)估計、多視圖幾何、多傳感器融合等方向【計算...

2021-07-27 07:51:42

淺談SLAM的回環(huán)檢測技術(shù)

什么是回環(huán)檢測？在講解回環(huán)檢測前，我們先來了解下回環(huán)的概念。在視覺SLAM問題中，位姿的估計往往是一個遞推的過程，即由上一幀位姿解算當(dāng)前幀位姿，因此其中的誤差便這樣一幀一幀的傳遞下去，也就是我們

2018-10-23 17:47:22

淺談深度學(xué)習(xí)之TensorFlow

機(jī)器學(xué)習(xí) API（tf.contrib.learn），可以更容易地配置、訓(xùn)練和評估大量的機(jī)器學(xué)習(xí)模型。可以在 TensorFlow 上使用高級深度學(xué)習(xí)庫 Keras。Keras 非常便于用戶使用，并且

2020-07-28 14:34:04

計算機(jī)視覺應(yīng)用深度學(xué)習(xí)

怎樣從傳統(tǒng)機(jī)器學(xué)習(xí)方法過渡到深度學(xué)習(xí)？

2021-10-14 06:51:23

討論紋理分析在圖像分類中的重要性及其在深度學(xué)習(xí)中使用紋理分析

地執(zhí)行基于紋理特征的分類任務(wù)。為了讓深度學(xué)習(xí)在基于紋理的數(shù)據(jù)上更好地工作，需要有一種方法，可以從圖像中提取紋理特定的特征，并將其傳遞給全連接層，同時保留全局特征。這樣的架構(gòu)設(shè)置將使全連接的層具有信息紋理特征，并有助于更有效地估計類邊界。原作者：Trapti Kalra

2022-10-26 16:57:26

讓機(jī)器人完美建圖的SLAM 3.0到底是何方神圣？

過程中調(diào)整了圖結(jié)構(gòu)中每個節(jié)點(diǎn)的pose和對應(yīng)的傳感器信息以及所有關(guān)鍵點(diǎn)構(gòu)建的位姿關(guān)系圖，利用全部的機(jī)器人位姿信息和對應(yīng)傳感器數(shù)據(jù)生成環(huán)境地圖?！　　　?b class="flag-6" style="color: red">SLAM 3.0 編碼了機(jī)器人在SLAM過程中的位

2019-01-21 10:57:46

遷移學(xué)習(xí)

神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法卷積神經(jīng)網(wǎng)絡(luò)介紹經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹章節(jié)目標(biāo)：深入了解神經(jīng)網(wǎng)絡(luò)的組成、訓(xùn)練和實(shí)現(xiàn)，掌握深度空間特征分布等關(guān)鍵概念，為深度遷移學(xué)習(xí)奠定知識基礎(chǔ) 三、遷移學(xué)習(xí)基礎(chǔ) 遷移學(xué)習(xí)緒論基于樣本的遷移學(xué)習(xí)

2022-04-21 15:15:11

龍哥手把手教你學(xué)視覺-深度學(xué)習(xí)YOLOV5篇

步數(shù)的課程，希望學(xué)員學(xué)習(xí)后能在實(shí)際工業(yè)項(xiàng)目中落地應(yīng)用。本次課程將重點(diǎn)講解《YOLOv5》篇，讓沒有任何深度學(xué)習(xí)基礎(chǔ)的小白學(xué)員，通過視頻課程能動手配置好yolov5環(huán)境，能利用自己的數(shù)據(jù)集訓(xùn)練模型，能

2021-09-03 09:39:28

基于單目深度估計的紅外圖像彩色化方法_戈曼

2017-03-17 10:13:01

改進(jìn)深度學(xué)習(xí)算法的光伏出力預(yù)測方法

為提高光伏出力的預(yù)測精度，提出了一種改進(jìn)深度學(xué)習(xí)算法的光伏出力預(yù)測方法。首先，針對傳統(tǒng)的深度學(xué)習(xí)算法采用批量梯度下降（batch gradient descent，BGD）法訓(xùn)練模型參數(shù)速度慢

2017-12-17 10:42:45

深度學(xué)習(xí)中最核心的問題之一：訓(xùn)練數(shù)據(jù)

今天我們將討論深度學(xué)習(xí)中最核心的問題之一：訓(xùn)練數(shù)據(jù)。深度學(xué)習(xí)已經(jīng)在現(xiàn)實(shí)世界得到了廣泛運(yùn)用，例如：無人駕駛汽車，收據(jù)識別，道路缺陷自動檢測，以及交互式電影推薦等等。

2017-12-25 10:34:28

10255

基于粒子群優(yōu)化的條件概率神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法

的訓(xùn)練方法。我們將這種基于粒子群優(yōu)化的條件概率神經(jīng)網(wǎng)絡(luò)用于人臉年齡估計，實(shí)驗(yàn)結(jié)果表明這種網(wǎng)絡(luò)能夠顯著地提高識別的準(zhǔn)確率。

2018-01-08 16:35:50

研究人員提出一種基于哈希的二值網(wǎng)絡(luò)訓(xùn)練方法比當(dāng)前方法的精度提高了3%

程健研究員團(tuán)隊(duì)最近提出了一種基于哈希的二值網(wǎng)絡(luò)訓(xùn)練方法，揭示了保持內(nèi)積哈希和二值權(quán)重網(wǎng)絡(luò)之間的緊密關(guān)系。

2018-02-08 15:38:13

4940

機(jī)器人SLAM實(shí)現(xiàn)

、幀間配準(zhǔn)、位姿變換估計以及閉環(huán)檢測對SLAM系統(tǒng)的影響，建立了關(guān)鍵幀閉環(huán)匹配算法和SLAM實(shí)時性與魯棒性之間的關(guān)系，提出了一種基于ORB關(guān)鍵幀匹配算法的SLAM方法。運(yùn)用改進(jìn)ORB算法加快了圖像特征點(diǎn)提取與描述符建立速度；結(jié)合相機(jī)模型與深度信息，

2018-03-26 10:57:32

深度學(xué)習(xí)和機(jī)器學(xué)習(xí)深度的不同之處淺談深度學(xué)習(xí)的訓(xùn)練和調(diào)參

近年來，深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)中比較火的一種方法出現(xiàn)在我們面前，但是和非深度學(xué)習(xí)的機(jī)器學(xué)習(xí)相比（我將深度學(xué)習(xí)歸于機(jī)器學(xué)習(xí)的領(lǐng)域內(nèi)），還存在著幾點(diǎn)很大的不同，具體來說，有以下幾點(diǎn).

2018-05-02 10:30:00

4135

高仙SLAM具體的技術(shù)是什么？SLAM2.0有哪些優(yōu)勢？

高仙的SLAM2.0技術(shù)體系核心，是基于多傳感器融合+深度學(xué)習(xí)的架構(gòu)，即語義SLAM。高仙SLAM2.0技術(shù)方案以語義分析、機(jī)器學(xué)習(xí)為基礎(chǔ)，結(jié)合云端實(shí)時信息處理以及專為多傳感器融合而開發(fā)的專業(yè)算法體系，真正實(shí)現(xiàn)了SLAM在建圖和導(dǎo)航兩個環(huán)節(jié)的完整應(yīng)用。

2018-05-15 16:48:30

8535

UC Berkeley大學(xué)的研究人員們利用深度姿態(tài)估計和深度學(xué)習(xí)技術(shù)

給定一段視頻，我們用基于視覺的動作估計器預(yù)測每一幀演員的動作qt。該動作預(yù)測器是建立在人類網(wǎng)格復(fù)原這一工作之上的（akanazawa.github.io/hmr/），它用弱監(jiān)督對抗的方法訓(xùn)練動作估計

2018-10-12 09:06:29

2561

NVIDIA遷移學(xué)習(xí)工具包：用于特定領(lǐng)域深度學(xué)習(xí)模型快速訓(xùn)練的高級SDK

對于設(shè)計和集成智能視頻分析（IVA）端應(yīng)用程序（如停車管理、安全基礎(chǔ)設(shè)施、零售分析、物流管理和訪問控制等）的開發(fā)人員，NVIDIA 的遷移學(xué)習(xí)工具包提供了端到端的深度學(xué)習(xí)工作流，可以加速深度學(xué)習(xí)訓(xùn)練

2018-12-07 14:45:47

2848

深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練技巧的詳細(xì)資料匯總

本文檔的主要內(nèi)容詳細(xì)介紹的是深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練技巧匯總，總結(jié)訓(xùn)練網(wǎng)絡(luò)的各種經(jīng)驗(yàn)和技巧

2019-03-07 08:00:00

針對線性回歸模型和深度學(xué)習(xí)模型，介紹了確定訓(xùn)練數(shù)據(jù)集規(guī)模的方法

學(xué)習(xí)模型的表現(xiàn)會按照冪定律持續(xù)提升。例如，有人曾用深度學(xué)習(xí)方法對三億張圖像進(jìn)行分類，發(fā)現(xiàn)模型的表現(xiàn)隨著訓(xùn)練數(shù)據(jù)規(guī)模的增長按對數(shù)關(guān)系提升。

2019-05-05 11:03:31

5747

微軟在ICML 2019上提出了一個全新的通用預(yù)訓(xùn)練方法MASS

專門針對序列到序列的自然語言生成任務(wù)，微軟亞洲研究院提出了新的預(yù)訓(xùn)練方法：屏蔽序列到序列預(yù)訓(xùn)練（MASS: Masked Sequence to Sequence Pre-training

2019-05-11 09:19:04

3238

新的預(yù)訓(xùn)練方法——MASS！MASS預(yù)訓(xùn)練幾大優(yōu)勢！

專門針對序列到序列的自然語言生成任務(wù)，微軟亞洲研究院提出了新的預(yù)訓(xùn)練方法：屏蔽序列到序列預(yù)訓(xùn)練（MASS: Masked Sequence to Sequence Pre-training）。MASS對句子隨機(jī)屏蔽一個長度為k的連續(xù)片段，然后通過編碼器-注意力-解碼器模型預(yù)測生成該片段。

2019-05-11 09:34:02

6767

谷歌深度神經(jīng)網(wǎng)絡(luò) 基于數(shù)據(jù)共享的快速訓(xùn)練方法

在算法層面實(shí)現(xiàn)對訓(xùn)練過程加速的方法

2019-07-18 09:25:48

2001

如何使用MATLAB實(shí)現(xiàn)深度學(xué)習(xí)的方法研究分析

訓(xùn)練 CNN 需要相當(dāng)大量的數(shù)據(jù)，因?yàn)閷τ诘湫偷膱D像分類問題，其需要學(xué)習(xí)幾百萬個權(quán)值。從頭開始訓(xùn)練 CNN 的另一個常見做法是使用預(yù)先訓(xùn)練好的模型自動從新的數(shù)據(jù)集提取特征。這種方法稱為遷移學(xué)習(xí)，是一種應(yīng)用深度學(xué)習(xí)的便捷方式，其無需龐大的數(shù)據(jù)集以及長時間的訓(xùn)練。

2019-09-16 15:11:20

5433

視覺SLAM深度解讀

不能確切的得到深度。一方面是由于絕對深度未知，單目SLAM不能得到機(jī)器人運(yùn)動軌跡及地圖的真實(shí)大小，如果把軌跡和房間同時放大兩倍，單目看到的像是一樣的，因此，單目SLAM只能估計一個相對深度。另一方面

2019-09-11 22:01:35

1759

Intel實(shí)驗(yàn)室聯(lián)合美國萊斯大學(xué)宣布深度學(xué)習(xí)新算法SLIDE CPU深度學(xué)習(xí)訓(xùn)練效率大大提升

AI（人工智能）是當(dāng)今科技圈的熱門話題，深度學(xué)習(xí)則是AI訓(xùn)練的重要手段之一。如何學(xué)習(xí)要靠硬件和算法支撐，這方面，Intel力挺CPU，NVIDIA則力挺GPU。

2020-03-06 10:36:04

3423

機(jī)器和深度學(xué)習(xí)增強(qiáng)SLAM技術(shù)，有助于感知時代的到來

機(jī)器和深度學(xué)習(xí)的最新進(jìn)展已改進(jìn)了SLAM技術(shù)，從而導(dǎo)致地圖的豐富性增加，語義場景理解提高了定位，地圖質(zhì)量和堅固性。

2020-08-12 11:35:10

1143

膠囊機(jī)器人是如何完成深度學(xué)習(xí)與算法訓(xùn)練的？

通俗一點(diǎn)講，機(jī)器人不是人，它的視覺和決策能力，都需要研制者通過一些方法賦予給它。通過深度學(xué)習(xí)獲得的能力相當(dāng)于膠囊機(jī)器人的大腦，而通過SLAM機(jī)器視覺獲得的就相當(dāng)于膠囊機(jī)器人的“火眼金睛”。

2020-08-28 15:23:06

2320

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有什么區(qū)別？

深度學(xué)習(xí)算法現(xiàn)在是圖像處理軟件庫的組成部分。在他們的幫助下，可以學(xué)習(xí)和訓(xùn)練復(fù)雜的功能;但他們的應(yīng)用也不是萬能的。 “機(jī)器學(xué)習(xí)”和“深度學(xué)習(xí)”有什么區(qū)別？在機(jī)器視覺和深度學(xué)習(xí)中，人類視覺的力量和對視

2021-03-12 16:11:00

7763

一種采用深度殘差網(wǎng)絡(luò)的頭部姿態(tài)估計方法

為提高真實(shí)場景下頭部姿態(tài)估計的準(zhǔn)確性，提出一種采用深度殘差網(wǎng)絡(luò)的頭部姿態(tài)估計方法。將深度殘差網(wǎng)絡(luò) Restnetl01作為主干網(wǎng)絡(luò)，引入優(yōu)化器提高深層卷積網(wǎng)絡(luò)訓(xùn)練時的梯度穩(wěn)定性，使用RGB圖像并采用

2021-03-16 11:27:44

基于深度學(xué)習(xí)的二維人體姿態(tài)估計方法

基于深度學(xué)習(xí)的二維人體姿態(tài)估計方法通過構(gòu)建特定的神經(jīng)網(wǎng)絡(luò)架構(gòu)，將提取的特征信息根據(jù)相應(yīng)的特征融合方法進(jìn)行信息關(guān)聯(lián)處理，最終獲得人體姿態(tài)估計結(jié)果，因其具有廣泛的應(yīng)用價值而受到研究人員的關(guān)注。從數(shù)據(jù)

2021-03-22 15:51:15

一種側(cè)重于學(xué)習(xí)情感特征的預(yù)訓(xùn)練方法

transformers編碼表示）的基礎(chǔ)上，提岀了一種側(cè)重學(xué)習(xí)情感特征的預(yù)訓(xùn)練方法。在目標(biāo)領(lǐng)域的預(yù)練階段，利用情感詞典改進(jìn)了BERT的預(yù)訓(xùn)練任務(wù)。同時，使用基于上下文的詞粒度情感預(yù)測任務(wù)對掩蓋詞情感極性進(jìn)行分類，獲取偏向情感特征的文本表

2021-04-13 11:40:51

實(shí)時SLAM的未來以及深度學(xué)習(xí)與SLAM的比較

SLAM問題可以描述為: 機(jī)器人在未知環(huán)境中從一個未知位置開始移動,在移動過程中根據(jù)位置估計和地圖進(jìn)行自身定位,同時在自身定位的基礎(chǔ)上建造增量式地圖，實(shí)現(xiàn)機(jī)器人的自主定位和導(dǎo)航。

2021-04-18 10:15:20

4643

基于預(yù)訓(xùn)練模型和長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型

語義槽填充是對話系統(tǒng)中一項(xiàng)非常重要的任務(wù)，旨在為輸入句子的毎個單詞標(biāo)注正確的標(biāo)簽，其性能的妤壞極大地影響著后續(xù)的對話管理模塊。目前，使用深度學(xué)習(xí)方法解決該任務(wù)時，一般利用隨機(jī)詞向量或者預(yù)訓(xùn)練詞向量

2021-04-20 14:29:06

采用自監(jiān)督CNN進(jìn)行單圖像深度估計的方法

為了提高利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測單圖像深度信息的精確度，提出了一種采用自監(jiān)督卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行單圖像深度估計的方法。首先，該方法通過在編解碼結(jié)構(gòu)中引入殘差結(jié)構(gòu)、密集連接結(jié)構(gòu)和跳躍連接等方式改進(jìn)了單圖像深度

2021-04-27 16:06:35

基于深度學(xué)習(xí)的二維人體姿態(tài)估計算法

，更能充分地提取圖像信息，獲取更具有魯棒性的特征，因此基于深度學(xué)習(xí)的方法已成為二維人體姿態(tài)估計算法研究的主流方向。然而，深度學(xué)習(xí)尚在發(fā)展中，仍存在訓(xùn)練規(guī)模大等問題，研究者們主要從設(shè)絡(luò)以及訓(xùn)練方式入手對人體姿態(tài)

2021-04-27 16:16:07

虛擬乒乓球手的強(qiáng)化學(xué)習(xí)模仿訓(xùn)練方法

沉浸感是虛擬現(xiàn)實(shí)應(yīng)用的重要特征之一，而虛擬場景中角色行為的智能性與真實(shí)性對虛擬現(xiàn)實(shí)應(yīng)用的沉浸感有著顯著影響。利用強(qiáng)化學(xué)習(xí)方法對球拍的擊球策略進(jìn)行訓(xùn)練，根據(jù)乒乓球游戲規(guī)則設(shè)計了一系列獎勵函數(shù)，使之能

2021-05-12 14:55:05

可消除變壓器漏油檢測的循環(huán)訓(xùn)練方法

檢測問題帶來了挑戰(zhàn)。陰影是自然界中的一種普遍存在的物理現(xiàn)象。對漏油檢測的影響是不可避免的。為了消除陰影對漏油檢測的影響、提出一種循環(huán)訓(xùn)練方法。通過直方圖均衡化以增強(qiáng)困難樣本油污和陰影之間的對比度循環(huán)地訓(xùn)練

2021-06-07 14:44:05

現(xiàn)代交互技術(shù)下的兒童語言表達(dá)訓(xùn)練方法

現(xiàn)代交互技術(shù)下的兒童語言表達(dá)訓(xùn)練方法

2021-06-27 11:27:20

結(jié)合基擴(kuò)展模型和深度學(xué)習(xí)的信道估計方法

結(jié)合基擴(kuò)展模型和深度學(xué)習(xí)的信道估計方法

2021-06-30 10:43:39

深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

2021-10-20 17:51:05

如何使用框架訓(xùn)練網(wǎng)絡(luò)加速深度學(xué)習(xí)推理

TensorRT ，第二個例子是在 Cityscapes 數(shù)據(jù)集上訓(xùn)練的基于?英偉達(dá)數(shù)據(jù)中心深度學(xué)習(xí)產(chǎn)品性能?的語義分割。

2022-04-01 15:45:04

2473

用NVIDIA遷移學(xué)習(xí)工具箱如何訓(xùn)練二維姿態(tài)估計模型

　　本系列的第一篇文章介紹了在 NVIDIA 遷移學(xué)習(xí)工具箱中使用開源 COCO 數(shù)據(jù)集和 BodyPoseNet 應(yīng)用程序的如何訓(xùn)練二維姿態(tài)估計模型。

2022-04-10 09:41:20

1445

人工智能學(xué)習(xí) 遷移學(xué)習(xí)實(shí)戰(zhàn)進(jìn)階

問題的分類經(jīng)典機(jī)器學(xué)習(xí)算法介紹章節(jié)目標(biāo)：機(jī)器學(xué)習(xí)是人工智能的重要技術(shù)之一，詳細(xì)了解機(jī)器學(xué)習(xí)的原理、機(jī)制和方法，為學(xué)習(xí)深度學(xué)習(xí)與遷移學(xué)習(xí)打下堅實(shí)的基礎(chǔ)。二、深度學(xué)習(xí)簡介與經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹神經(jīng)網(wǎng)絡(luò)簡介神經(jīng)網(wǎng)絡(luò)組件簡介神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法 卷積神經(jīng)網(wǎng)絡(luò)介

2022-04-28 17:13:01

1345

時識科技提出新脈沖神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法助推類腦智能產(chǎn)業(yè)落地

近日，SynSense時識科技技術(shù)團(tuán)隊(duì)發(fā)表題為“EXODUS： Stable and Efficient Training of Spiking Neural Networks”的文章，在文章中提出了新的脈沖神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法EXODUS。

2022-06-20 14:21:20

1088

超詳細(xì)配置教程：用Windows電腦訓(xùn)練深度學(xué)習(xí)模型

雖然大多數(shù)深度學(xué)習(xí)模型都是在 Linux 系統(tǒng)上訓(xùn)練的，但 Windows 也是一個非常重要的系統(tǒng)，也可能是很多機(jī)器學(xué)習(xí)初學(xué)者更為熟悉的系統(tǒng)。要在 Windows 上開發(fā)模型，首先當(dāng)然是配置開發(fā)環(huán)境

2022-11-08 10:57:44

1101

基于視覺傳感器的SLAM系統(tǒng)學(xué)習(xí)

視覺SLAM是一種基于視覺傳感器的 SLAM 系統(tǒng)，與激光傳感器相比，視覺傳感器具有成本低、保留環(huán)境語義信息的優(yōu)點(diǎn)，能夠與深度學(xué)習(xí)進(jìn)行大量結(jié)合。

2022-11-29 21:38:37

627

基于深度學(xué)習(xí)的視覺SLAM綜述

SLAM本質(zhì)上是一個狀態(tài)估計問題，根據(jù)傳感器做劃分，主要是激光、視覺兩大類。激光SLAM的研究在理論和工程上都比較成熟，現(xiàn)有的很多行業(yè)已經(jīng)開始使用激光SLAM完成工業(yè)工作；而視覺SLAM

2022-12-02 15:00:28

1149

密集單目SLAM的概率體積融合概述

我們提出了一種利用深度密集單目 SLAM 和快速不確定性傳播從圖像重建 3D 場景的新方法。所提出的方法能夠密集、準(zhǔn)確、實(shí)時地 3D 重建場景，同時對來自密集單目 SLAM 的極其嘈雜的深度估計具有魯棒性。

2023-01-30 11:34:22

449

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎深度學(xué)習(xí)框架是一個非常重要的技術(shù)，它們能夠加速深度學(xué)習(xí)的開發(fā)與部署過程。在深度學(xué)習(xí)中，我們通常需要進(jìn)行兩個關(guān)鍵的任務(wù)，即訓(xùn)練和推理。訓(xùn)練是指使用訓(xùn)練數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)

2023-08-17 16:03:11

906

深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程

了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法。深度學(xué)習(xí)算法可以分為兩大類：監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的基本任務(wù)是訓(xùn)練模型去學(xué)習(xí)輸入數(shù)據(jù)的特征和其對應(yīng)的標(biāo)簽，然后用于新數(shù)據(jù)的預(yù)測。而無監(jiān)督學(xué)習(xí)通常用于聚類、降維和生成模型等任務(wù)中

2023-08-17 16:11:26

638

視覺深度學(xué)習(xí)遷移學(xué)習(xí)訓(xùn)練框架Torchvision介紹

Torchvision是基于Pytorch的視覺深度學(xué)習(xí)遷移學(xué)習(xí)訓(xùn)練框架，當(dāng)前支持的圖像分類、對象檢測、實(shí)例分割、語義分割、姿態(tài)評估模型的遷移學(xué)習(xí)訓(xùn)練與評估。支持對數(shù)據(jù)集的合成、變換、增強(qiáng)等，此外還支持預(yù)訓(xùn)練模型庫下載相關(guān)的模型，直接預(yù)測推理。

2023-09-22 09:49:51

391

動態(tài)場景下的自監(jiān)督單目深度估計方案

自監(jiān)督單目深度估計的訓(xùn)練可以在大量無標(biāo)簽視頻序列來進(jìn)行，訓(xùn)練集獲取很方便。但問題是，實(shí)際采集的視頻序列往往會有很多動態(tài)物體，而自監(jiān)督訓(xùn)練本身就是基于靜態(tài)環(huán)境假設(shè)，動態(tài)環(huán)境下會失效。

2023-11-28 09:21:34

173

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

學(xué)習(xí)中究竟擔(dān)當(dāng)了什么樣的角色？又有哪些優(yōu)勢呢？一、GPU加速深度學(xué)習(xí)訓(xùn)練并行處理GPU的核心理念在于并行處理。在深度學(xué)習(xí)訓(xùn)練過程中，需要處理大量的數(shù)據(jù)。GPU通過

2023-12-06 08:27:37

610

深度學(xué)習(xí)如何訓(xùn)練出好的模型

算法工程、數(shù)據(jù)派THU深度學(xué)習(xí)在近年來得到了廣泛的應(yīng)用，從圖像識別、語音識別到自然語言處理等領(lǐng)域都有了卓越的表現(xiàn)。但是，要訓(xùn)練出一個高效準(zhǔn)確的深度學(xué)習(xí)模型并不容易。不僅需要有高質(zhì)量的數(shù)據(jù)、合適的模型

2023-12-07 12:38:24

547

單目深度估計開源方案分享

可以看一下單目深度估計效果，這個深度圖的分辨率是真的高，物體邊界分割的非常干凈！這里也推薦工坊推出的新課程《單目深度估計方法：算法梳理與代碼實(shí)現(xiàn)》。

2023-12-17 10:01:16

404

如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測與圓心位置預(yù)測

Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測與圓心位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個自定義的圓檢測與圓心定位預(yù)測模型

2023-12-21 10:50:05

529

如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測

Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個工件切割分離點(diǎn)預(yù)測模型

2023-12-22 11:07:46

259

基于深度學(xué)習(xí)的LiDAR SLAM框架（DeepPointMap）

定位準(zhǔn)確性：與六種最新的里程計和SLAM方法進(jìn)行比較，包括KISS-ICP、LeGO-LOAM、SC-LeGO-LOAM、MULLS、CT-ICP和GeoTransformer。在SemanticKITTI、KITTI-360和MulRan數(shù)據(jù)集上比較了DeepPointMap與這些方法的定位準(zhǔn)確性。

2023-12-29 11:48:09

239

混合專家模型 (MoE)核心組件和訓(xùn)練方法介紹

) 的 Transformer 模型在開源人工智能社區(qū)引起了廣泛關(guān)注。在本篇博文中，我們將深入探討 MoEs 的核心組件、訓(xùn)練方法，以及在推理過程中需要考量的各種因素。讓我們開始吧！簡短總結(jié) 混合專家模型 (MoEs

2024-01-13 09:37:33

315

已全部加載完成

搜索歷史

如何去使用深度學(xué)習(xí)的model SLAM位姿估計的自訓(xùn)練方法

評論