0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

ml8z_IV_Technol ? 來源:fqj ? 2019-05-05 09:51 ? 次閱讀

圖像標(biāo)注速度提升10倍!

這是多倫多大學(xué)與英偉達(dá)聯(lián)合公布的一項(xiàng)最新研究:Curve-GCN的應(yīng)用結(jié)果。

Curve-GCN是一種高效交互式圖像標(biāo)注方法,其性能優(yōu)于Polygon-RNN++。在自動(dòng)模式下運(yùn)行時(shí)間為29.3ms,在交互模式下運(yùn)行時(shí)間為2.6ms,比Polygon-RNN ++分別快10倍和100倍。

數(shù)據(jù)標(biāo)注是人工智能產(chǎn)業(yè)的基礎(chǔ),在機(jī)器的世界里,圖像與語音、視頻等一樣,是數(shù)據(jù)的一個(gè)種類。

對(duì)象實(shí)例分割是在圖像中概括給定類的所有對(duì)象的問題,這一任務(wù)在過去幾年受到了越來越多的關(guān)注,傳統(tǒng)標(biāo)記工具通常需要人工先在圖片上點(diǎn)擊光標(biāo)描記物體邊緣來進(jìn)行標(biāo)記。

然而,手動(dòng)跟蹤對(duì)象邊界是一個(gè)費(fèi)力的過程,每個(gè)對(duì)象大概需要30-60秒的時(shí)間。

為了緩解這個(gè)問題,已經(jīng)提出了許多交互式圖像分割技術(shù),其通過重要因素加速注釋。但是交互式分割方法大多是逐像素的(比如DEXTR),在顏色均勻的區(qū)域很難控制,所以最壞的情況下仍然需要很多點(diǎn)擊。

Polygon-RNN將humans-in-the-loop(人機(jī)回圈)過程進(jìn)行構(gòu)架,在此過程中模型按順序預(yù)測(cè)多邊形的頂點(diǎn)。通過糾正錯(cuò)誤的頂點(diǎn),注釋器可以在發(fā)生錯(cuò)誤時(shí)進(jìn)行干預(yù)。該模型通過調(diào)整校正來繼續(xù)其預(yù)測(cè)。 Polygon-RNN顯示在人類協(xié)議水平上產(chǎn)生注釋,每個(gè)對(duì)象實(shí)例只需點(diǎn)擊幾下。這里最糟糕的情況是多邊形頂點(diǎn)的數(shù)量,大多數(shù)對(duì)象的范圍最多為30-40個(gè)點(diǎn)。

然而,模型的重復(fù)性將可擴(kuò)展性限制為更復(fù)雜的形狀,導(dǎo)致更難的訓(xùn)練和更長(zhǎng)的推理。此外,期望注釋器按順序糾正錯(cuò)誤,這在實(shí)踐中通常是具有挑戰(zhàn)性的。

最新研究成果中,研究人員將對(duì)象注釋框架化為回歸問題,其中所有頂點(diǎn)的位置被同時(shí)預(yù)測(cè)。

在Curve-GCN中,注釋器會(huì)選擇一個(gè)對(duì)象,然后選擇多邊形或樣條輪廓。

Curve-GCN自動(dòng)地勾勒出對(duì)象的輪廓

Curve-GCN允許交互式更正,并且可以自動(dòng)重新預(yù)測(cè)多邊形/樣條

與Polygon-RNN + +相比:

Curve-GCN具有多邊形或樣條曲線參數(shù)

Curve-GCN可同時(shí)預(yù)測(cè)控制點(diǎn)(更快)

初始化預(yù)測(cè)

人工校正

模型校正

模型是在CityScapes數(shù)據(jù)集上訓(xùn)練的

自動(dòng)模式下的比較。從左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自動(dòng)模式。(上)cityscaps訓(xùn)練模型的開箱即用輸出,(下)使用來自新領(lǐng)域的10%的數(shù)據(jù)進(jìn)行微調(diào)。

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

將Polygon和Spline-GCN與Polygon-RNN ++和PSP-DeepLab進(jìn)行比較

模型在最先進(jìn)的基礎(chǔ)上進(jìn)行了改進(jìn),速度顯著加快,允許只具有局部效果的交互式更正,從而為注釋器提供了更多的控制。這將導(dǎo)致更好的整體注釋策略。

論文摘要

通過邊界跟蹤來手動(dòng)標(biāo)記對(duì)象是一個(gè)繁重的過程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架構(gòu)以循環(huán)方式產(chǎn)生多邊形注釋,允許通過humans-in-the-loop(人機(jī)回圈)的方式進(jìn)行交互式校正。

我們提出了一個(gè)新的框架,通過使用圖形卷積網(wǎng)絡(luò)(GCN)同時(shí)預(yù)測(cè)所有頂點(diǎn),減輕了Polygon-RNN的時(shí)序性。我們的模型是端到端訓(xùn)練的。它支持多邊形或樣條對(duì)對(duì)象進(jìn)行標(biāo)注,從而提高了基于線和曲線對(duì)象的標(biāo)注效率。結(jié)果表明,在自動(dòng)模式下,Curve-GCN的性能優(yōu)于現(xiàn)有的所有方法,包括功能強(qiáng)大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明顯高于Polygon-RNN++。我們的模型在自動(dòng)模式下運(yùn)行29.3ms,在交互模式下運(yùn)行2.6ms,比Polygon-RNN ++分別快10倍和100倍。

多倫多大學(xué)&NVIDIA最新成果 圖像標(biāo)注速度提升10倍

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6837

    瀏覽量

    88754
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46697

    瀏覽量

    237182
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3723

    瀏覽量

    90709

原文標(biāo)題:多倫多大學(xué)&NVIDIA最新成果:圖像標(biāo)注速度提升10倍!

文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    SpeedDP! 超便利AI自動(dòng)圖像標(biāo)注工具 功能豐富、省時(shí)省力

    超級(jí)AI,在線標(biāo)注,既能解放雙手,又省時(shí)省力。傳統(tǒng)的標(biāo)注模式需要你對(duì)著目標(biāo)不斷拉框,反復(fù)機(jī)械的動(dòng)作做多了就變得“麻木”,影響效率還使人煩惱。而SpeedDP的出現(xiàn),可以有效的提升標(biāo)注
    的頭像 發(fā)表于 08-30 12:59 ?230次閱讀
    SpeedDP! 超便利AI自動(dòng)<b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>工具   功能豐富、省時(shí)省力

    多倫科技旗下金電科技亮相北京充換電展 引領(lǐng)綠色出行新紀(jì)元

    多倫科技旗下金電科技在發(fā)展過程中始終注重綠色生態(tài)的構(gòu)建,堅(jiān)持開放合作,通過共享資源、成果共創(chuàng)等方式,共同推動(dòng)新能源汽車充電技術(shù)的快速發(fā)展與普及。
    的頭像 發(fā)表于 08-15 15:44 ?417次閱讀
    <b class='flag-5'>多倫</b>科技旗下金電科技亮相北京充換電展 引領(lǐng)綠色出行新紀(jì)元

    慧視SpeedDP大模型打造圖像標(biāo)注新時(shí)代

    在人工智能時(shí)代,圖像標(biāo)注不僅能夠反哺AI的發(fā)展,還能進(jìn)一步降低項(xiàng)目成本。傳統(tǒng)的圖像標(biāo)注需要人工采用文本或者相應(yīng)工具機(jī)械式的進(jìn)行圖像標(biāo)簽分配,
    的頭像 發(fā)表于 05-24 08:29 ?486次閱讀
    慧視SpeedDP大模型打造<b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>新時(shí)代

    多光子顯微鏡探究斑馬魚的社會(huì)行為

    圖 1:多倫多大學(xué)所用多光子顯微鏡系統(tǒng)中包括可調(diào)諧 激光器 (Coherent Discovery) 和固定波長(zhǎng)激光器 (Coherent Axon),可節(jié)省寶貴的平臺(tái)空間,同時(shí)改善成像靈活性
    的頭像 發(fā)表于 05-22 06:39 ?184次閱讀
    多光子顯微鏡探究斑馬魚的社會(huì)行為

    龍芯:自主研發(fā)CPU提升性能,單核通用性能提高20

    張戈強(qiáng)調(diào),龍芯CPU的主要IP核均為自主研發(fā),這使得其性價(jià)比得到顯著提升。他指出,國(guó)產(chǎn)CPU與主流CPU的差距主要體現(xiàn)在單核性能上,而非多核性能。近年來,龍芯CPU的單核通用性能已提升了20,主頻
    的頭像 發(fā)表于 04-25 15:26 ?741次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于 GPU 上進(jìn)行
    的頭像 發(fā)表于 04-20 09:39 ?614次閱讀

    人工圖像標(biāo)注1~2分鐘,SpeedDP僅需7-8毫秒!降本增效不是夢(mèng)!

    在工作中你有沒有遇到這樣的問題,20萬拿下一個(gè)項(xiàng)目,時(shí)間緊迫,但是項(xiàng)目有著大量的圖像標(biāo)注需求,如果單獨(dú)招一個(gè)圖像標(biāo)注的工程師,光該崗位的工資成本就會(huì)花去四五萬,畢竟項(xiàng)目結(jié)束了你總不能就
    的頭像 發(fā)表于 03-29 08:28 ?508次閱讀
    人工<b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>1~2分鐘,SpeedDP僅需7-8毫秒!降本增效不是夢(mèng)!

    新型散熱材料金剛石納米膜有望將電動(dòng)汽車的充電速度提升

    近日,德國(guó)弗勞恩霍夫研究所 (Fraunhofer) 的科學(xué)家們利用超薄金剛石膜成功降低了電子元件的熱負(fù)荷,并有望將電動(dòng)汽車的充電速度提升。
    的頭像 發(fā)表于 03-07 16:33 ?1314次閱讀
    新型散熱材料金剛石納米膜有望將電動(dòng)汽車的充電<b class='flag-5'>速度</b><b class='flag-5'>提升</b>五<b class='flag-5'>倍</b>

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10

    的潞晨科技Colossal-AI系統(tǒng),用戶可實(shí)現(xiàn)在本地算力平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開發(fā)效率提升10以上,并將算力效率提升2-3
    的頭像 發(fā)表于 03-01 09:43 ?445次閱讀
    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率<b class='flag-5'>提升</b><b class='flag-5'>10</b><b class='flag-5'>倍</b>

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    UTalk-Doc 將用戶指令識(shí)別服務(wù)吞吐量提升了 5 ,單個(gè)請(qǐng)求響應(yīng)時(shí)間縮減了三分之一,大幅提升服務(wù)運(yùn)行效率,提升資源利用率。Triton 模型分析能力還協(xié)助必優(yōu)科技,將尋找最佳
    的頭像 發(fā)表于 01-17 09:30 ?636次閱讀

    利用AI實(shí)現(xiàn)自動(dòng)圖像標(biāo)注不是夢(mèng)

    一次次的將圖像添加標(biāo)簽進(jìn)行分類,如此機(jī)械式的操作是否令你心煩?為不多不少的圖像分類標(biāo)注工作不得不增加一個(gè)崗位?你是否因圖像標(biāo)注需求和數(shù)據(jù)安全
    的頭像 發(fā)表于 01-04 08:29 ?1227次閱讀
    利用AI實(shí)現(xiàn)自動(dòng)<b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>不是夢(mèng)

    視覺 AI “落地”加拿大最大、最繁忙的多倫多皮爾遜國(guó)際機(jī)場(chǎng)

    NVIDIA Metropolis 視覺 AI 合作伙伴生態(tài)系統(tǒng) 成員 Zensors 在多倫多皮爾遜國(guó)際機(jī)場(chǎng)部署視覺 AI 平臺(tái),大幅縮短了海關(guān)排隊(duì)等候時(shí)間。 多倫多皮爾遜國(guó)際機(jī)場(chǎng)位于加拿大
    的頭像 發(fā)表于 12-21 19:35 ?618次閱讀

    圖像標(biāo)注如何提升效率?

    圖像標(biāo)注是通過一定方式對(duì)圖像進(jìn)行標(biāo)記分類,是對(duì)數(shù)據(jù)集的圖像進(jìn)行標(biāo)記以訓(xùn)練機(jī)器學(xué)習(xí)模型的過程。當(dāng)圖像數(shù)量可控時(shí),用人工
    的頭像 發(fā)表于 12-19 08:29 ?428次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>如何<b class='flag-5'>提升</b>效率?

    衛(wèi)星信號(hào)監(jiān)測(cè)可靠性提升10,移動(dòng)性提升30!這家廣播公司是這樣做到的

    意大利廣播公司的頻譜監(jiān)測(cè)方案面臨衰減過大、監(jiān)測(cè)結(jié)果不可靠、成本過高等難題,德思特通過手持式頻譜分析儀助力意大利廣播公司實(shí)現(xiàn)衛(wèi)星信號(hào)監(jiān)測(cè)可靠性提升10,移動(dòng)性提升30
    的頭像 發(fā)表于 11-23 11:19 ?448次閱讀
    衛(wèi)星信號(hào)監(jiān)測(cè)可靠性<b class='flag-5'>提升</b><b class='flag-5'>10</b><b class='flag-5'>倍</b>,移動(dòng)性<b class='flag-5'>提升</b>30<b class='flag-5'>倍</b>!這家廣播公司是這樣做到的

    SiC晶圓劃片工藝:速度提升100,芯片增加13%

    近日,一家日本廠商發(fā)布了一種全新的SiC晶圓劃片工藝,與傳統(tǒng)工藝相比,這項(xiàng)技術(shù)可將劃片速度提升100,而且可以幫助SiC廠商增加13%的芯片數(shù)量。
    的頭像 發(fā)表于 11-21 18:15 ?2294次閱讀
    SiC晶圓劃片工藝:<b class='flag-5'>速度</b><b class='flag-5'>提升</b>100<b class='flag-5'>倍</b>,芯片增加13%