0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

facebook AI研究院又發(fā)布了一個大規(guī)模的詞匯實例分割數(shù)據(jù)集

nlfO_thejiangme ? 來源:lq ? 2019-10-01 16:26 ? 次閱讀

聚焦于關鍵科學問題的數(shù)據(jù)不斷促進著目標檢測領域的技術進步,使得目標檢測的性能從簡單的圖像擴展到了復雜的場景,從邊框標注拓展到了語義分割掩膜。

近日來自facebook AI研究院的研究人員們又發(fā)布了一個大規(guī)模的詞匯實例分割數(shù)據(jù)集(Large Vocabulary Instance Segmentation,LVIS ),包含了164k圖像,并針對超過1000類物體進行了約200萬個高質量的實例分割標注。由于數(shù)據(jù)集中包含自然圖像中的物體分布天然具有長尾屬性,LVIS數(shù)據(jù)集將促進深度學習在圖像分割領域的進一步發(fā)展。

目標檢測是計算機視覺領域的重要任務,適用性強、用途廣泛、發(fā)展迅速,近年來在數(shù)據(jù)集、基準算法和檢測能力上都得到了大幅度提升,并衍生出一系列新的能力,包括圖像分割、三維表示和三維目標檢測等內容。

目前針對目標檢測算法的嚴格測評只在少量的分類上進行(例如20類/80類),那么在真實環(huán)境中有大規(guī)模類別的物體或者出現(xiàn)了罕見的物體時該如何處理?這就為科學家們提出了新的問題。

圖像中目標類別的長尾效應是不可避免的,標注更多的數(shù)據(jù)集雖然可以有效地發(fā)現(xiàn)先前未見或罕見的類別,但有效地從小樣本中學習至今還是機器學習與計算機視覺領域一個重要的開放問題,也使得這一領域成為科學界與工業(yè)界研究最為活躍的領域。但要深入的對這一領域進行研究,一個高質量的數(shù)據(jù)集和基準必不可少!

FAIR的研究人員針對這一研究方向設計并收集了稱為LVIS的針對于大規(guī)模詞匯實例分割的數(shù)據(jù)集,這一數(shù)據(jù)集包含了164k圖像,超過1000類數(shù)據(jù),約兩百萬個標注。

值得一提的是,這個數(shù)據(jù)集的收集流程沒有預先確定的類別(沒有類別先驗),首先收集圖像然后根據(jù)圖像中目標的自然分布來進行標注。大量的人工標注代替了機器的自動化標注使得圖像中自然存在的長尾分布可以被有效識別。

COCO和ADE20K數(shù)據(jù)集

研究人員設計了一個有效的眾包標注流程,可以在高質量標注的前提下獲取大規(guī)模的數(shù)據(jù)集。對于目標檢測和實例分割來說,標注的質量對于算法十分重要。類似COCO這樣相對較粗的標注限制了算法對于mask預測質量的提升。與COCO和ADE20K相比,LVIS數(shù)據(jù)的標注mask具有更大的重疊面積和更好的邊緣連續(xù)性。

在構建數(shù)據(jù)集的過程中,研究人員采用了評價優(yōu)先的設計原則。這意味著研究人員首先確定了對算法性能進行評價的方法,并基于這一方法來進行數(shù)據(jù)集的收集和構建,以滿足評測方法的需求。研究人員提出的測評基準使用了類似coco風格的的實例分割和AP計算方法。

但針對自然圖像中較為長尾的數(shù)據(jù)集,需要解決兩個不可避免的問題:

1)在類別龐大的情況下,如果某個目標擁有多個標簽,該如何公平的評測檢測器的性能?

2)針對164k圖像超過一千個類別的標注任務,如何設計合適的標注流程來減少工作量?

解決這些問題的關鍵在于構建聯(lián)合數(shù)據(jù)集:通過多個小數(shù)據(jù)集聯(lián)合構建大規(guī)模的完整數(shù)據(jù)集,而每一個子數(shù)據(jù)集則類似于只聚焦于某個單一類別的傳統(tǒng)數(shù)據(jù)集。在標注過程中,每一個小數(shù)據(jù)集將集中標注某一個特定的類別,將圖中某個特定類別的所有目標窮盡(exhaustive )標注。

對于完整的大數(shù)據(jù)集來說,構成的子數(shù)據(jù)集間可能會有重疊,單一目標可能會有多個標簽。此外由于在每個小數(shù)據(jù)集中進行了針對一類物體的窮盡標注,在完整的聯(lián)合數(shù)據(jù)集中就無需對所有的類別進行窮盡標注,這樣的方法極大地減小了標注的工作量。

更為關鍵的是,在測試評價時算法并不知道每張圖片組成的標記類別,它將對所有的標記類別一視同仁地進行處理,這將對聯(lián)合數(shù)據(jù)集內的各個數(shù)據(jù)集提供公平的測評。

LVIS數(shù)據(jù)集針對的是實例分割任務,這一任務的主要目標是在給定分類已知固定類別的情況下,算法可以針對一張事先未見過的圖像進行處理,并輸出圖像中出現(xiàn)的每一個實例及其對應的分類和置信度分數(shù)。通過算法生成的一系列輸出,可以計算出掩膜的平均精度mAP。

但在算法的測評中,研究人員將面臨著一系列問題。隨著分類數(shù)目的增加,實例的標簽不可避免的將會出現(xiàn)重疊和混淆:部分視覺概念的重合、父子分類關系的的界定和同義詞的識別等等。如果沒有有效的方法處理這些問題,測評的方法將會產(chǎn)生很大的不公平性。

例如很多玩具都不是鹿,大多數(shù)鹿都是不是玩具,但是一只玩具鹿同時是玩具也是一只鹿,這時目標檢測算法很有可能得到錯誤的標記。再比如,一輛車的標記是交通工具vehicle,算法如果輸入了car那么就會被判定為錯誤。

這些問題的發(fā)生主要來源于GT標注缺失了一個或者多個描述目標的標簽。如果算法預測到了某個標簽但是沒有在GT中標注過就會得到錯誤的懲罰。但對于這個新的數(shù)據(jù)集來說,每一個物體的標簽都被窮盡且正確的標注,上面的問題就可以迎刃而解。

數(shù)據(jù)集標注流程

數(shù)據(jù)集的標注流程分為了六個主要的步驟包括目標定點、窮盡標記、實例分割和驗證、窮盡標注驗證、負例標簽等。

目標定點中標注者被要求將圖像中輸入不同類別的實例進行標記,這個階段將迭代進行,使得標注者可以不斷從圖像中發(fā)掘出自然場景下目標的長尾信息。隨后再針對第一階段標記的每一個類別,將進行徹底的實例標記,找出每一類別包含的所有實例。在圖中可以看到標記者又標記出了更多的書。

在第三和第四階段,分別對前面標記的實例進行實例分割標注和驗真,重復進行直到準確率超過99%通過驗證。第五階段將進行窮盡標注驗證檢測,檢查是否所有的實例都被分割和標注類別,如果有就將缺失標注實例的類別篩選出來進行補充標注。最后一步的負例標簽將用來驗證類別子類的標簽沒有出現(xiàn)在圖像中。更詳細的標注細節(jié)請參看論文的第三部分。

探索數(shù)據(jù)集

下面讓我們來探索一下數(shù)據(jù)集,下圖中可以看到每張圖像里對于某一類圖像都進行了完善地標注,小的、被遮掩的難以辨認的,目標實例都被標注了出來。比如第一行最后一列的車牌標注和第三行最后一列的相機標注,盡管很小但也別明確地畫出掩膜。這些目標對于圖像的抽象和理解十分重要。

下圖中各類實例也別分別標注出來了:

子數(shù)據(jù)集中,每個實例都被窮盡標注。例如對于飛機這個分類,下圖展示了每張圖片中所有的飛機,無論是飛機的一部分還是完整的飛機都被標注了出來。

還有這些誘人的水果,都被一個個挑了出來。就拿菠蘿來說吧,無論是商店里的完整菠蘿還是沙拉里的菠蘿,就連披薩里的菠蘿丁也被標記出來了。

還有更多好玩的的數(shù)據(jù)集和詳細的分類信息,請參看數(shù)據(jù)集網(wǎng)站:

https://www.lvisdataset.org

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1076

    瀏覽量

    40281
  • Facebook
    +關注

    關注

    3

    文章

    1429

    瀏覽量

    54479
  • 計算機視覺
    +關注

    關注

    8

    文章

    1685

    瀏覽量

    45814
  • 數(shù)據(jù)集

    關注

    4

    文章

    1197

    瀏覽量

    24538

原文標題:FAIR提出大規(guī)模細粒度詞匯級標記數(shù)據(jù)集LVIS,有效識別長尾分布

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開芯發(fā)布全球首個開源大規(guī)模片上互聯(lián)網(wǎng)絡IP“溫榆河”

    2024年5月21日,北京開源芯片研究院(簡稱“開芯”)通過線上會議的方式,向會員單位正式發(fā)布全球首個開源大規(guī)模片上互聯(lián)網(wǎng)絡(Netwo
    的頭像 發(fā)表于 06-04 08:37 ?11.7w次閱讀
    開芯<b class='flag-5'>院</b><b class='flag-5'>發(fā)布</b>全球首個開源<b class='flag-5'>大規(guī)模</b>片上互聯(lián)網(wǎng)絡IP“溫榆河”

    香港應科—國芯科技新型AI芯片聯(lián)合研究實驗室正式成立

    2024年5月21日上午,“香港應科-蘇州國芯新型AI芯片聯(lián)合研究實驗室”在香港應用科技研究院成果轉化發(fā)布會暨蘇州高新區(qū)科技交流會上正式成
    的頭像 發(fā)表于 05-22 15:14 ?413次閱讀
    香港應科<b class='flag-5'>院</b>—國芯科技新型<b class='flag-5'>AI</b>芯片聯(lián)合<b class='flag-5'>研究</b>實驗室正式成立

    長沙北斗研究院總部基地正式奠基

    長沙北斗研究院總部基地正式奠基 日前長沙北斗研究院總部基地正式奠基,項目由長沙北斗研究院牽頭建設;項目又名“北斗足跡”。項目期預計2025年年底前建成投用。 據(jù)悉,長沙北斗
    的頭像 發(fā)表于 05-16 12:49 ?999次閱讀

    北京開源芯片研究院正式加入甲辰計劃!

    北京開源芯片研究院正式加入甲辰計劃,致力于在下一個丙辰年(2036龍年)之前,基于RISC-V實現(xiàn)從數(shù)據(jù)中心到桌面辦公、從移動穿戴到智能物聯(lián)網(wǎng)全信息產(chǎn)業(yè)覆蓋的開放標準體系及開源系統(tǒng)軟件棧,使
    的頭像 發(fā)表于 05-10 08:33 ?538次閱讀
    北京開源芯片<b class='flag-5'>研究院</b>正式加入甲辰計劃!

    航天宏圖與天儀研究院合作共同推動遙感衛(wèi)星數(shù)據(jù)應用創(chuàng)新

    近日,航天宏圖信息技術股份有限公司(以下簡稱“航天宏圖”)與長沙天儀空間科技研究院有限公司(以下簡稱“天儀研究院”)正式簽署戰(zhàn)略合作框架協(xié)議。
    的頭像 發(fā)表于 04-23 17:11 ?386次閱讀
    航天宏圖與天儀<b class='flag-5'>研究院</b>合作共同推動遙感衛(wèi)星<b class='flag-5'>數(shù)據(jù)</b>應用創(chuàng)新

    本源入榜胡潤研究院2024全球獨角獸榜單!

    4月9日,胡潤研究院于廣州發(fā)布《2024全球獨角獸榜》,榜單列出了全球成立于2000年之后,價值10億美元以上的非上市公司。本源量子成功入圍該榜單,也是中國量子計算領域唯入榜企業(yè)。來源:胡潤
    的頭像 發(fā)表于 04-12 08:22 ?281次閱讀
    本源入榜胡潤<b class='flag-5'>研究院</b>2024全球獨角獸榜單!

    Harvard FairSeg:第一個用于醫(yī)學分割的公平性數(shù)據(jù)

    為了解決這些挑戰(zhàn),我們提出了第一個大規(guī)模醫(yī)學分割領域的公平性數(shù)據(jù), Harvard-FairSeg。該數(shù)據(jù)
    的頭像 發(fā)表于 01-25 16:52 ?428次閱讀
    Harvard FairSeg:第<b class='flag-5'>一個</b>用于醫(yī)學<b class='flag-5'>分割</b>的公平性<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>

    三項SOTA!MasQCLIP:開放詞匯通用圖像分割新網(wǎng)絡

    MasQCLIP在開放詞匯實例分割、語義分割和全景分割三項任務上均實現(xiàn)SOTA,漲點非常明顯。
    的頭像 發(fā)表于 12-12 11:23 ?614次閱讀
    三項SOTA!MasQCLIP:開放<b class='flag-5'>詞匯</b>通用圖像<b class='flag-5'>分割</b>新網(wǎng)絡

    英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

    英特爾研究院將在NeurIPS 2023大會上展示系列富有價值、業(yè)界領先的AI創(chuàng)新成果。面向廣大開發(fā)者、研究人員和學界人士,這
    的頭像 發(fā)表于 12-08 19:15 ?481次閱讀

    英特爾研究院將在NeurIPS大會上展示業(yè)界領先的AI研究成果

    英特爾研究院將重點展示31項研究成果,它們將推進面向未來的AI創(chuàng)新。 ? ? ? ?英特爾研究院將在NeurIPS 2023大會上展示系列
    的頭像 發(fā)表于 12-08 09:17 ?595次閱讀

    RISC-V內核突破百億顆 RVV1.0如何解鎖端側AI市場應用潛能

    的是,在2022年出貨的RISC-V內核中,有半來自于中國市場。中國工程院士倪光南表示,開源RISC-V在中國具有超大規(guī)模的市場、豐富的應用場景和龐大的工程師群體推動下,已成為中國最受歡迎的CPU
    發(fā)表于 12-01 13:17

    新華社研究院:商湯“商量”獲評中國大模型市場未來領袖

    SenseChat ” 在定量實測的情商維度上,位居全部10款大模型第 , 并在定性評估中入選大模型市場未來領袖象限 。此外,商湯賦能電力AI平臺智能化升級的實踐,也入圍新華社研究院報告的“廠商最佳實踐案例”。 新華社
    的頭像 發(fā)表于 11-29 18:30 ?416次閱讀
    新華社<b class='flag-5'>研究院</b>:商湯“商量”獲評中國大模型市場未來領袖

    NeurlPS&apos;23開源 | 首個!開放詞匯3D實例分割!

    我們介紹開放詞匯3D實例分割的任務。當前的3D實例分割方法通常只能從訓練
    的頭像 發(fā)表于 11-14 15:53 ?454次閱讀
    NeurlPS&apos;23開源 | 首個!開放<b class='flag-5'>詞匯</b>3D<b class='flag-5'>實例</b><b class='flag-5'>分割</b>!

    寧波東方理工產(chǎn)業(yè)技術研究院將建

    東方學高等研究院稱,寧波東方理工產(chǎn)業(yè)技術研究院承擔主要關鍵通用技術的研發(fā);關鍵共性技術成果轉化公共服務平臺建設,引導基金等四大功能和任務的國家和省委重大戰(zhàn)略需求為中心,圍繞“地方所需”、“高校所能”和“人才所長”
    的頭像 發(fā)表于 10-11 11:12 ?725次閱讀

    擔心AI被濫用?Intel中國研究院院長宋繼強:四管齊下

    的如是否會被濫用而引發(fā)各種信息、隱私、安全問題? 就此,Intel中國研究院院長宋繼強先生有著深刻的見解。 Intel中國研究院直堅持“科技創(chuàng)新與中國共成長”的信念,針對中國的產(chǎn)業(yè)形態(tài)與應用需求,充分結合Intel的核心優(yōu)勢、
    的頭像 發(fā)表于 09-26 13:57 ?468次閱讀
    擔心<b class='flag-5'>AI</b>被濫用?Intel中國<b class='flag-5'>研究院</b>院長宋繼強:四管齊下