當(dāng)?shù)貢r(shí)間6月16日,全球計(jì)算機(jī)視覺(jué)頂會(huì) CVPR 2019 在美國(guó)長(zhǎng)灘拉開(kāi)帷幕,超過(guò)9200位相關(guān)人士共赴盛會(huì),推進(jìn)計(jì)算機(jī)視覺(jué)技術(shù)的交流與落地。曠視通過(guò) Oral、Poster、Workshop、Demo、Booth 等形式,同世界分享在計(jì)算機(jī)視覺(jué)理論與應(yīng)用領(lǐng)域的最新進(jìn)展。值得一提的是,在 CVPR 2019 的3項(xiàng)挑戰(zhàn)賽中,曠視最終擊敗 Facebook、通用動(dòng)力、戴姆勒等國(guó)內(nèi)外一線科技巨頭/知名高校,共計(jì)斬獲6項(xiàng)世界冠軍!
持續(xù)創(chuàng)新
Brain++拓展AI認(rèn)知邊界
做人工智能不能閉門(mén)造車(chē)。作為以算法為基因的公司,曠視自誕生之日起便一直積極參與計(jì)算機(jī)視覺(jué)在全球范圍內(nèi)的學(xué)術(shù)交流,一方面是為了與世界分享自己的研究成果,另一方面也是為了吸取全球的智慧,研發(fā)最好的技術(shù)來(lái)助力世界發(fā)展,創(chuàng)造社會(huì)價(jià)值。
展會(huì)現(xiàn)場(chǎng)
此行,曠視共參加 CVPR 2019 WAD(Workshop on Autonomous Driving
)、CVPR 2019 FGVC(Workshop on Fine-Grained Visual Categorization
)、CVPR 2019 NTIRE(New Trends in Image Restoration and Enhancement workshop)3項(xiàng)挑戰(zhàn)賽,拿下6項(xiàng)冠軍,涵蓋自動(dòng)駕駛、新零售、智能手機(jī)、3D 等眾多領(lǐng)域,其背后起支撐作用的是曠視深度學(xué)習(xí)框架 Brain++。這是一套由曠視研究院自主原創(chuàng)的算法引擎,致力于從云、端、芯三個(gè)方面全面賦能物理世界,以實(shí)現(xiàn)對(duì)世界的感知、控制、優(yōu)化。Brain++ 不僅助力曠視拿下世界冠軍,還將推動(dòng)智能汽車(chē)、商品識(shí)別、手機(jī)影像處理、智慧農(nóng)業(yè)等應(yīng)用領(lǐng)域的進(jìn)步發(fā)展。
曠視斬獲 CVPR 2019 挑戰(zhàn)賽6項(xiàng)世界冠軍
大會(huì)現(xiàn)場(chǎng),挑戰(zhàn)賽主辦方宣布比賽成績(jī),并向冠軍隊(duì)伍頒發(fā)獲獎(jiǎng)證書(shū);隨后,曠視相關(guān)的參賽人員通過(guò)一張張 Slides、一場(chǎng)場(chǎng) Talks、一張張 Posters 向與會(huì)人員分享了奪冠背后的技術(shù)方法,以及冠軍之路上滿滿的收獲。
今年是曠視自成立以來(lái)連續(xù)第5年參加 CVPR,在談到參加這種頂級(jí)學(xué)術(shù)會(huì)議對(duì)公司戰(zhàn)略意義的時(shí)候,曠視首席科學(xué)家、曠視研究院院長(zhǎng)孫劍表示:
“一流的人才往往希望在一個(gè)開(kāi)放的環(huán)境中成長(zhǎng)。發(fā)表論文、參加學(xué)術(shù)會(huì)議,其實(shí)是有人對(duì)你的工作鼓掌,激勵(lì)你繼續(xù)前行。
曠視研究院最寶貴的財(cái)產(chǎn)是人才。如何吸引、培養(yǎng)、保留人才是一個(gè)組織健康和高速發(fā)展最關(guān)鍵的。
我的工作第一優(yōu)先級(jí)是打造一個(gè)好的研發(fā)環(huán)境,讓公司贏,讓我們贏,讓每個(gè)人贏。因?yàn)槲沂冀K相信兩點(diǎn):中國(guó)不缺乏聰明人,中國(guó)有世界上最好的發(fā)展機(jī)會(huì)。我們就是要把一幫聰明人聚起來(lái),齊心協(xié)力,貫徹‘發(fā)展就是硬道理’?!?/p>
冠軍之路,滿是收獲
CVPR 2019 WAD nuScenes 3D Detection Challenge
nuScenes 3D Detection Challenge冠軍獎(jiǎng)牌
CVPR 2019 WAD 是自動(dòng)駕駛領(lǐng)域的權(quán)威比賽,其中 nuScenes 比賽方向是 3D detection,旨在通過(guò)模型分析 3D 激光雷達(dá)/相機(jī)數(shù)據(jù),賦予自動(dòng)駕駛汽車(chē)偵測(cè)物體的能力,保障行駛安全。
nuScenes 不僅需要同時(shí)識(shí)別10類(lèi)物體(相比 KITTI 只需預(yù)測(cè)單個(gè)類(lèi)別),還加入了速度和屬性的預(yù)測(cè),而且需要解決嚴(yán)重的類(lèi)別不均衡問(wèn)題,因此任務(wù)難度大幅提高,因而也更具有實(shí)際意義。
比賽中,曠視設(shè)計(jì)了一個(gè)多尺度、多任務(wù)的模型,借助新型檢測(cè)網(wǎng)絡(luò),結(jié)合均衡采樣等策略,極大提高了模型的檢測(cè)精度,尤其是在小物體上。由最終結(jié)果可知,相較于官方 Baseline 45.3%, 曠視的模型高出18個(gè)點(diǎn),達(dá)到63.3%,比第二名也高出8.8個(gè)點(diǎn), 擊敗一系列頂尖團(tuán)隊(duì),一舉奪魁。
CVPR 2019 WAD Detection/Tracking Domain Adaptation Challenge
Detection Domain Adaptation Challenge冠軍獎(jiǎng)牌
Detection Domain Adaptation Challenge 是 CVPR 2019 WAD 的另一項(xiàng)挑戰(zhàn)賽,旨在對(duì)自動(dòng)駕駛場(chǎng)景下的環(huán)境(二維圖像信息)進(jìn)行感知,今年的比賽主要解決領(lǐng)域自適應(yīng)問(wèn)題,即美國(guó)道路場(chǎng)景和中國(guó)道路場(chǎng)景的相互適應(yīng)。
具體而言,即利用7萬(wàn)張美國(guó)道路場(chǎng)景數(shù)據(jù)進(jìn)行訓(xùn)練,對(duì)近15萬(wàn)張中國(guó)道路場(chǎng)景進(jìn)行測(cè)試,不允許使用任何標(biāo)注測(cè)試數(shù)據(jù),只允許使用 ImageNet 進(jìn)行預(yù)訓(xùn)練。圖像本身的不一致之外,不同天氣、不同道路以及復(fù)雜的交通狀況都給任務(wù)增加了額外挑戰(zhàn),同時(shí)也為實(shí)際使用提供了可能性。
曠視基于自身積累的檢測(cè)算法之外,加之復(fù)現(xiàn)/使用的最前沿的檢測(cè)算法(比如 NAS-FPN、Cascade RCNN),進(jìn)而對(duì) Cascade RCNN 做出一系列改進(jìn),使得網(wǎng)絡(luò)在不同 IOU 閾值下的檢測(cè)結(jié)果都有一定漲幅;同時(shí),為了解決兩個(gè)數(shù)據(jù)集之間數(shù)據(jù)分布不一致的問(wèn)題,曠視還利用合并訓(xùn)練、AdaBN、Data Distillation 等技術(shù)手段,最終在測(cè)試集上高出第二名深蘭科技1.7個(gè)點(diǎn),同時(shí)在所有單類(lèi)別上取得最高結(jié)果。
另外,在 Tracking Domain Adaptation Challenge 上,曠視使用 Online 方法進(jìn)行多目標(biāo)跟蹤,即在高精度檢測(cè)結(jié)果的基礎(chǔ)上,使用 IOU Tracker 進(jìn)行跟蹤;跟蹤過(guò)程中,改進(jìn)和調(diào)試影響結(jié)果的多種因素,最終也在 Tracking 任務(wù)上取得第一。
CVPR 2019 FGVC iNaturalistHerbarium Challenge
FGVC 頒獎(jiǎng)現(xiàn)場(chǎng)
CVPR 2019 FGVC 是細(xì)粒度識(shí)別領(lǐng)域最權(quán)威的賽事,iNaturalist Challenge 是此項(xiàng)領(lǐng)域的旗艦比賽,旨在讓計(jì)算機(jī)自動(dòng)識(shí)別物體的精細(xì)類(lèi)別,它不僅要求識(shí)別1000多個(gè)品種的動(dòng)、植物,還要識(shí)別其在不同發(fā)育期的狀態(tài);Herbarium Challenge 則要解決開(kāi)花植物野牡丹科的物種分類(lèi)問(wèn)題,所采用的圖像集僅包括保存于臘葉標(biāo)本上的干標(biāo)本圖像。
除了大模型/大分辨率圖圖像進(jìn)行訓(xùn)練、測(cè)試等常規(guī)操作外,曠視還集成最前沿細(xì)粒度技術(shù)成果(比如 Coarse-to-fine hierarchical classification、iSQRT、Class-Balanced Focal Loss 等),同時(shí)創(chuàng)造性提出“后驗(yàn)概率重校準(zhǔn)”技術(shù),即通過(guò)先驗(yàn)知識(shí)對(duì)模型輸出的后驗(yàn)概率進(jìn)行校準(zhǔn),極大提高擁有較少訓(xùn)練圖像的長(zhǎng)尾類(lèi)別的識(shí)別準(zhǔn)確率,兩項(xiàng)比賽結(jié)果均高出第2名近1個(gè)點(diǎn),一舉奪魁。
在業(yè)務(wù)方面,商品識(shí)別、菜品識(shí)別、缺陷檢測(cè)、生產(chǎn)線零件識(shí)別、車(chē)型/車(chē)輛識(shí)別等均是細(xì)粒度圖像分析技術(shù)的應(yīng)用,目前已應(yīng)用于產(chǎn)品研發(fā)中。
在 iNaturalist 上,曠視擊敗了通用動(dòng)力等頂尖團(tuán)隊(duì);在 Herbarium 上,曠視擊敗了大連理工(上年冠軍)、瑞典自然歷史博物館、Facebook。
CVPR 2019 NTIRE Real Image Denosing Challenge
Real Image Denosing Challenge 冠軍獎(jiǎng)牌
CVPR 2019 NTIRE Real Image Denosing Challenge 基于新近的智能手機(jī)圖像降噪數(shù)據(jù)集 SIDD,它由很多真實(shí)的噪聲圖像及其相應(yīng)的 ground truth 組成,且每幅圖像都有以原始傳感器數(shù)據(jù)(raw)和標(biāo)準(zhǔn) RBG(sRGB)格式存儲(chǔ)的兩個(gè)版本。
圖像降噪一直是曠視研究院“手機(jī)攝影超畫(huà)質(zhì)”的技術(shù)儲(chǔ)備項(xiàng)目,自第一版原型誕生以后不斷迭代;其中,針對(duì)原始傳感器數(shù)據(jù)(raw)的圖像降噪更是整個(gè)項(xiàng)目的基礎(chǔ)技術(shù)。
這次比賽中,曠視研究院提出針對(duì) raw 圖像的基于 U-Net 框架的“拜爾陣列歸一化與保列增廣”方法。盡管不同輸入圖像間的數(shù)據(jù)格式存在差異,但是,為保持網(wǎng)絡(luò)輸入一致性,曠視精心設(shè)計(jì)了一種數(shù)據(jù)預(yù)處理方法,使得相同的網(wǎng)絡(luò)工作應(yīng)用到具有不同拜耳模式的輸入上,從而在保證性能的前提下用更大的圖像集合訓(xùn)練網(wǎng)絡(luò)。
本次冠軍算法已成功落地于 OPPO Reno 10 倍變焦版。OPPO Reno 10 倍變焦版搭載了基于曠視超畫(huà)質(zhì)技術(shù)研發(fā)的“超清夜景2.0”功能,能夠?yàn)橛脩?hù)提供非同凡響的夜拍體驗(yàn)。這也是曠視超畫(huà)質(zhì)技術(shù)首次運(yùn)用在大規(guī)模量產(chǎn)機(jī)型上。
價(jià)值創(chuàng)造驅(qū)動(dòng)技術(shù)創(chuàng)新
做真正WORK的科研
人工智能自誕生之日起便已宣稱(chēng)了其改變世界的雄心。當(dāng)圖靈于1950年在論文《Computing Machinery and Intelligence》尾頁(yè)畫(huà)上句號(hào)的剎那,一個(gè)前所未有的屬于人類(lèi)的智能時(shí)代就此拉開(kāi)序幕。
從 Marvin Minsky 于1966年對(duì)機(jī)器人模仿人類(lèi)抓取物品的研究,到神經(jīng)心理學(xué)家 David Marr 于80年代初創(chuàng)建的關(guān)于計(jì)算機(jī)視覺(jué)研究的理論框架;從手工特征設(shè)計(jì)到受生物視覺(jué)神經(jīng)網(wǎng)絡(luò)為啟發(fā)而誕生的卷積網(wǎng)絡(luò)(CNN),人類(lèi)將機(jī)器智能從小說(shuō)幻想帶進(jìn)了現(xiàn)實(shí),為世界裝上了明眸。
人工智能,其本質(zhì)是造福人類(lèi),便利生活,所以能否為世界帶來(lái)足夠的價(jià)值是曠視關(guān)注的核心。通過(guò)深挖社會(huì)痛點(diǎn),找出致病原因,曠視一直在尋找著讓世界更美好的方法。
曠視成立早期便上線了自主原創(chuàng)的深度學(xué)習(xí)框架——Brain++。作為企業(yè)級(jí)的人工智能算法制造工廠,Brain++ 從底層有力支撐著曠視研究院整體的研究生產(chǎn)工作與曠視核心產(chǎn)品的工程化建設(shè)。這次6冠的勝利,即是上述算法和底層系統(tǒng)優(yōu)越性的再次證明。
憑借強(qiáng)大的軟硬件結(jié)合能力,曠視目前已在「?jìng)€(gè)人設(shè)備大腦」、「城市大腦」和「供應(yīng)鏈大腦」三個(gè)核心 AIoT 場(chǎng)景深度布局。在與行業(yè)龍頭力量的聯(lián)合下,曠視正在推進(jìn)尖端技術(shù)方案的強(qiáng)垂直落地,為整個(gè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整及商業(yè)變革激活引擎,積聚力量;與生態(tài)伙伴一起服務(wù)于數(shù)字化建設(shè),用軟硬結(jié)合的解決方案為客戶(hù)提供閉環(huán)的商業(yè)價(jià)值,成為行業(yè)智能物聯(lián)方案專(zhuān)家。
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5422瀏覽量
120592 -
曠視科技
+關(guān)注
關(guān)注
1文章
153瀏覽量
10994
原文標(biāo)題:CVPR 2019 | 曠視斬獲6冠,彰顯深度學(xué)習(xí)算法引擎優(yōu)勢(shì)
文章出處:【微信號(hào):megvii,微信公眾號(hào):曠視MEGVII】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論