0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對于模型和數(shù)據(jù)的可視化及可解釋性的研究方法進(jìn)行回顧

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-06-21 18:09 ? 次閱讀

一年一度的CVPR在鹽湖城開幕啦!最新的消息:

今年的最佳論文,授予了來自斯坦福大學(xué)和 UC Berkeley 的 Amir R. Zamir等人的“Taskonomy: Disentangling Task Transfer Learning”。

最佳學(xué)生論文則被來自CMU的Hanbyul Joo等人憑借“Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies”摘得。

同時,也要恭喜昨天剛被我“門”蹭熱度的Kaiming大神榮獲PAMI 年輕學(xué)者獎.

除了明星獎項(xiàng)的揭曉,會議第一天最吸引人的除了workshop外就是一個個專題tutorial了:

周一的會議共開設(shè)了11個專題tutorial,我們下面就為大家介紹其中一些有趣的tutorial。

一些已經(jīng)放出來的tutorials slides下載見附件:

https://pan.baidu.com/s/1yv8orYTbsYLNnlTlCVc_Pw

機(jī)器學(xué)習(xí)的可解釋性對于研究人員來說有著十分重要的作用,它除了可以幫助我們理解模型運(yùn)行的機(jī)理外,還能幫助我們有的放矢地提高模型的表現(xiàn)甚至啟發(fā)我們開發(fā)新的模型。Tutorial:Interpretable Machine Learning for Computer Vision就為我們帶來了這方面的內(nèi)容。

這個tutorial著眼于復(fù)雜的機(jī)器學(xué)習(xí)模型在計(jì)算機(jī)視覺方面的應(yīng)用。計(jì)算機(jī)視覺在物體識別、標(biāo)注和視覺問答等方面有著廣泛的應(yīng)用,但很多時候深度學(xué)習(xí)模型和神經(jīng)網(wǎng)絡(luò)的運(yùn)作機(jī)理對我們來說還像黑箱一樣無法清晰透徹的了解。隨著近年來模型的深度加深,我們理解模型及其預(yù)測結(jié)果的過程變得日益困難。

這一tutorial將通過模型的可解釋性廣泛回顧計(jì)算機(jī)視覺的各個研究領(lǐng)域,除了介紹可解釋性的基本知識及其重要性外,還將就目前對于模型和數(shù)據(jù)的可視化及可解釋性的研究方法進(jìn)行回顧。

Tutorial包含了四個演講,分別是:

來自谷歌大腦的Been Kim帶來了“機(jī)器學(xué)習(xí)中可解釋的介紹”;

來自FAIR的Laurens van der Maaten作的“利用t分布隨機(jī)鄰近嵌入方法用于視覺模型理解的準(zhǔn)則”;

來自MIT的周博磊帶來的:“重新審視深度網(wǎng)絡(luò)中單一單位(Single Units )的重要性”;

最后是來自牛津大學(xué)的Andrea Vedaldi帶來的“利用自然原像、有意義擾動和矢量嵌入來理解深度網(wǎng)絡(luò)”。

https://interpretablevision.github.io/

除了這個tutorial之外還有一個類似的tutorial:Interpreting and Explaining Deep Models in Computer Vision。

這一tutorial就視覺領(lǐng)域的可解釋性進(jìn)行了概覽,提供了如何在實(shí)踐中使用這些技術(shù)的例子,并對不同的技術(shù)進(jìn)行了分類。其主要內(nèi)容如下:

可解釋性的定義;

理解深度表示的技術(shù)和解釋DNN中個體預(yù)測;

定量評測可解釋性的方法;

實(shí)踐中應(yīng)用可解釋性;

利用可解釋模型在復(fù)雜系統(tǒng)中得到新的見解。

另一個有趣的tutorial是:Computer Vision for Robotics and Driving,這一tutorial主要由來自谷歌大腦的Anelia Angelova和來自多倫多大學(xué)的Sanja Fidler進(jìn)行講解,主要講解了計(jì)算機(jī)視覺深度學(xué)習(xí)在機(jī)器人(以及自動駕駛)方面的發(fā)展、應(yīng)用和新的研究機(jī)會。

機(jī)器人視覺的特殊性主要在于數(shù)據(jù)和任務(wù)上,首先輸入數(shù)據(jù)是多模態(tài)(多傳感器)數(shù)據(jù),而輸出則需要三維數(shù)據(jù)(很多情況下是稀疏的)。在實(shí)際情況中,需要在實(shí)時性、啟發(fā)式理解、環(huán)境交互方面有著良好的表現(xiàn)。

這一領(lǐng)域中新的研究機(jī)會主要在以下幾個方面:

多傳感器、多輸入、數(shù)據(jù)相關(guān)性的研究;

結(jié)構(gòu)化特征的使用和學(xué)習(xí);

自監(jiān)督學(xué)習(xí);

聯(lián)合感知、規(guī)劃和行為;

主動感知技術(shù);

同時就機(jī)器人在三維空間中的學(xué)習(xí)問題和自動駕駛中的深度學(xué)習(xí)問題進(jìn)行了深入的報(bào)告。希望研究機(jī)器人或者感興趣的朋友們可以從中獲得需要的信息

除此之外,對于發(fā)展勢頭越來越旺的非監(jiān)督學(xué)習(xí)谷歌大腦和谷歌Research聯(lián)合推出了一個tutorial:Unsupervised Visual Learning。

這一tutorial從非監(jiān)督學(xué)習(xí)的各種優(yōu)點(diǎn)談起,從新的特征表示到擅長處理的特定問題,從加速學(xué)習(xí)過程到減少樣本使用量等各個方面進(jìn)行了展開。隨后利用一個報(bào)告詳細(xì)闡述了如何從視頻(時序相關(guān))和圖像(空間相關(guān))數(shù)據(jù)中學(xué)習(xí)特征表示,并在另一個報(bào)告中延伸了如何從真實(shí)世界的3D數(shù)據(jù)中進(jìn)行學(xué)習(xí),包括特征、深度的學(xué)習(xí)以及特征點(diǎn)的匹配問題。最后闡述了自監(jiān)督學(xué)習(xí)在機(jī)器人中的應(yīng)用,并用了三個例子進(jìn)行了闡述:

從深度信息中進(jìn)行在線自監(jiān)督學(xué)習(xí);

用于抓取的自監(jiān)督學(xué)習(xí)過程;

模仿學(xué)習(xí);

幾何和三維重建是計(jì)算機(jī)視覺的重要部分,今年也有多個相關(guān)的tutorial進(jìn)行了深入地探討。

首先來自印度理學(xué)院的Venu Madhav Govindu介紹了基于Motion Averaging的方法進(jìn)行大規(guī)模三維重建的方法,其tutorial系統(tǒng)的介紹了基于李群的方法,并歸納了不同的motion averaging方法,同時還對算法進(jìn)行了最佳實(shí)踐。這一tutorial旨在幫助研究人員們在新環(huán)境中使用這一方法用于大規(guī)模SFM以及三維稠密建模。

另一個tutorial則從優(yōu)化方面介紹了一種基于L無窮的最小化方法來解決一系列L2最小化所面臨的問題。這一tutorial講解了基于L-infinity的幾何視覺優(yōu)化方法,通過數(shù)學(xué)和算法概念以及應(yīng)用來深入理解如何使用這種新的優(yōu)化概念。

在感知層面,多視角視覺數(shù)據(jù)分析tutorial主要著重于常見的多視角視覺數(shù)據(jù)的分析及其主要的應(yīng)用,包括多視角聚類、分類和零樣本學(xué)習(xí),并討論了目前和未來將要面對的挑戰(zhàn)。

另一個相關(guān)的tutorial著重于超快的3D感知、重建和理解,將在22號舉辦。對于3D環(huán)境的捕捉、重建了理解使得人們需要建立高質(zhì)量的傳感器和高效的算法。研究人員們建立了一套高幀率的深度傳感器系統(tǒng),超快的幀率(~1000fps)使得幀間移動大幅減少,同時使得多傳感器的融合變得簡單?;诖搜邪l(fā)出了高效的重建、跟蹤和理解算法。Tutorial介紹了從零開發(fā)這一傳感器的來龍去脈。

對于視覺本質(zhì)的理解Tutorial:A Crash Course on Human Vision

從low,Mid,High level提供了不同層次的理解。它講解了人類的視覺系統(tǒng),并提供了認(rèn)識了理解視覺系統(tǒng)的方法,以助于前沿計(jì)算機(jī)視覺的研究。Tutorial分為兩個部分,首先從Low-level開始,講述了光的物理本質(zhì)、視網(wǎng)膜的生理構(gòu)成,以及顏色、感受野、V1過程和運(yùn)動感知;第二部分從感知深度和大小、視覺注意力和以及以及識別等方面及進(jìn)行了闡述。

最后一個關(guān)于人類行為識別的Tutorial:Human Activity Recognition。這一領(lǐng)域的研究熱點(diǎn)主要集中在一下幾個方面:

行為可靠的時空定位;

行為的端到端模型;

群體行為識別;

行為預(yù)測;

大規(guī)模數(shù)據(jù)集和卷積模型的的建立;

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28109

    瀏覽量

    205863
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5466

    瀏覽量

    120892

原文標(biāo)題:知識點(diǎn) | CVPR 2018 最佳論文揭曉,Tutorials首日速覽(附下載)

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    機(jī)器學(xué)習(xí)模型可解釋性的結(jié)果分析

    AI 一文中我們已經(jīng)了解到模型可解釋性發(fā)展的相關(guān)背景以及目前較為成熟的技術(shù)方法,本文通過一個具體實(shí)例來了解下在 MATLAB 中是如何使用這些方法的,以及在得到
    發(fā)表于 09-28 10:17 ?926次閱讀
    機(jī)器學(xué)習(xí)<b class='flag-5'>模型</b><b class='flag-5'>可解釋性</b>的結(jié)果分析

    什么是“可解釋的”? 可解釋性AI不能解釋什么

    通過建立既可解釋又準(zhǔn)確的模型來改良這種錯誤的二分法。關(guān)鍵是將神經(jīng)網(wǎng)絡(luò)與決策樹相結(jié)合,在使用神經(jīng)網(wǎng)絡(luò)進(jìn)行低級決策時保留高級的可解釋性。
    發(fā)表于 05-31 10:51 ?8457次閱讀

    【大語言模型:原理與工程實(shí)踐】核心技術(shù)綜述

    和量化: 減小模型尺寸和計(jì)算復(fù)雜度,使模型更適合在計(jì)算資源受限的環(huán)境下部署。 解釋性可視化: 提供模型決策的
    發(fā)表于 05-05 10:56

    【大規(guī)模語言模型:從理論到實(shí)踐】- 閱讀體驗(yàn)

    和抗噪聲能力;以及通過可視化工具來增強(qiáng)模型解釋性等。同時,隨著技術(shù)的不斷進(jìn)步和發(fā)展,在未來能夠發(fā)展出更加高效、健壯和可解釋的大語言模型
    發(fā)表于 06-07 14:44

    機(jī)器學(xué)習(xí)模型的“可解釋性”的概念及其重要意義

    如果考察某些類型的“事后可解釋性”(post-hoc interpretable),深度神經(jīng)網(wǎng)絡(luò)具有明顯的優(yōu)勢。深度神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)豐富的表示,這些表示能夠可視化、用語言表達(dá)或用于聚類。如果考慮對可解釋性的需求,似乎線性
    的頭像 發(fā)表于 07-24 09:58 ?2w次閱讀

    神經(jīng)網(wǎng)絡(luò)可解釋性研究的重要日益凸顯

    神經(jīng)網(wǎng)絡(luò)的可解釋性,從經(jīng)驗(yàn)主義到數(shù)學(xué)建模
    的頭像 發(fā)表于 06-27 10:54 ?5200次閱讀

    Explainable AI旨在提高機(jī)器學(xué)習(xí)模型可解釋性

    Google Cloud AI戰(zhàn)略總監(jiān)Tracy Frey在 今天的博客中解釋說,Explainable AI旨在提高機(jī)器學(xué)習(xí)模型可解釋性。她說,這項(xiàng)新服務(wù)的工作原理是量化每個數(shù)據(jù)
    的頭像 發(fā)表于 03-24 15:14 ?2914次閱讀

    機(jī)器學(xué)習(xí)模型可解釋性的介紹

    模型可解釋性方面的研究,在近兩年的科研會議上成為關(guān)注熱點(diǎn),因?yàn)榇蠹也粌H僅滿足于模型的效果,更對模型效果的原因產(chǎn)生更多的思考,這...
    的頭像 發(fā)表于 12-10 20:19 ?738次閱讀

    圖神經(jīng)網(wǎng)絡(luò)的解釋性綜述

    :https://arxiv.org/pdf/2012.15445.pdf 參考文獻(xiàn) 0.Abstract近年來,深度學(xué)習(xí)模型可解釋性研究在圖像和文本領(lǐng)域取得了顯著進(jìn)展
    的頭像 發(fā)表于 04-09 11:42 ?2657次閱讀
    圖神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>解釋性</b>綜述

    《計(jì)算機(jī)研究與發(fā)展》—機(jī)器學(xué)習(xí)的可解釋性

    機(jī)器學(xué)習(xí)的可解釋性 來源:《計(jì)算機(jī)研究與發(fā)展》,作者陳珂銳等 摘 要?近年來,機(jī)器學(xué)習(xí)發(fā)展迅速,尤其是深度學(xué)習(xí)在圖像、聲音、自然語言處理等領(lǐng)域取得卓越成效.機(jī)器學(xué)習(xí)算法的表示能力大幅度提高,但是
    發(fā)表于 01-25 08:35 ?1061次閱讀
    《計(jì)算機(jī)<b class='flag-5'>研究</b>與發(fā)展》—機(jī)器學(xué)習(xí)的<b class='flag-5'>可解釋性</b>

    關(guān)于機(jī)器學(xué)習(xí)模型的六大可解釋性技術(shù)

    本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型可解釋性的技術(shù)。
    的頭像 發(fā)表于 02-26 17:20 ?2142次閱讀
    關(guān)于機(jī)器學(xué)習(xí)<b class='flag-5'>模型</b>的六大<b class='flag-5'>可解釋性</b>技術(shù)

    機(jī)器學(xué)習(xí)模型可解釋性算法詳解

    本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型可解釋性的技術(shù),包括它們的相對優(yōu)點(diǎn)和缺點(diǎn)。
    的頭像 發(fā)表于 02-16 16:21 ?4607次閱讀
    機(jī)器學(xué)習(xí)<b class='flag-5'>模型</b>的<b class='flag-5'>可解釋性</b>算法詳解

    使用RAPIDS加速實(shí)現(xiàn)SHAP的模型可解釋性

      模型解釋性 幫助開發(fā)人員和其他利益相關(guān)者理解模型特征和決策的根本原因,從而使流程更加透明。能夠解釋模型可以幫助
    的頭像 發(fā)表于 04-21 09:25 ?2406次閱讀

    可以提高機(jī)器學(xué)習(xí)模型可解釋性技術(shù)

    本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型可解釋性的技術(shù),包括它們的相對優(yōu)點(diǎn)和缺點(diǎn)。
    的頭像 發(fā)表于 02-08 14:08 ?1167次閱讀

    文獻(xiàn)綜述:確保人工智能可解釋性和可信度的來源記錄

    本文對數(shù)據(jù)起源、可解釋AI(XAI)和可信賴AI(TAI)進(jìn)行系統(tǒng)的文獻(xiàn)綜述,以解釋基本概念,說明數(shù)據(jù)起源文件可以用來提升基于人工智能系統(tǒng)實(shí)
    的頭像 發(fā)表于 04-28 15:55 ?1294次閱讀
    文獻(xiàn)綜述:確保人工智能<b class='flag-5'>可解釋性</b>和可信度的來源記錄