0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

盤點2018年計算機視覺領域技術突破

張康康 ? 2019-07-29 18:27 ? 次閱讀

回顧2018年,是屬于人工智能的一年,不論是Google、Facebook、Intel、阿里巴巴等通過產業(yè)布局進入人工智能領域的互聯網企業(yè),亦或如曠視科技Face++、極鏈科技Video++、優(yōu)必選科技這樣直接以人工智能起家的原生技術企業(yè),都將AI注入到每個角落,掀起了一輪又一輪的技術高潮。

因而,除了NLP研究突破接連不斷,CV領域同樣精彩紛呈,伴隨著各式各樣落地應用如此接近人們的生活,技術也變得越發(fā)成熟。本文整理了在2018年,在CV技術領域取得的最主要的一些重大技術突破。


BigGAN發(fā)布

Ian Goodfellow在2014年設計了GAN,在之后的幾年中,圍繞這個概念產生了多種多樣的應用程序。

其中,在ICLR 2019論文中出現的BigGAN,同樣是一個GAN,只不過更強大,是擁有了更聰明的課程學習技巧的GAN,由它訓練生成的圖像連它自己都分辨不出真假,因為除非拿顯微鏡看,否則將無法判斷該圖像是否有任何問題,因而,它更被譽為史上最強的圖像生成器。


在計算機圖像研究史上,BigGAN帶來的突破是劃時代的,比如在ImageNet上進行128×128分辨率的訓練后,它的IS得分能達到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小圖之外,BigGAN還能直接在256×256、512×512的ImageNet數據上訓練,生成更讓人信服的樣本。

英偉達Video-to-Video Synthesis

英偉達在2018年的收獲頗豐,他們的研究焦點從標準的監(jiān)督學習轉向更具挑戰(zhàn)性的機器學習,如半監(jiān)督學習,領域適應,主動學習和生成模型等。其中,由英偉達在2018年末發(fā)布的最大成果之一便是視頻到視頻生成(Video-to-Video synthesis),它通過精心設計的發(fā)生器、鑒別器網絡以及時空對抗物鏡,合成高分辨率、照片級真實、時間一致的視頻,實現了讓AI更具物理意識,更強大,并能夠推廣到新的和看不見的更多場景。


因而,Video-to-Video Synthesis也被看作是在過去幾年中,視頻領域的一次重大突破,畢竟從靜態(tài)框架轉換為動態(tài)框架的難度是很大的,但機器訓練卻在盡量模擬預測視頻將會發(fā)生的情景,通過給定的輸入視頻學習映射函數,產生仿真度極高的視頻內容。

Fast.ai18分鐘訓練ImageNet

在普遍認知還停留在需要大量計算資源來執(zhí)行適當的深度學習任務時,Fast.ai通過使用16個公共AWS云實例,每個配備8個NVIDIA V100 GPU,運行fast.ai和PyTorch,用18分鐘在ImageNet上將圖像分類模型訓練到了93%的準確率,刷新了一個新的速度記錄。


這是一個令人驚喜的結果,尤其在公共基礎設施上訓練ImageNet能達到這種準確性,并且比其專有TPU Pod群集上的谷歌DAWNBench記錄快40%,運行成本僅約為40美元。這意味著一個關鍵的里程碑出現了,幾乎所有人都可以在一個相當大的數據集上訓練大規(guī)模神經網絡。

除了這些重要的節(jié)點之外,2018年的計算機視覺技術也部署更多方面,不論是亞馬遜發(fā)布Rekognition將計算機視覺置于開發(fā)人員、微軟為OneDrive和SharePoint推出了新的AI服務、Google相冊讓我們的記憶變得可搜索、還是每個場景下都正在逐漸普及的AI人臉識別等等,計算機視覺正在逐步滲透到我們生活的每個部分。

最后,最值得注意的是,計算機視覺的市場增長幾乎與其技術能力的增長是一樣快的,預計到 2025年,計算機視覺領域會帶來超過262億美元的收益,因而在人工智能的未來里,計算機視覺一定是最有力的表現形式,并將隨處可見。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266232
  • 計算機視覺
    +關注

    關注

    8

    文章

    1685

    瀏覽量

    45811
收藏 人收藏

    評論

    相關推薦

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發(fā)展不僅推動了多個行業(yè)的變革,也
    的頭像 發(fā)表于 08-14 09:49 ?288次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現這一目標,
    的頭像 發(fā)表于 07-24 12:46 ?355次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?287次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之一,其技術涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機
    的頭像 發(fā)表于 07-10 18:26 ?902次閱讀

    計算機視覺的工作原理和應用

    圖像和視頻中提取有用信息,進而進行決策和行動。自1960代第一批學術論文問世以來,計算機視覺技術已經取得了長足的發(fā)展,并在多個領域展現出巨
    的頭像 發(fā)表于 07-10 18:24 ?1071次閱讀

    計算機視覺與智能感知是干嘛的

    感知(Intelligent Perception)則是計算機視覺的一個分支,它強調計算機在處理視覺信息時的智能性和自適應性。 隨著計算機技術
    的頭像 發(fā)表于 07-09 09:23 ?351次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    ,旨在實現對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工業(yè)自動化領域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?289次閱讀

    計算機視覺在人工智能領域有哪些主要應用?

    計算機視覺是人工智能領域的一個重要分支,它主要研究如何讓計算機能夠像人類一樣理解和處理圖像和視頻數據。計算機
    的頭像 發(fā)表于 07-09 09:14 ?348次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有
    的頭像 發(fā)表于 07-09 09:11 ?561次閱讀

    深度學習在計算機視覺領域的應用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其中的核心技術之一,已經在計算機視覺領域取得了顯著的成果。計算機
    的頭像 發(fā)表于 07-01 11:38 ?433次閱讀

    機器視覺計算機視覺的區(qū)別

    在人工智能和自動化技術的快速發(fā)展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩個重要的分支
    的頭像 發(fā)表于 06-06 17:24 ?826次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等
    的頭像 發(fā)表于 06-06 17:17 ?521次閱讀

    計算機視覺的十大算法

    視覺技術的發(fā)展起到了重要的推動作用。一、圖像分割算法圖像分割算法是計算機視覺領域的基礎算法之一,它的主要任務是將圖像分割成不同的區(qū)域或對象。
    的頭像 發(fā)表于 02-19 13:26 ?1046次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    什么是計算機視覺?計算機視覺的三種方法

    計算機視覺是指通過為計算機賦予人類視覺這一技術目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 11-16 16:38 ?4164次閱讀
    什么是<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>?<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的三種方法

    最適合AI應用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺這一技術目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 11-15 16:38 ?346次閱讀
    最適合AI應用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?