0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

總覽人工智能技術圖譜,計算機視覺VS機器視覺

mK5P_AItists ? 來源:未知 ? 作者:李倩 ? 2018-08-16 18:14 ? 次閱讀

人工智能的發(fā)展離不開基礎支持層和技術層,基礎支持層包括大數(shù)據(jù)、計算力和算法;技術層包括計算機視覺、語音識別和自然語言處理。人工智能的技術本質是什么,本文會詳細分析。

總覽人工智能技術圖譜

基礎支撐層的算法創(chuàng)新發(fā)生在20世紀80年代末,是大數(shù)據(jù)和計算力將人工智能推到鎂光燈之下,而建立在這之上的基礎技術便是計算機視覺、語音識別和自然語言理解,機器試圖看懂、聽懂人類的世界、用人類的語言和人類交流,研究人類智能活動的規(guī)律。

1.計算機視覺技術(Computer Vision)

1)·什么是計算機視覺

“人的大腦皮層的活動, 大約70%是在處理視覺相關信息。視覺就相當于人腦的大門,其它如聽覺、觸覺、味覺那都是帶寬較窄的通道。視覺相當于八車道的高速, 其它感覺是兩旁的人行道。如果不能處理視覺信息的話,整個人工智能系統(tǒng)是個空架子,只能做符號推理,比如下棋、定理證明, 沒法進入現(xiàn)實世界。計算機視覺之于人工智能,它相當于說芝麻開門。大門就在這里面,這個門打不開, 就沒法研究真實世界的人工智能。”——朱松純,加州大學洛杉磯分校UCLA統(tǒng)計學和計算機科學教授根據(jù)科普中國撰寫的對計算機視覺的定義,這是一門研究如何讓機器“看”的科學,更進一步的說,是指用計算機代替人眼對目標進行識別、跟蹤和測量的機器視覺,并進一步做圖形處理,使計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。

2)·計算機視覺 VS 機器視覺

計算機視覺更關注圖像信號本身以及圖像相關交叉領域(地圖、醫(yī)療影像)的研究;機器視覺則偏重計算機視覺技術工程化,更關注廣義上的圖像信號(激光和攝像頭)和自動化控制(生產(chǎn)線)方面的應用。

3)計算機視覺識別技術的分類

物體識別分為“1 VS N”對不同物體進行歸類,以及“1 VS 1”對同類型的物體進行區(qū)分和鑒別;物體屬性識別,結合地圖模型讓物體在視覺的三維空間里得到記憶的重建,進而進行場景的分析和判斷;物體行為識別分為3個進階的步驟,移動識別判斷物體是否做了位移,動作識別判斷物體做的是什么動作,行為識別是結合視覺主體和場景的交互做出行為的分析和判斷。

4)·計算機視覺的識別流程

計算機視覺識別流程分為兩條路線:訓練模型和識別圖像。

訓練模型:樣本數(shù)據(jù)包括正樣本(包含待檢目標的樣本)和負樣本(不包含目標的樣本),視覺系統(tǒng)利用算法對原始樣本進行特征的選擇和提取訓練出分類器(模型);此外因為樣本數(shù)據(jù)成千上萬、提取出來的特征更是翻番,所以一般為了縮短訓練的過程,會人為加入知識庫(提前告訴計算機一些規(guī)則),或者引入限制條件來縮小搜索空間。

識別圖像:會先對圖像進行信號變換、降噪等預處理,再來利用分類器對輸入圖像進行目標檢測。一般檢測過程為用一個掃描子窗口在待檢測的圖像中不斷的移位滑動,子窗口每到一個位置就會計算出該區(qū)域的特征,然后用訓練好的分類器對該特征進行篩選,判斷該區(qū)域是否為目標。

5 )計算機視覺技術模式圖和對應企業(yè)圖

目前世界上圖像識別最大的數(shù)據(jù)庫,是斯坦福大學人工智能實驗室提供的ImageNet,針對諸如醫(yī)療等細分領域也需要收集相應的訓練數(shù)據(jù);Google、Microsoft此類科技巨頭會面向市場提供開源算法框架,為初創(chuàng)視覺識別公司提供初級算法。

2.語音識別(Automatic Speech Recognition)

1)什么是語音識別

語音識別是以語音為研究對象,通過信號處理和識別技術讓機器自動識別和理解人類口述的語言后,將語音信號轉換為相應的文本或命令的一門技術。由語音識別和語音合成、自然語言理解、語義網(wǎng)絡等技術相結合的語音交互正在逐步成為當前多通道、多媒體智能人機交互的主要方式。

2)語音識別的流程

語音識別流程分為訓練和識別兩條線路。

語音信號經(jīng)過前端信號處理、端點檢測等預處理后,逐幀提取語音特征,傳統(tǒng)的特征類型包括有MFCC、PLP、FBANK等特征,提取好的特征會送到解碼器,在訓練好的聲學模型、語言模型之下,找到最為匹配的此序列作為識別結果輸出。

3)語音識別技術模式圖和對應企業(yè)圖

基礎層:包含大數(shù)據(jù)、計算力和算法三塊,其中大數(shù)據(jù)等接入的是相應領域的第三方服務商。機器在識別人類的語音指令后接入、提供相應的服務。諸如影視、電影票、餐飲等;

技術層:以科大訊飛為首的語音技術提供商;

應用層:傳統(tǒng)家居環(huán)境中的電視、音箱廠商都給加上了語音識別功能,新增交互方式;還有智能車載采用語音交互讓手不離開方向盤提高安全系數(shù);還有搜索廠商基于搜索做出來的語音助手等。

3.自然語言理解(Natural Language Understanding)

1)什么是自然語言理解

自然語言理解即文本理解,和語音圖像的模式識別技術有著本質的區(qū)別,語言作為知識的載體,承載了復雜的信息量,具有高度的抽象性,對語言的理解屬于認知層面,不能僅靠模式匹配的方式完成。

2)自然語言理解的應用:搜索引擎+機器翻譯;

自然語言理解最典型兩種應用為搜索引擎和機器翻譯。搜索引擎可以在一定程度上理解人類的自然語言,從自然語言中抽取出關鍵內容并用于檢索,最終達到搜索引擎和自然語言用戶之間的良好銜接,可以在兩者之間建立起更高效,更深層的信息傳遞。

3)自然語言理解技術在搜索引擎中的應用

4)自然語言理解技術在機器翻譯中的應用

事實上搜索引擎和機器翻譯不分家,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)為其充實了語料庫使得其發(fā)展模態(tài)發(fā)生了質的改變。互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)除了將原先線下的信息(原有語料)進行在線化之外,還衍生出來的新型UGC模式:知識分享數(shù)據(jù),像維基百科、百度百科等都是人為校準過的詞條,噪聲小;社交數(shù)據(jù),像微博和微信等展現(xiàn)用戶的個性化、主觀化、時效性,可以用來做個性化推薦、情感傾向分析、以及熱點輿情的檢測和跟蹤等;社區(qū)、論壇數(shù)據(jù),像果殼、知乎等為搜索引擎提供了問答知識、問答資源等數(shù)據(jù)源。另一方面,因為深度學習采用的層次結構從大規(guī)模數(shù)據(jù)中自發(fā)學習的黑盒子模式是不可解釋的,而以語言為媒介的人與人之間的溝通應該要建立在相互理解的基礎上,所以深度學習在搜索引擎和機器翻譯上的效用沒有語音圖像識別領域來得顯著。

一圖看懂新一代

人工智能知識體系大全

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關注

    關注

    161

    文章

    4266

    瀏覽量

    119540
  • 人工智能
    +關注

    關注

    1787

    文章

    46060

    瀏覽量

    234959
  • 計算機視覺
    +關注

    關注

    8

    文章

    1685

    瀏覽量

    45811

原文標題:一圖看懂新一代人工智能知識體系大全

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器視覺計算機視覺的關系簡述

    計算機視覺是一門獨立的學科,有著30年左右的歷史,集圖像處理、模式識別、人工智能技術為一體,著重服務于一幅或多幅圖像的計算機分析。機器
    發(fā)表于 05-13 14:57

    人工智能技術—AI

      人工智能技術的概念從出來到現(xiàn)在已經(jīng)有很多年的歷史了,其實所謂的人工智能技術本身就是一種模擬人類大腦的思考方式的一種技術,它的英文簡稱是AI技術,在西方國家,
    發(fā)表于 10-21 12:03

    機器“看見”—計算機視覺入門及實戰(zhàn) 第二期基礎技術

    `點擊報名直播觀看:http://t.elecfans.com/live/556.html專家簡介:鄧亞峰現(xiàn)任格靈深瞳信息技術有限公司首席技術官,畢業(yè)于清華大學,具有16年的計算機視覺
    發(fā)表于 09-04 17:56

    中國人工智能的現(xiàn)狀與未來

    機器學習,計算機視覺等等,總的說來,人工智能研究的一個主要目標是使機器能夠勝任通常需要人類智能
    發(fā)表于 07-27 06:40

    什么是人工智能機器學習、深度學習和自然語言處理?

    垂直領域得到廣泛應用。根據(jù)2020年的一項估計,37% 的組織已經(jīng)在使用這種或那種形式的人工智能。大多數(shù)人工智能的應用是特定的技術,如計算機視覺
    發(fā)表于 03-22 11:19

    【開源硬件系列04期】AI人工智能技術帶給EDA的機遇和挑戰(zhàn)(文中含回放+課件)

    直播回放: https://t.elecfans.com/live/2270.html直播課件:*附件:林亦波教授——AI4EDA_YiboLin.pdf直播簡介:人工智能(AI)在計算機視覺、語音
    發(fā)表于 01-17 16:56

    計算機視覺智能家居

    人工智能對于智能家居的技術支持目前還是處于初級階段,隨著人工智能技術的成熟發(fā)展,人工智能視覺
    發(fā)表于 07-22 16:45 ?1551次閱讀

    人工智能計算機視覺及網(wǎng)絡領域中的應用

    人工智能計算機視覺及網(wǎng)絡領域中的應用 文/張大巍 摘要 這些年人工智能技術已經(jīng)全面深入到人們日常生活中去,為人們日常生活提供了各種便利條件。計算機
    的頭像 發(fā)表于 07-27 11:02 ?2868次閱讀

    計算機視覺識別是如何工作的?

    計算機視覺識別是一種人工智能技術,旨在使計算機系統(tǒng)從數(shù)字圖像、視頻等視覺信息中識別和提取有意義信息的能力。
    的頭像 發(fā)表于 02-09 13:41 ?3248次閱讀

    機器視覺計算機視覺的區(qū)別

    機器視覺計算機視覺的區(qū)別 機器視覺計算機
    的頭像 發(fā)表于 08-09 16:51 ?1753次閱讀

    機器視覺人工智能的關系

    機器視覺人工智能的關系 機器視覺人工智能的關系 隨著精密儀器的發(fā)展和
    的頭像 發(fā)表于 08-09 16:59 ?1045次閱讀

    人工智能計算機視覺方向是什么

    人工智能計算機視覺方向是什么 人工智能計算機視覺方向是指利用
    的頭像 發(fā)表于 08-15 16:06 ?1480次閱讀

    計算機視覺屬于人工智能

    屬于,計算機視覺人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有
    的頭像 發(fā)表于 07-09 09:11 ?544次閱讀

    計算機視覺人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。
    的頭像 發(fā)表于 07-09 09:25 ?306次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺
    的頭像 發(fā)表于 07-16 10:23 ?280次閱讀