從語音識別到智能家居,從人機大戰(zhàn)到無人駕駛,人工智能的“演化”給我們社會上的一些生活細節(jié),帶來了一次又一次的驚喜,未來更多智能產(chǎn)品依托的人工智能技術(shù)會發(fā)展成什么樣呢?讓我們來看看2018人工智能標準化白皮書里面,對人工智能關(guān)鍵技術(shù)的定義。
人工智能技術(shù)關(guān)系到人工智能產(chǎn)品是否可以順利應用到我們的生活場景中。在人工智能領域,它普遍包含了機器學習、知識圖譜、自然語言處理、人機交互、計算機視覺、生物特征識別、AR/VR七個關(guān)鍵技術(shù)。
一、機器學習
機器學習(Machine Learning)是一門涉及統(tǒng)計學、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡、優(yōu)化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能,是人工智能技術(shù)的核心。基于數(shù)據(jù)的機器學習是現(xiàn)代智能技術(shù)中的重要方法之一,研究從觀測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用這些規(guī)律對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進行預測。根據(jù)學習模式、學習方法以及算法的不同,機器學習存在不同的分類方法。
根據(jù)學習模式將機器學習分類為監(jiān)督學習、無監(jiān)督學習和強化學習等。
根據(jù)學習方法可以將機器學習分為傳統(tǒng)機器學習和深度學習。
二、知識圖譜
知識圖譜本質(zhì)上是結(jié)構(gòu)化的語義知識庫,是一種由節(jié)點和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號形式描述物理世界中的概念及其相互關(guān)系,其基本組成單位是“實體—關(guān)系—實體”三元組,以及實體及其相關(guān)“屬性—值”對。不同實體之間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識結(jié)構(gòu)。在知識圖譜中,每個節(jié)點表示現(xiàn)實世界的“實體”,每條邊為實體與實體之間的“關(guān)系”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡,提供了從“關(guān)系”的角度去分析問題的能力。
知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜索引擎、可視化展示和精準營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但是,知識圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應用的不斷深入,還有一系列關(guān)鍵技術(shù)需要突破。
三、自然語言處理
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向,研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及的領域較多,主要包括機器翻譯、機器閱讀理解和問答系統(tǒng)等。
機器翻譯
機器翻譯技術(shù)是指利用計算機技術(shù)實現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程?;诮y(tǒng)計的機器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的局限性,翻譯性能取得巨大提升?;谏疃壬窠?jīng)網(wǎng)絡的機器翻譯在日??谡Z等一些場景的成功應用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯推理能力的發(fā)展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領域取得更大進展。
語義理解
語義理解技術(shù)是指利用計算機技術(shù)實現(xiàn)對文本篇章的理解,并且回答與篇章相關(guān)問題的過程。語義理解更注重于對上下文的理解以及對答案精準程度的把控。隨著 MCTest 數(shù)據(jù)集的發(fā)布,語義理解受到更多關(guān)注,取得了快速發(fā)展,相關(guān)數(shù)據(jù)集和對應的神經(jīng)網(wǎng)絡模型層出不窮。語義理解技術(shù)將在智能客服、產(chǎn)品自動問答等相關(guān)領域發(fā)揮重要作用,進一步提高問答與對話系統(tǒng)的精度。
問答系統(tǒng)
問答系統(tǒng)分為開放領域的對話系統(tǒng)和特定領域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計算機像人類一樣用自然語言與人交流的技術(shù)。人們可以向問答系統(tǒng)提交用自然語言表達的問題,系統(tǒng)會返回關(guān)聯(lián)性較高的答案。盡管問答系統(tǒng)目前已經(jīng)有了不少應用產(chǎn)品出現(xiàn),但大多是在實際信息服務系統(tǒng)和智能手機助手等領域中的應用,在問答系統(tǒng)魯棒性方面仍然存在著問題和挑戰(zhàn)。
自然語言處理面臨四大挑戰(zhàn):
一是在詞法、句法、語義、語用和語音等不同層面存在不確定性;
二是新的詞匯、術(shù)語、語義和語法導致未知語言現(xiàn)象的不可預測性;
三是數(shù)據(jù)資源的不充分使其難以覆蓋復雜的語言現(xiàn)象;
四是語義知識的模糊性和錯綜復雜的關(guān)聯(lián)性難以用簡單的數(shù)學模型描述,語義計算需要參數(shù)龐大的非線性計算
四、人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算機到人的兩部分信息交換,是人工智能領域的重要的外圍技術(shù)。人機交互是與認知心理學、人機工程學、多媒體技術(shù)、虛擬現(xiàn)實技術(shù)等密切相關(guān)的綜合學科。傳統(tǒng)的人與計算機之間的信息交換主要依靠交互設備進行,主要包括鍵盤、鼠標、操縱桿、數(shù)據(jù)服裝、眼動跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設備。人機交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦機交互等技術(shù)。
五、計算機視覺
計算機視覺是使用計算機模仿人類視覺系統(tǒng)的科學,讓計算機擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。自動駕駛、機器人、智能醫(yī)療等領域均需要通過計算機視覺技術(shù)從視覺信號中提取并處理信息。近來隨著深度學習的發(fā)展,預處理、特征提取與算法處理漸漸融合,形成端到端的人工智能算法技術(shù)。根據(jù)解決的問題,計算機視覺可分為計算成像學、圖像理解、三維視覺、動態(tài)視覺和視頻編解碼五大類。
目前,計算機視覺技術(shù)發(fā)展迅速,已具備初步的產(chǎn)業(yè)規(guī)模。未來計算機視覺技術(shù)的發(fā)展主要面臨以下挑戰(zhàn):
一是如何在不同的應用領域和其他技術(shù)更好的結(jié)合,計算機視覺在解決某些問題時可以廣泛利用大數(shù)據(jù),已經(jīng)逐漸成熟并且可以超過人類,而在某些問題上卻無法達到很高的精度;
二是如何降低計算機視覺算法的開發(fā)時間和人力成本,目前計算機視覺算法需要大量的數(shù)據(jù)與人工標注,需要較長的研發(fā)周期以達到應用領域所要求的精度與耗時;
三是如何加快新型算法的設計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針對不同芯片與數(shù)據(jù)采集設備的計算機視覺算法的設計與開發(fā)也是挑戰(zhàn)之一。
六、生物特征識別
生物特征識別技術(shù)是指通過個體生理特征或行為特征對個體身份進行識別認證的技術(shù)。從應用流程看,生物特征識別通常分為注冊和識別兩個階段。注冊階段通過傳感器對人體的生物表征信息進行采集,如利用圖像傳感器對指紋和人臉等光學信息、麥克風對說話聲等聲學信息進行采集,利用數(shù)據(jù)預處理以及特征提取技術(shù)對采集的數(shù)據(jù)進行處理,得到相應的特征進行存儲。
識別過程采用與注冊過程一致的信息采集方式對待識別人進行信息采集、數(shù)據(jù)預處理和特征提取,然后將提取的特征與存儲的特征進行比對分析,完成識別。從應用任務看,生物特征識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識別人身份的過程,是一對多的問題;確認是指將待識別人信息與存儲庫中特定單人信息進行比對,確定身份的過程,是一對一的問題。
生物特征識別技術(shù)涉及的內(nèi)容十分廣泛,包括指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識別過程涉及到圖像處理、計算機視覺、語音識別、機器學習等多項技術(shù)。目前生物特征識別作為重要的智能化身份認證技術(shù),在金融、公共安全、教育、交通等領域得到廣泛的應用。
七、VR/AR
虛擬現(xiàn)實(VR)/增強現(xiàn)實(AR)是以計算機為核心的新型視聽技術(shù)。結(jié)合相關(guān)科學技術(shù),在一定范圍內(nèi)生成與真實環(huán)境在視覺、聽覺、觸感等方面高度近似的數(shù)字化環(huán)境。用戶借助必要的裝備與數(shù)字化環(huán)境中的對象進行交互,相互影響,獲得近似真實環(huán)境的感受和體驗,通過顯示設備、跟蹤定位設備、觸力覺交互設備、數(shù)據(jù)獲取設備、專用芯片等實現(xiàn)。
虛擬現(xiàn)實/增強現(xiàn)實從技術(shù)特征角度,按照不同處理階段,可以分為獲取與建模技術(shù)、分析與利用技術(shù)、交換與分發(fā)技術(shù)、展示與交互技術(shù)以及技術(shù)標準與評價體系五個方面。獲取與建模技術(shù)研究如何把物理世界或者人類的創(chuàng)意進行數(shù)字化和模型化,難點是三維物理世界的數(shù)字化和模型化技術(shù);分析與利用技術(shù)重點研究對數(shù)字內(nèi)容進行分析、理解、搜索和知識化方法,其難點是在于內(nèi)容的語義表示和分析;交換與分發(fā)技術(shù)主要強調(diào)各種網(wǎng)絡環(huán)境下大規(guī)模的數(shù)字化內(nèi)容流通、轉(zhuǎn)換、集成和面向不同終端用戶的個性化服務等,其核心是開放的內(nèi)容交換和版權(quán)管理技術(shù);展示與交換技術(shù)重點研究符合人類習慣數(shù)字內(nèi)容的各種顯示技術(shù)及交互方法,以期提高人對復雜信息的認知能力,其難點在于建立自然和諧的人機交互環(huán)境;標準與評價體系重點研究虛擬現(xiàn)實/增強現(xiàn)實基礎資源、內(nèi)容編目、信源編碼等的規(guī)范標準以及相應的評估技術(shù)。
目前虛擬現(xiàn)實/增強現(xiàn)實面臨的挑戰(zhàn)主要體現(xiàn)在智能獲取、普適設備、自由交互和感知融合四個方面。在硬件平臺與裝置、核心芯片與器件、軟件平臺與工具、相關(guān)標準與規(guī)范等方面存在一系列科學技術(shù)問題??傮w來說虛擬現(xiàn)實/增強現(xiàn)實呈現(xiàn)虛擬現(xiàn)實系統(tǒng)智能化、虛實環(huán)境對象無縫融合、自然交互全方位與舒適化的發(fā)展趨勢。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46663瀏覽量
237098 -
機器學習
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315 -
自然語言
+關(guān)注
關(guān)注
1文章
285瀏覽量
13320
原文標題:人工智能發(fā)展的關(guān)鍵技術(shù)
文章出處:【微信號:ittbank,微信公眾號:ittbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論