什么是人機(jī)交互技術(shù)?
在人工智能電話機(jī)器人中,最為重要的技術(shù)當(dāng)然是人機(jī)交互,什么是人機(jī)交互技術(shù)呢?
人機(jī)交互技術(shù)(Human-Computer Interaction Techniques)是指通過計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)。
人機(jī)交互系統(tǒng)的主要組成
1、多模態(tài)輸入/輸出:多模態(tài)輸入包括鍵盤、鼠標(biāo)、文字、語音、手勢(shì)、表情、注視等多種輸入方式;多模態(tài)輸出包括文字、圖形、語音、手勢(shì)、表情等多種交互信息。
2、視覺合成:使人機(jī)交互能夠在一個(gè)仿真或虛擬的環(huán)境中進(jìn)行,仿佛現(xiàn)實(shí)世界中人與人之間的交互。
3、 對(duì)話系統(tǒng):主要由兩種研究趨勢(shì),一種以語音為主,另一種從某一特定任務(wù)域入手,引入對(duì)話管理概念,建立類似于人人對(duì)話的人機(jī)對(duì)話??赏ㄟ^該系統(tǒng),輕松把握狀態(tài)信息。
4、知識(shí)處理:自動(dòng)地提取有組織的,可為人們利用的知識(shí)。
5、智能接口代理:智能接口代理為實(shí)現(xiàn)人與計(jì)算機(jī)交互的媒介。
主要特點(diǎn)
多媒體系統(tǒng)的交互特點(diǎn)
基于語音的智能人機(jī)交互是當(dāng)前人機(jī)交互技術(shù)的主要表現(xiàn)形式,語音人機(jī)交互過程包括信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識(shí)和內(nèi)容的整合。
與傳統(tǒng)用戶界面相比,引入了視頻和音頻之后的多媒體用戶界面,最重要的變化就是界面不再是一個(gè)靜態(tài)界面,而是一個(gè)與時(shí)間有關(guān)的時(shí)變媒體界面。
人類使用語言和其它時(shí)變媒體(如姿勢(shì))的方式完全不同于其它媒體。從向用戶呈現(xiàn)的信息來講,時(shí)變媒體主要是順序呈現(xiàn)的,而我們通常熟悉的視覺媒體(文本和圖形)通常是同時(shí)呈現(xiàn)的。在傳統(tǒng)的靜止界面中,用戶或是從一系列選項(xiàng)中進(jìn)行選擇(明確的界面通信成分),或是用可再認(rèn)的方式進(jìn)行交互(隱含的界面通信成分)。
在時(shí)變媒體的用戶界面中,所有選項(xiàng)和文件必須順序呈現(xiàn)。由于媒體帶寬和人的注意力的限制,在時(shí)變媒體中,用戶不僅要控制呈現(xiàn)信息的內(nèi)容,也必須控制何時(shí)呈現(xiàn)和如何呈現(xiàn)。
結(jié)合語音人機(jī)交互過程,可以看出智能語音人機(jī)交互關(guān)鍵技術(shù)主要如下:
1.自然語音處理技術(shù)
包括中文分詞、詞性標(biāo)注、實(shí)體識(shí)別、句法分析、自動(dòng)文本分類等技術(shù)。
2.語義分析和理解
包括知識(shí)表示、本體理論、分領(lǐng)域的語義網(wǎng)絡(luò)、機(jī)器推理等。
3.知識(shí)構(gòu)建和學(xué)習(xí)體系
包括搜索技術(shù)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖掘、知識(shí)獲取、機(jī)器學(xué)習(xí)等技術(shù)。
4.語音技術(shù)
包括語音識(shí)別、語音合成和聲紋識(shí)別等。
5.整合通信技術(shù)
包括跨平臺(tái)即時(shí)通訊整合技術(shù)、超大負(fù)載消息集群處理技術(shù)、移動(dòng)客戶端開發(fā)技術(shù)。
6.云計(jì)算技術(shù)
包括海量數(shù)據(jù)分布式存儲(chǔ)、統(tǒng)計(jì)和分析技術(shù)。
智能語音人機(jī)交互技術(shù)在典型行業(yè)的應(yīng)用
語音交互方式替代文本交互方式,可以增強(qiáng)信息輸入方式,能和更多的設(shè)備進(jìn)行整合,市場(chǎng)前景廣闊。目前,智能語音人機(jī)交互技術(shù)已經(jīng)廣泛應(yīng)用到電話銷售、智能客服、智能終端等領(lǐng)域,切實(shí)深入到人們的生活。
VR系統(tǒng)中人機(jī)交互的特點(diǎn)
人機(jī)交互可以說是VR系統(tǒng)的核心,因而,VR系統(tǒng)中人機(jī)交互的特點(diǎn)是所有軟硬件設(shè)計(jì)的基礎(chǔ)。
其特點(diǎn)如下:
觀察點(diǎn)(Viewpoint) 是用戶做觀察的起點(diǎn)。
導(dǎo)航(Navigation) 是指用戶改變觀察點(diǎn)的能力。
操作(Manipulation)是指用戶對(duì)其周圍對(duì)象起作用的能力。
臨境(Immersion) 是指用戶身臨其境的感覺,這在VR系統(tǒng)中越來越重要。
VR系統(tǒng)中人機(jī)交互若要具備這些特點(diǎn),就需要發(fā)展新的交互裝置,其中包括三維空間定位裝置、語言理解、視覺跟蹤、頭部跟蹤和姿勢(shì)識(shí)別等。
多媒體與VR系統(tǒng)的人機(jī)交互有著某些共同特點(diǎn)。首先,它們都是使用多個(gè)感覺通道,如視覺和聽覺;其次,它們都是時(shí)變媒體。
審核編輯 黃昊宇
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1199瀏覽量
55269 -
vr
+關(guān)注
關(guān)注
34文章
9630瀏覽量
149966
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論