0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI能聽懂你的情緒了 人機交互會變得更好嗎?

電子工程師 ? 來源:yxw ? 2019-06-02 10:22 ? 次閱讀

第一次使用手機語音助手的時候,這個令我新奇不已的玩意兒,總是會在我興沖沖地問一個問題之后,令人失望地回答一句:“我好想聽不懂你在說什么……”

后來技術(shù)演進,它終于能夠通過我的一些關(guān)鍵詞,聽懂我說什么了。但一板一眼,一字一句,程式化十足。

慢慢地,簡單的對話已經(jīng)難不倒它。語音助手開始不局限于僅僅是對“文本”的理解,而是加入視覺、聽覺等分析技術(shù),通過“察言觀色”來捕捉人的“話語”背后蘊藏的情感。它們開始試圖獲取人類的情緒。

就像亞馬遜近日所透露的,基于Alexa語音識別情緒的技術(shù)能力,他們有計劃打造一款類似手表的可穿戴設(shè)備,通過捕捉用戶的情緒,而去提供更多的服務(wù)。

萬事不離“視聽”:

AI探知情緒的主要途徑

對人類的情緒進行研究和總結(jié),是一個已經(jīng)開展了將近一個半世紀的課題。最初研究者們往返于不同的種族人群,進行比對、分析,得出了人類的幾大基本情緒類別,然后可以應(yīng)用在人際交往、醫(yī)療護理等行業(yè)。

而在人機交互越來越深入的今天,機器能否對人的情緒進行充分的理解,將會直接影響到交互體驗。由此而來,諸多人工智能公司開始對機器識別情緒展開了攻關(guān)。得益于圖像識別和語音識別技術(shù)的不斷取得突破,目前AI識別情緒主要有兩種途徑。

第一種是視覺情緒識別。這是一種最基本的情緒識別方式,因為人的情緒往往會以面部肌肉運動的形式來直接呈現(xiàn),這也是美國心理學(xué)家保羅·艾克曼和福里森證明人類有六大基本情緒的直接原因。

而面部識別如今已經(jīng)是一項非常成熟的技術(shù),通過“喂給”AI大量的面部表情數(shù)據(jù),然后進行學(xué)習(xí),從而就可以對現(xiàn)實中人臉所呈現(xiàn)的情緒進行判斷。國內(nèi)就有專門做面部情緒識別的人工智能公司,比如曠視、太古等。

第二種是語音情緒識別。人的情緒出了能“看”出來,也能“聽”出來。與之直接相關(guān)的就是不同情緒下人說話的語調(diào):深沉之于悲傷、高昂之于愉悅等。

相較于視覺識別,語音識別的難度要高了不少。因為情緒與表情的對應(yīng)度要遠高于語調(diào)與情緒,比如你很難將哭喪臉與開心聯(lián)系到一起,但一個人如果說話聲音低沉的話可以表示他心情沉重,也可能是因為他的音色本就如此。正因如此,對聲音信號的分析才會要求更加精細。百度、谷歌、亞馬遜等對此均有一定的技術(shù)積累。

除了這兩種情緒識別途徑之外,通過文本識別和生理信號(腦電波、呼吸、皮膚阻力等)也是AI進行情緒識別的方法,但由于文本涉及的場景狹窄和生理信號的準確率低的短板,其尚不能成為主流的情緒識別方法。

顯然,Alexa所擅長的就是第二種途徑。在語音情緒識別方面,去年10月Alexa就已經(jīng)取得了相關(guān)專利,其可以通過聲音的模式來確定用戶的幸福、快樂、憤怒、悲傷、恐懼、厭惡、無聊、壓力和其他一些情緒的狀態(tài)。而如今,這項專利終于要派上用場了。

從買止咳糖漿到在線購物:

Alexa聽懂情緒后怎樣

Alexa是亞馬遜專門研究智能語音技術(shù)的團隊,它的技術(shù)要進行應(yīng)用轉(zhuǎn)化,往往和亞馬遜的另一個團隊Lab 126(曾經(jīng)開發(fā)過kindle和echo等產(chǎn)品)有關(guān)。這一次,兩個團隊再次攜手,準備把語音情緒識別的最新成果搭載到一個類似智能手表的可穿戴設(shè)備上。通過與手機APP的連接,來為用戶提供個性化服務(wù)。

根據(jù)亞馬遜的內(nèi)部文件,這款手表的功能定位很簡單,就是健康輔助。而在此之外,它還可以通過識別用戶的語音特征來進行情緒判斷,然后為其提供與他人交流的最佳方式。

根據(jù)描述,如果一個女生一邊擤鼻涕一邊咳嗽一邊又跟Alexa說自己有點餓了,那么Alexa就會通過對女生說話的的音調(diào)(虛弱、低沉)和背景音(咳嗽、擤鼻涕)分析出她很可能得病了,然后發(fā)出來自機器的貼心關(guān)懷:要不要來碗雞湯,或者叫個外賣?甚至直接線上訂購一瓶止咳糖漿一小時內(nèi)送貨上門?

說真的,妹子要真有這么一個貼心助理,還要什么男朋友?

從這個角度來說,Alexa作為個人生活助理的角色會得到進一步的加強。比如將其和手機音樂、電商APP等業(yè)務(wù)進行連接,在感知到你比較悲傷的時候為你唱一支快樂的歌,或者為你購買一盒甜品來讓你通過食物獲取愉悅感等。

由此而往,Alexa很可能將開啟一種全新的語音購物推薦方式。與傳統(tǒng)的通過捕捉用戶的瀏覽記錄、搜索記錄或者通過“竊取”其他用戶在手機其他APP上留下的隱私足跡,然后進行毫無目標的泛化、低效的推薦不同,通過感知情緒和問詢來為用戶進行購物推薦,能夠獲得更高的成交效率。這無疑將對電商形成巨大的吸引,也是可能成為Alexa獲利的一種新的商業(yè)模式。

當(dāng)然,現(xiàn)在這種可穿戴設(shè)備尚且處于研究的早期階段。亞馬遜并未完全確定是否執(zhí)行此項計劃。如果技術(shù)可行的話,才會進一步地去進行設(shè)計。我們這樣長篇大論似乎有“過度解讀”之嫌。

但在這個時代,最不可小看也最無法預(yù)測的,就是技術(shù)的走勢。如果它真的走入了現(xiàn)實,或許還真有一些東西需要認真對待并妥善解決。

謹防“服務(wù)”變成“買賣”

首當(dāng)其沖需要被關(guān)注的,就是我們不厭其煩地再三提及但也不得不提的隱私問題。

隱私數(shù)據(jù)是互聯(lián)網(wǎng)時代不可回避的,用戶提供自己的數(shù)據(jù)以獲取服務(wù)這種交換每天都在發(fā)生。在各種APP中,為了改進產(chǎn)品的使用體驗,服務(wù)商一般都會明確告知會搜集用戶的部分隱私數(shù)據(jù),并且僅用于改進產(chǎn)品之用。但這種話向來被認為是鬼話,尤其是Alexa還是有前科的——echo就不止一次被用戶曝出偷聽用戶和私自收集隱私的劣行。

但如果是做成監(jiān)測健康和識別情緒的穿戴設(shè)備的話情況又不一樣了。智能音箱正常情況下是需要喚醒才能工作的(我們假如非正常情況不存在……),而智能手表等可穿戴設(shè)備需要全天候地開啟,也就是說它隨時隨地都在感知著你的變化……想一想,有個東西默默地掌握著你情緒的一切,然后很有可能在背著你做著一些不知情的事情,是不是有點害pia?

獲取隱私的邊界在哪兒,是需要解決的第一個問題。

其次,需要警惕它由一種私人服務(wù)“異化”為不合理的商業(yè)用途。上文我們分析過的,它可以和電商達成一種合作,形成一種新的購物模式。但是,如果它所推薦的商品或者商家都是“充值”過的呢?你以為被推薦的商品是最合適的,沒想到卻是給錢最合適的……利用用戶的情緒進行商業(yè)分發(fā),顯然會給用戶添不少堵。

從這個角度來說,如何劃分服務(wù)和商業(yè)的界限,也是需要重點關(guān)注的。

最后,每次覺察到人的情緒變化,都會及時做出反應(yīng),很可能對人產(chǎn)生兩個截然相反的影響。

一是過分地依賴。情緒不好有它安撫,情緒愉悅有它“錦上添花”,將會讓人順著天性而行,缺乏自主的情緒調(diào)節(jié)能力。成年人還好,如果是兒童的話將很可能對其性格的形成產(chǎn)生不良影響。如何限制兒童使用此類產(chǎn)品,就會成為一個新問題。

二則是引起反感。人與人性格不同,有的人可能會喜歡被安撫,但有的人如果事無巨細都要被“噓寒問暖”,反而會引起精神的煩躁。這點很好理解,就跟你嫌爸媽嘮嘮叨叨是一個道理。那么,如何掌握好既能通過察覺情緒提供貼心的服務(wù)、又不至于引起反感的節(jié)奏,也是個技術(shù)活兒。

從總體上來說,Alexa如果能基于情緒識別提供正向的服務(wù)的話,還是很值得肯定的。畢竟人機交互到最后階段,是不可避免的要進行情緒上的碰撞;而基于此提供一些商業(yè)化的服務(wù)也無可厚非。但由于情緒的私密性和個人化色彩,無論是Alexa還是其他提供類似語音技術(shù)服務(wù)的公司,都必須要在符合倫理常識和保證體驗的前提下,提供有分寸、有邊界的服務(wù)。

否則的話,被用戶拋棄將會是注定之事。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4266

    瀏覽量

    119545
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266227
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1696

    瀏覽量

    112248

原文標題:AI能聽懂你的情緒了,人機交互會變得更好嗎?

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    聚徽-工控一體機是如何實現(xiàn)人機交互

    工控一體機實現(xiàn)人機交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?152次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之一,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來發(fā)展趨勢。
    的頭像 發(fā)表于 07-17 16:52 ?420次閱讀

    比爾·蓋茨展望AI:耳機與智能眼鏡引領(lǐng)人機交互新紀元

    我們描繪一幅人工智能(AI)技術(shù)普及后,生活與工作方式的全新圖景。他特別指出,耳機與智能眼鏡將成為AI硬件領(lǐng)域的兩大焦點,引領(lǐng)人機交互進入前所未有的新紀元。
    的頭像 發(fā)表于 07-04 16:34 ?719次閱讀

    人機界面交互方式的介紹

    人機界面(Human-Computer Interaction, HCI)是研究人與計算機之間交互方式的學(xué)科。隨著計算機技術(shù)的發(fā)展,人機交互方式也在不斷地演變和創(chuàng)新。以下是對各種人機交互
    的頭像 發(fā)表于 07-01 14:22 ?412次閱讀

    人機交互界面是什么_人機交互界面的功能

    人機交互界面(Human-Computer Interaction Interface,簡稱HCI或HMI),也被稱為人機界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?1228次閱讀

    工業(yè)平板電腦在人機交互中的應(yīng)用

    工業(yè)平板電腦在人機交互(Human-Machine Interaction,HMI)中扮演著至關(guān)重要的角色,它們通過直觀的界面和強大的計算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應(yīng)用:
    的頭像 發(fā)表于 06-18 12:00 ?175次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的一部分。人機交互技術(shù),作為實現(xiàn)人與計算機之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?540次閱讀

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?2143次閱讀

    人機交互系統(tǒng)的發(fā)展史及過程步驟

    人機交互系統(tǒng)還包括用戶界面(UI),它是用戶與系統(tǒng)之間進行信息交流和控制活動的載體。用戶界面可以是軟件系統(tǒng)界面,通過顯示器呈現(xiàn)系統(tǒng)信息,并接收來自用戶的視覺、聽覺等感官的輸入。
    的頭像 發(fā)表于 03-11 17:15 ?1779次閱讀
    <b class='flag-5'>人機交互</b>系統(tǒng)的發(fā)展史及過程步驟

    人機交互技術(shù)有哪幾種 人機交互技術(shù)的發(fā)展趨勢

    人機交互技術(shù)是指人與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術(shù)。隨著科技的進步,人機交互技術(shù)也在不斷發(fā)展創(chuàng)新。以下將介紹人機交互技術(shù)的幾種常見形式以及當(dāng)前的發(fā)展趨勢。 一
    的頭像 發(fā)表于 01-22 17:47 ?2728次閱讀

    榮耀發(fā)布MagicOS 8.0,首次實現(xiàn)意圖識別人機交互

    在科技圈掀起一股熱潮的榮耀正式發(fā)布其自主研發(fā)的全新操作系統(tǒng)——MagicOS 8.0,并賦予其一個富有魔法的中文名字:魔法OS 8.0。這款新操作系統(tǒng)憑借其獨創(chuàng)的平臺級AI使能的意圖識別人機交互,重新定義
    的頭像 發(fā)表于 01-12 14:50 ?759次閱讀

    情感語音識別技術(shù)在人機交互中的應(yīng)用與展望

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機交互已經(jīng)滲透到日常生活的方方面面。情感語音識別作為人機交互中的關(guān)鍵技術(shù)之一,能夠通過分析人類語音中的情感信息實現(xiàn)更加智能化和個性化的人機交互。本文將探討
    的頭像 發(fā)表于 11-22 10:40 ?628次閱讀

    情感語音識別在人機交互中的應(yīng)用與挑戰(zhàn)

    一、引言 情感語音識別是近年來人工智能領(lǐng)域的研究熱點之一,它能夠通過分析人類語音中的情感信息實現(xiàn)更加智能化和個性化的人機交互。本文將探討情感語音識別在人機交互中的應(yīng)用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢
    的頭像 發(fā)表于 11-15 15:42 ?449次閱讀

    物理人機交互控制性能量化指標有哪些

    在物理人機交互控制中,常用的性能量化指標包括: 1. 動作準確性(Action Accuracy):衡量人機交互中實際動作與期望動作之間的誤差。準確性高表示實際動作與期望動作的一致性好,控制系統(tǒng)能夠
    的頭像 發(fā)表于 11-09 16:19 ?885次閱讀

    情感語音識別技術(shù)在人機交互中的應(yīng)用與挑戰(zhàn)

    ?一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機交互已經(jīng)成為了研究的熱點之一。情感語音識別技術(shù)作為人機交互中的重要組成部分,能夠通過識別人的語音情感,實現(xiàn)更加智能化和個性化的交互體驗。本文將探討情感語音
    的頭像 發(fā)表于 11-09 15:27 ?667次閱讀