0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在人與汽車之間構(gòu)建一個交互系統(tǒng)?

我快閉嘴 ? 來源:蓋世汽車快訊 ? 作者: 童郜 ? 2020-09-02 10:07 ? 次閱讀

霍金輪椅是當(dāng)今人機交互的集大成者

“WOW!”—這是斯蒂芬霍金用眼睛寫完的人生最后一句話,無比深情地表達(dá)了他對世界的熱愛!

霍金是繼牛頓和愛因斯坦之后最杰出的科學(xué)家之一,被譽為宇宙之王。但命運似乎和霍金開了個玩笑,他在21歲就被確診為“漸凍癥”,不能言語。為了讓霍金能夠繼續(xù)創(chuàng)造科學(xué)奇跡,世界前沿科技公司為霍金的輪椅安裝了電腦等設(shè)備,配置了文字轉(zhuǎn)換語音、紅外線監(jiān)測、人臉識別、眼球追蹤等技術(shù),可以把思想轉(zhuǎn)化為文字。此后,霍金用自己的勇氣與堅持做出了常人難以企及的成就,提出了著名的“霍金輻射”學(xué)說??梢哉f,霍金輪椅是當(dāng)今人機交互的“集大成者”,是人類思想與機械力量擦出的強火花。

如何在人與汽車之間構(gòu)建一個交互系統(tǒng)

語音轉(zhuǎn)文字并不稀奇,微信中幾乎每天都會用到它。人臉識別技術(shù)、眼球追蹤技術(shù)才是霍金輪椅的先進(jìn)之處。不過隨著科技發(fā)展,這兩項技術(shù)在汽車中已經(jīng)被廣泛應(yīng)用。今年7月份上市的凱迪拉克CT6就配置了Super Cruise超級智能駕駛系統(tǒng),集成了用于人臉識別的攝像頭和紅外線發(fā)射器。在你疲勞駕駛時,可以更主動的給予提醒。剛剛開啟預(yù)售的威馬EX6 Plus 6座則配置了更先進(jìn)的“眼神智控”,具備人臉識別、視線喚醒、疲勞檢測三大模塊。像霍金的傳奇輪椅一樣,這套系統(tǒng)只需你給它一個眼神,就可以瞬間秒懂你的想法。

可以發(fā)現(xiàn),無論是“眼神智控”還是人臉識別,本質(zhì)上反映的是機器如何獨立思考,如何做決策,如何更好的服務(wù)人類。那么,人類工程師是如何實現(xiàn)人與汽車溝通,或者說如何在人與汽車之間構(gòu)建一個交互系統(tǒng)。

第一階段的人車交互:沒有腦子的汽車和只能下命令的人類

一切的技術(shù)謎團都要在從最初的需求出發(fā),人與汽車的交互系統(tǒng)由人對汽車的便捷性需求催生。進(jìn)入工業(yè)化社會,“我很忙”變成了每個職場人的口頭禪,在生活與工作之間疲于應(yīng)對的人們更加需要一臺更懂他的汽車。然而從需求出現(xiàn)到市場滿足,總需要一個過程,打工族不是霍金,不可能讓一堆世界前沿公司不惜一切成本為其量身定制,更何況霍金的輪椅也經(jīng)歷了漫長的升級迭代。于是汽車開始出現(xiàn)了一些最早的智能交互,在2013年凱迪拉克車型就已經(jīng)搭載了CUE人車交互系統(tǒng),用戶按下方向盤上的啟動按鈕,然后說出“打開空調(diào)”,汽車就可以自動開啟空調(diào)。在當(dāng)時,汽車智能化雖然在國內(nèi)正在如火如荼的進(jìn)行,但在市場端,國產(chǎn)品牌依舊沒有拿出比較成熟的產(chǎn)品。豪華品牌在技術(shù)上,依然占據(jù)引導(dǎo)作用,并依靠這種時髦的科技,賺足了眼球。

即便以今天的眼光,這種指令式人車交互也有獨特優(yōu)勢。它更簡單、高效,說讓汽車干啥,汽車就能干啥。缺點也很明顯,一個功能對應(yīng)一條指令,想要玩轉(zhuǎn)這一套,需要花時間去學(xué)習(xí)。最關(guān)鍵的是,智能化不是讓人去學(xué)習(xí)語言,而是讓機器去學(xué)習(xí)人類。而且指令式人車交互,在實際體驗中,也不完美。想要的打開空調(diào)時,就必須方向盤上操作一番,然后對著車機系統(tǒng)吼一通??蓪嶋H上,啟動空調(diào)很簡單,隨手一摁就行,完全不需要如此麻煩。

第二階段: 狂背單詞的汽車和愛講話的人類

初期的人車交互尷尬問題,并沒有打擊到汽車工程師,對于這類人來說,與天斗,與地斗,與機器斗,其樂無窮! 很快,就出現(xiàn)了以“免喚醒詞”為代表的人車交互新方式,標(biāo)志著汽車開始嘗試以朋友的角色,理解你。

那么,免喚醒詞是什么鬼?現(xiàn)在讓我們回想一下人機交互使用場景。例如,我正在用小鵬G3,我要去外灘看大海,我會說:“小P、小P”,我要打開地圖。但如果我們真的把“小P”當(dāng)朋友,像朋友一樣面對面的交流,我們就不會每句話都“指名道姓”,我們會說,去外灘看海景。在這個過程中,“小P、小P”被省略,“去外灘看海景”則變成了啟動導(dǎo)航系統(tǒng)的免喚醒詞。

免喚醒詞的出現(xiàn)大大降低了人車溝通復(fù)雜性。嘗到甜頭后,國內(nèi)車企迅速擴大了“免喚醒詞”詞組量。以新發(fā)布的威馬EX6 Plus 6座為例,人車交互系統(tǒng)內(nèi)置超過了70組免喚醒詞。比方說,日常駕駛聽歌時,對當(dāng)前歌曲完全不感冒,想切換下一首,只需要說“下一首”就行。相比最早的凱迪拉克CUE人車交互系統(tǒng),免喚醒詞的加入取消了手動啟動語音和“指名道姓”的語音喚醒過程,第一次真正意義上讓語音交互有了實用價值。

然而在人車交互發(fā)展方面,國內(nèi)造車新勢力因為發(fā)展原因,語音交互是從免喚醒詞這一階段開始。而合資車企在這方面走的更早,它們的人機交互是從簡單的語音指令開始。但走的早,不一定走的好。在本土品牌擴大“免喚醒詞”應(yīng)用時,通用、大眾這些巨頭還在糾結(jié)是否需要為此做更深的延展。至今,凱迪拉克CT6的語音交互依舊停留在“安鍵啟動”狀態(tài),并不支持免喚醒詞。而在小鵬P7的車機系統(tǒng)中免喚醒詞已經(jīng)達(dá)到了50+,威馬EX6 Plus 6座更是擁有超70組免喚醒詞,支持超過120項駕駛場景常用功能的語音控制,包含17項車輛控制指令,能夠有效識別中英文混合信息。只需說句話,一切全搞定。

第三階段:察言觀色的汽車和手舞足導(dǎo)的用戶

話說回來,免喚醒詞始終是技術(shù)限制下的產(chǎn)物,真正的人車交互應(yīng)該像朋友交流一樣,一個眼神、一個動作、一個表情就能懂你,而不是儀式感的喚醒。此時,汽車人車交互系統(tǒng)引入了類似斯蒂芬霍金輪椅配置的“眼神追蹤”技術(shù),只不過在汽車上被稱為“眼神智控”。配置這種技術(shù)的汽車會在座艙內(nèi)放置人臉、眼神追蹤等識別模組,用來會檢測駕駛員動作。當(dāng)你扭頭向屏幕的時候,汽車就會明白,你在需要我,此時,你給它個眼神,就能喚醒車機交互系統(tǒng)。在這個階段,汽車學(xué)會了看臉色,揣測人類心思,變的更聰明。

在威馬EX6 Plus 6座中,“眼神智控”模組設(shè)置在了前擋風(fēng)玻璃靠近內(nèi)后視鏡處,具備了人臉識別、視線喚醒、疲勞檢測三大模塊。如果我想要設(shè)置導(dǎo)航,只需要扭頭看向中控大屏,然后說導(dǎo)航去國家大劇院,車機系統(tǒng)就會自動輸入導(dǎo)航位置,然后開啟導(dǎo)航模式,這就是視線喚醒的奇妙之處。

如果說,“眼神智控”只是為了實現(xiàn)視線喚醒,那它將毫無存在感,這種小活,“免喚醒詞”就能做到。作為新的交互方式,“眼神智控”的雄心是要從被動到主動實現(xiàn)全新人車“互動”。疲勞駕駛檢測就是一種很受歡迎的主動關(guān)懷配置。統(tǒng)計表明由于疲勞、瞌睡引發(fā)的交通事故在交通事故的總數(shù)中占7%左右,在重型卡車和高速路上的交通事故中則占到35%左右,而在嚴(yán)重交通事故中的占比更達(dá)到40%。同時交通事故統(tǒng)計結(jié)果顯示,如果駕駛員反應(yīng)速度能夠快0.5秒,將有60%的交通事故能夠避免,如果快1.5秒,將有90%的交通事故能夠避免。

在凱迪拉克CT6和威馬EX6 Plus 6座中都配置了“疲勞駕駛檢測”。它們就像機警的偵察員,隨時分析駕駛員面部數(shù)據(jù),如果駕駛員出現(xiàn)眨眼睛和打哈欠等動作,它們就進(jìn)入分階提醒。如果眨眼睛的時間和打哈欠的次數(shù)滿足了車輛設(shè)定條件,車機系統(tǒng)就會發(fā)生提醒,或者主動啟動語音,詢問車主是否來點音樂。只不過新勢力出身的威馬在“眼神智控”的人臉識別模塊中,還進(jìn)行了更深的拓展應(yīng)用。譬如,用戶坐進(jìn)駕駛艙,人臉識別模組就能進(jìn)行識別駕駛員,自動把對應(yīng)的喜馬拉雅、QQ音樂、愛奇藝、百度地圖等賬號全面互通。如果說語音交互的差異是豪華品牌的本土化服務(wù)缺失。那么,“眼神智控”的深度拓展則反映出各自不同的軟件開發(fā)實力。

需要指出的是,合資品牌并不傻,他們已經(jīng)醒悟過來,體會到了人車交互對用戶的吸引力,以及人車交互開發(fā)對自身在智能化方面的積極作用。但合資品牌經(jīng)歷了太久的戰(zhàn)略遲疑,從16年開始,人車交互已經(jīng)在國產(chǎn)車上基本普及,相關(guān)人車交互產(chǎn)業(yè)也被本土的百度、阿里、科大訊飛、商湯等巨頭所壟斷,他們能做的只能是買國產(chǎn)供應(yīng)商提供的半成品,加上無法很好的本土化適配,最終導(dǎo)致他們從先行者,變成如今的追趕者。

第四階段:“聲情并茂”的汽車和不想說話的用戶

那么,在接下來的一段時間內(nèi),人車交互又會如何發(fā)展呢?

是像電影(鋼鐵俠)中的賈維斯?還是像(流浪地球)中和吳京對話的繆斯。NO,都不是,人車智能交互屬于基礎(chǔ)科學(xué),完全不存在“大躍進(jìn)”式的跨越發(fā)展。下一階段的人車交互會把語音交互和“眼神智控”深度融合,從聲音和表情上“聲情并茂“的理解用戶,然后在交互上,做出一些新的創(chuàng)新形式。

如何定義新的創(chuàng)新形式?試想當(dāng)你點燃一支煙,希望略作放松時,車輛會為你主動降下窗戶,實現(xiàn)車內(nèi)通風(fēng)。當(dāng)你忽然接到一個電話,要做簡單溝通時,車輛會為你主動降低音樂和導(dǎo)航音量,以保證通話效果,這些功能在威馬EX6 Plus 6座上已經(jīng)能夠?qū)崿F(xiàn)。未來更超前的手勢控制,也會在威馬下一代數(shù)字智能座艙中逐漸落地。譬如,開車時,需要觸控屏幕完成操作時,可以不用俯身,直接做一個滑動手勢,車機系統(tǒng)就能完成屏幕滑動。這一階段的人車交互智能化,將無限接近霍金的傳奇輪椅。

相比新勢力這種更快速地智能化發(fā)展,合資品牌的人車交互進(jìn)程就要保守太多。通用集團凱迪拉克品牌在下一代旗艦車型凱雷德上依然只是提供了基礎(chǔ)的4G通訊和百度語音,不僅缺少5G 、V2X等前瞻科技,甚至是車機交互的發(fā)力點仍然是在向著整車OTA、本土化語音發(fā)力,還是在打基礎(chǔ),做基本功。

致敬霍金,致敬他對世界的熱愛,對科研的熱誠。以為往圣繼絕學(xué)的科技態(tài)度、和落后就要挨打,天天擔(dān)心被淘汰的焦慮感,造車新勢力在智能化方面突飛猛進(jìn)。從汽車人車交互的四個發(fā)展階段看,造車新勢力顯然走在了時代前列,雖然它們依然有很多方面都需要努力追趕,但并不妨礙我們給予適當(dāng)鼓勵,畢竟“胡蘿卜加大棒”才是好的激勵方式。在此,我引用我國已故著名生物學(xué)家童第周的話:“一定要爭氣,中國人并不比外國人笨。外國人認(rèn)為難辦的事,我們中國人經(jīng)過努力,也能辦得到?!?br /> 責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    59

    文章

    4793

    瀏覽量

    95276
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4002

    瀏覽量

    81674
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1352

    文章

    48326

    瀏覽量

    562961
收藏 人收藏

    評論

    相關(guān)推薦

    如何構(gòu)建物聯(lián)網(wǎng)系統(tǒng)

    構(gòu)建物聯(lián)網(wǎng)系統(tǒng)復(fù)雜而細(xì)致的過程,涉及多個關(guān)鍵步驟和組件。以下是詳細(xì)的
    的頭像 發(fā)表于 10-29 10:40 ?278次閱讀

    為THS3001構(gòu)建簡單的SPICE模型

    電子發(fā)燒友網(wǎng)站提供《為THS3001構(gòu)建簡單的SPICE模型.pdf》資料免費下載
    發(fā)表于 10-29 10:11 ?0次下載
    為THS3001<b class='flag-5'>構(gòu)建</b><b class='flag-5'>一</b><b class='flag-5'>個</b>簡單的SPICE模型

    SLAM:機器何在未知地形環(huán)境中進(jìn)行導(dǎo)航

    作者: Aswin S Babu 設(shè)想下,當(dāng)我們困在陌生的沙漠中時,所面臨的艱巨任務(wù)是尋找條安全之路。長期以來,在陌生地形中導(dǎo)航
    的頭像 發(fā)表于 10-02 16:37 ?302次閱讀

    何在不同應(yīng)用場景下構(gòu)建音頻測試環(huán)境

    在之前的文章中,我們已經(jīng)詳細(xì)介紹了基礎(chǔ)音頻參數(shù)和AP525的軟硬件配置。本文將延續(xù)這主題,以泰凌TLSR9518A EVB作為測試設(shè)備(DUT),向大家展示如何在不同應(yīng)用場景下構(gòu)建音頻測試環(huán)境。
    的頭像 發(fā)表于 07-03 15:00 ?420次閱讀
    如<b class='flag-5'>何在</b>不同應(yīng)用場景下<b class='flag-5'>構(gòu)建</b>音頻測試環(huán)境

    人機交互界面是什么_人機交互界面的功能

    終端(OT),是指與計算機系統(tǒng)之間的通信媒體或手段,是與計算機之間進(jìn)行各種符號和動作的雙向信息交換的平臺。   人機
    的頭像 發(fā)表于 06-22 11:03 ?2010次閱讀

    PLC之間的IO交互怎么實現(xiàn)

    在工業(yè)自動化領(lǐng)域,可編程邏輯控制器(PLC)作為核心控制設(shè)備,其重要性不言而喻。PLC之間的IO交互是實現(xiàn)自動化生產(chǎn)線高效、穩(wěn)定運行的關(guān)鍵環(huán)節(jié)。本文將詳細(xì)探討PLC之間IO交互的實現(xiàn)方
    的頭像 發(fā)表于 06-17 11:09 ?1388次閱讀

    PLC之間如何交互信號

    在工業(yè)自動化系統(tǒng)中,PLC(Programmable Logic Controller,可編程邏輯控制器)是核心的控制設(shè)備。在許多復(fù)雜的應(yīng)用場景中,需要兩或多個PLC之間進(jìn)行信號交互
    的頭像 發(fā)表于 06-14 16:57 ?3422次閱讀

    簡單的汽車蓄電池維修電路

     這是圍繞當(dāng)?shù)厥袌錾先菀踪I到的非常常見的電子元件構(gòu)建的簡單電路,用于保護汽車汽車)電池免受深度放電并防止損壞。
    的頭像 發(fā)表于 05-05 11:19 ?912次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個</b>簡單的<b class='flag-5'>汽車</b>蓄電池維修電路

    人機交互的三階段 人機交互的常用方式

    交互經(jīng)歷的三階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?2668次閱讀

    怪獸智能數(shù)字,實時交互數(shù)字直播系統(tǒng),3D超寫實虛擬形象直播

    也在不斷創(chuàng)新,推出了許多令人驚嘆的技術(shù)產(chǎn)品。其中,可互動的怪獸智能數(shù)字以及實時交互數(shù)字直播系統(tǒng),以及其超寫實的3D虛擬形象直播系統(tǒng)就是其
    的頭像 發(fā)表于 03-05 09:08 ?583次閱讀

    鴻蒙開發(fā)丨設(shè)備內(nèi) UIAbility 的幾種交互方式

    UIAbility 組件間交互(設(shè)備內(nèi)) 在設(shè)備內(nèi),UIAbility(用戶界面能力)是系統(tǒng)調(diào)度的最小單元,它們負(fù)責(zé)展示用戶界面和執(zhí)行相關(guān)的業(yè)務(wù)邏輯。設(shè)備內(nèi)的不同功能模塊之間交互是應(yīng)
    的頭像 發(fā)表于 02-02 10:42 ?524次閱讀
    鴻蒙開發(fā)丨設(shè)備內(nèi) UIAbility 的幾種<b class='flag-5'>交互</b>方式

    新能源汽車交互設(shè)計現(xiàn)狀及發(fā)展趨勢

      隨著車內(nèi)信息成倍地增長,汽車相關(guān)的界面也越來越多,因此人們利用各種屏幕進(jìn)行操作和反饋便成為種主流的交互方式,界面交互汽車軟件
    發(fā)表于 12-22 17:33 ?548次閱讀
    新能源<b class='flag-5'>汽車</b><b class='flag-5'>交互</b>設(shè)計現(xiàn)狀及發(fā)展趨勢

    基于Redis Enterprise,LangChain,OpenAI 構(gòu)建電子商務(wù)聊天機器

    鑒于最近人工智能支持的API和網(wǎng)絡(luò)開發(fā)工具的激增,許多科技公司都在將聊天機器集成到他們的應(yīng)用程序中。LangChain是種備受歡迎的新框架,近期引起了廣泛關(guān)注。該框架旨在簡化開發(fā)人員與語言模型
    的頭像 發(fā)表于 11-25 08:04 ?427次閱讀
    基于Redis Enterprise,LangChain,OpenAI <b class='flag-5'>構(gòu)建</b><b class='flag-5'>一</b><b class='flag-5'>個</b>電子商務(wù)聊天機器<b class='flag-5'>人</b>

    何在下一代智能手機的設(shè)計中節(jié)約空間?本文提供思路

    何在下一代智能手機的設(shè)計中節(jié)約空間?本文提供思路
    的頭像 發(fā)表于 11-23 09:06 ?405次閱讀
    如<b class='flag-5'>何在下一</b>代智能手機的設(shè)計中節(jié)約空間?本文提供<b class='flag-5'>一</b><b class='flag-5'>個</b>思路

    springboot前后端交互流程

    Boot 進(jìn)行開發(fā)時,前后端交互非常重要的部分,本文將詳細(xì)介紹 Spring Boot 前后端交互的流程。 前后端交互的基本原理 在
    的頭像 發(fā)表于 11-22 16:00 ?1984次閱讀