0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

思必馳高始興對智能語音在車載領域的應用的解讀

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:09 ? 次閱讀

現(xiàn)在語音交互在車載場景下有哪些應用?痛點在哪些地方?難點在哪些地方?現(xiàn)在面臨哪些挑戰(zhàn)?怎么解決?包括產(chǎn)品設計,諸多的一些想法、問題,我來簡單分享一下幾個觀點,跟各位做一個交流。

我們見了很多的車載的后市場,包括傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,包括互聯(lián)網(wǎng)新型智能硬件開發(fā)者,像后視鏡、HUD等,現(xiàn)在大家普遍的感覺車載的語音交互是一個大的趨勢,但是依然有一些認為在車載場景下語音的交互還是一個噱頭。主要是因為使用率最廣但漸漸成為調(diào)戲工具的SIRI,其次他們擔心在車載場景下的使用語音的安全性。我們認為, SIRI等助手在手機端變成調(diào)戲工具,這是一個必然。早期很多助手應用我們語音技術(shù),接入思必馳語音云,通過數(shù)據(jù)分析發(fā)現(xiàn),很多用戶問的事情是偏帶顏色的,比如問一些AV女優(yōu)、AV大片名字方便查詢。其次,現(xiàn)在應用語音的車載產(chǎn)品大多只能做到簡單交互,只是為了市場跟風而加上的功能,在產(chǎn)品設計和內(nèi)容方便明顯存在短板,不夠便捷不夠方便。

開車是非常乏味的事情,因此車載交互也在向趣味性方向發(fā)展,比如高德做的林志玲航的導航,我問了一下出租車司機,其中一個司機特別典型,他說我們開車非常悶,林志玲的聲音讓我心里挺激動的,沒有寂寞感。我們現(xiàn)在跟考拉也在做一些個性化的聲音,我們相信有人性化的車載交互會讓語音體驗大幅增加,會讓用戶的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽男神的聲音,我們未來會出很多男神聲音、女神聲音,小孩聲音,個性化的語音合成,這本來也是思必馳的優(yōu)勢之一。

車載環(huán)境的語音交互,更重要的是能提升駕車安全。一般認為,在車載里面的應用操控應該在兩秒之內(nèi),其實我覺得兩秒有點長,甚至應該在一秒、零點幾秒,比如在高速上開車,速度是非常快的,如果分神去做操控非常危險。但在設置導航、接聽電話、發(fā)微信的時候,緊急情況還是需要去操控它。毫無疑問,語音操控更加安全的。現(xiàn)在車載產(chǎn)品的市場有1.6億,年增量2000萬,但是統(tǒng)計30%的車主在開車的時候是離不開手機的。這很危險。媒體經(jīng)常曝光拿手機發(fā)微信、發(fā)微博等等導致車禍。電影《2012》大家都看過,比尼說出“enginestar”啟動了保時捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實現(xiàn)。現(xiàn)在市面上馬上會出現(xiàn)全自然語音交互的車載產(chǎn)品,比如像戰(zhàn)斗機應用的HUD技術(shù),樂駕CEO老馬會跟大家分享他們的HUD產(chǎn)品。

車主到底對智能語音交互接受程度怎么樣?沒有用戶接受,一款產(chǎn)品還是rubbish。騰訊做的一個調(diào)研, 76%的用戶對車載智能功能接受度越來越高,全語音控制導航的功能使用占比排第二,僅次于被盜車輛定位,中國太不安全了,小偷太多沒辦法。但即使車輛的定位、被盜的問題我相信未來語音的交互也能解決。比如現(xiàn)在我們汽車還是用鑰匙、用觸摸去開門,未來我們能不能用聲紋,比如說芝麻開門,車能夠識別主人身份,你可以給愛車起名字,你說話汽車就響應,別人說話不好使,這個一定能實現(xiàn)。

另外在汽車前裝市場很多高端車把語音交互系統(tǒng)作為標配,這能引領和培育用戶認知。我個人認為前裝市場還是相對很難進入,而且創(chuàng)新的產(chǎn)品,優(yōu)秀的體驗還是從后裝做起,包括HUD、行車記錄儀、后視鏡,中控設備。前裝市場的思路相對比較傳統(tǒng),需要被顛覆,而且驗證周期特別長,像語音驗證周期一般兩三年,甚至三五年,飛馳鎂物很有經(jīng)驗,他們做了多年傳統(tǒng)前裝。

思必馳高始興對智能語音在車載領域的應用的解讀

我們現(xiàn)在提智能語音基本上都認為語音導航,其實不單單是導航,車載語音交互在向其他應用擴展,服務性擴展。回頭看,從2011年智能車載化到現(xiàn)在經(jīng)過了大概三個階段,傻瓜式1.0,擴展式2.0,和交互式的3.0。在2.0的時候語音控制還是比較低級,在交互式3.0語音需求和功能已經(jīng)上升第一位,甚至超過了LBS。再一個是相關(guān)的應用的服務,內(nèi)嵌的語音交互在大量拓展,整個車載生態(tài)在更繼續(xù)發(fā)展。

思必馳高始興對智能語音在車載領域的應用的解讀

除了導航,其他很多服務和功能都需要語音交互,而且會做的越來越炫、越來越酷。比如收發(fā)短信,有些車載智能硬件已經(jīng)有這個功能,撥打電話,包括小說朗讀,天氣搜索,網(wǎng)絡電臺等等都已經(jīng)逐步邁入市場。網(wǎng)絡電臺方面,考拉做的很棒,未來我們跟老俞這方面會做的更加炫酷,有的人愿意聽謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說,現(xiàn)在這個技術(shù)已經(jīng)基本成熟,未來你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個語音包,未來你聽小說、聽電臺的內(nèi)容、聽新聞等等,這些都可以是你愛人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實驗室都在做這些事情。再一個微信,微信功能也是一個痛點需求,很多車禍就是因為司機在開車的時候收發(fā)微信,這一塊怎么做到極致體驗?一定要語音解決,樂駕做HUD“車蘿卜”,已經(jīng)解決了這個難點。另外,關(guān)于未來的拓展我很看好O2O,車載生態(tài)不僅僅是解決目前的一些功能,未來能不能我們在搜加油站、停車位、酒店時,像在手機端一樣形成一個閉環(huán),從搜索到導航到支付交易評價。社交,開車的時候我們通過行車記錄儀也好、HUD也好直接給景色拍照,全語音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開車,不單是個人支付,我們希望要做到的就是它知道你的身份,知道你的相關(guān)的信息,推送的信息都是個性化的,甚至我們通過登陸查酒店的時候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語音交互在車載方面的應用可能。

現(xiàn)在車載智能硬件層出不窮,車機相對來說是挺主流的設備?,F(xiàn)在后視鏡市場特別火,行車記錄儀防碰瓷現(xiàn)在也非常流行,OBD目前還比較傳統(tǒng),車載音箱比如考拉做得很不錯,再包括一些其他的小智能硬件,車載環(huán)境里面到底哪一塊屏會占主流?還有一個說法,HUD抬頭顯示系統(tǒng)在戰(zhàn)斗機、高端車里面都有,現(xiàn)在全自然語音交互加手勢式交互的HUD概念已經(jīng)出來了,比如樂駕的“車蘿卜”,我覺得HUD也有很大可能,撬動未來車載的生態(tài)。不管怎么樣,絕對離不開語音交互。

從傻瓜式1.0到語音交互式3.0,從語音導航到其他功能,現(xiàn)已經(jīng)一步步成為現(xiàn)實。但現(xiàn)在去暢想O2O、聲紋密碼等,語音技術(shù)是不是已經(jīng)能夠直接應用?我覺得還不到時候。語音交互雖然實現(xiàn)了技術(shù)上的可能性,但離質(zhì)的飛躍還有距離。目前的語音只是在載里面加上一個耳朵、一個嘴巴,還缺一個大腦,如何去協(xié)調(diào)在車載環(huán)境下遇到的種種挑戰(zhàn)。

第一,近場抗噪。語音識別在駕車的噪聲環(huán)境下怎么樣,人跟車機或者車載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發(fā)動機聲噪、路噪、人的說話,音噪等,怎樣抗噪?播放音樂的時候回聲對消我們已經(jīng)能夠?qū)崿F(xiàn),在跟多種車載設備交互下的算法降噪,我們思必馳一直在研發(fā)并且目前也有一些還比較滿意的進步。

第二,自然語音交互。這是讓車載生態(tài)能夠發(fā)展最核心音素,現(xiàn)在車載交互還大多停留在簡單操控階段,簡單控制、簡單命令、簡單搜索、簡單查詢。但如果我們想撬動O2O,一定要首先形成閉環(huán)。就像人跟手機的關(guān)系,所有的購物、查詢搜索、玩游戲一定會在智能手機完成,不會再跳轉(zhuǎn)另一個設備上。車載生態(tài)起來一定會形成一個閉環(huán),不僅僅是簡單語音交互,一定是自然語言的交互、一定是對話式交互,這個是應用趨勢。思必馳目前一直在努力地,就是真正的對話式人性化語言交互技術(shù)。

第三,產(chǎn)品設計層面的邏輯關(guān)系。我們智能車載硬件的麥克風、喇叭、結(jié)構(gòu)布局和錄音收音效果的關(guān)系,怎么保證抗噪,包括我們語音交互跟后端服務怎么結(jié)合。比如語音導航時,能不能跳轉(zhuǎn)到搜音樂,在導航的時候能不能收發(fā)微信等,產(chǎn)品邏輯這是非常大的挑戰(zhàn)。這需要產(chǎn)品開發(fā)者和思必馳一起來討論來解決的問題。

(高總此刻給大家放了兩個視頻,一個是春節(jié)期間的山東糾正哥的網(wǎng)絡視頻,一個是思必馳最新的可糾正打斷功能的實際演示視頻。涉及到技術(shù)曝光,此刻先不做播放。如有興趣的,可關(guān)注7月中旬的思必馳新技術(shù)發(fā)布會。)

這是我們做的一個語音糾正的功能演示。糾正哥遇到的問題我們在車里面的時候經(jīng)常遇到,在車載噪聲環(huán)境下語音識別很難達到百分之百,現(xiàn)在語音交互還是比較差,經(jīng)常會讓人抓狂,我們就做這批技術(shù),能夠隨時打斷和糾正機器的判斷和識別。我們在7月份會有新技術(shù)的大型發(fā)布會,到時候會邀請各位朋友參加。目前的語音交互僅僅實現(xiàn)操控、命令,簡單的查詢,這是遠遠不行的,一定是真正的智能語音的技術(shù)的進步,才能讓整個生態(tài)進來,才能讓整個整個產(chǎn)品體驗帶來質(zhì)的飛躍。

思必馳高始興對智能語音在車載領域的應用的解讀

最后插播小廣告——關(guān)于思必馳。我們最早成立劍橋大學,現(xiàn)在拿到兩輪投資,我們專注人機對話,以及語音識別、理解、合成、設備一系列技術(shù),我們把這個技術(shù)做成開放解決方案,提供垂直行業(yè)像車載、家居、穿戴,包括機器人玩具等等這些行業(yè)的開發(fā)者,讓他們結(jié)成了我們的相關(guān)的SDK方案以后提升產(chǎn)品的交互體驗。車載方面我們對芯片廠商、方案廠商,還有車載智能硬件合作伙伴提供我們們相關(guān)的技術(shù)和方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 導航
    +關(guān)注

    關(guān)注

    7

    文章

    512

    瀏覽量

    42159
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    771

    瀏覽量

    48595
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    263

    瀏覽量

    14232
收藏 人收藏

    評論

    相關(guān)推薦

    攜手新一代哈弗H6共創(chuàng)智能出行新未來

    隨著汽車行業(yè)邁入智能化的新時代,消費者對智能交互體驗的期待也在不斷提升。新一代哈弗H6搭載了由提供
    的頭像 發(fā)表于 09-18 11:37 ?208次閱讀

    獲得TISAX最高等級AL3級認證

    近日,經(jīng)過充分的準備和嚴格的評審,科技股份有限公司已成功獲得TISAX最高等級AL3級的認證標簽,這一認證標志著
    的頭像 發(fā)表于 07-25 10:49 ?469次閱讀

    攜手長虹美菱共研AI引領智能家居新潮流

    月9日,董事長、CEO始興,
    的頭像 發(fā)表于 07-15 10:45 ?305次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>攜手長虹美菱共研AI引領<b class='flag-5'>智能</b>家居新潮流

    廣西柳州的智能制造基地正式投入試運行

    近日,隨著一臺臺智能智造設備的陸續(xù)進廠和調(diào)試完成,位于廣西柳州的智能制造基地正式投入試運行。
    的頭像 發(fā)表于 05-29 10:32 ?353次閱讀

    AWE現(xiàn)場 | ×康佳:智能聲控,視聽隨心

    (AWE2024)在上海新國際博覽中心盛大開幕。展會現(xiàn)場,展臺展示的康佳電視吸引了大批消費者和媒體記者的駐足。 作為國內(nèi)知名品牌,康佳電視無論是在畫質(zhì)還是音質(zhì)上都表現(xiàn)的非常出色。在
    的頭像 發(fā)表于 03-18 12:15 ?257次閱讀

    AWE現(xiàn)場 | ×追覓:AI語音操控解放雙手,盡享生活松弛感

    電子博覽會(AWE2024)上,展區(qū)的追覓智能掃地機一經(jīng)展出,便吸引了大量與會人員的圍觀。 追覓是聚焦智能家電行業(yè)的新銳中國品牌,追覓
    的頭像 發(fā)表于 03-18 11:30 ?575次閱讀

    北汽研究總院與簽署戰(zhàn)略合作協(xié)議

    2月29日,北汽研究總院與科技股份有限公司(以下簡稱)簽署戰(zhàn)略協(xié)議,將依托各自優(yōu)勢,
    的頭像 發(fā)表于 03-11 14:59 ?493次閱讀

    出席大模型與智能汽車新應用論壇

    、中國信息通信研究院、浙江大學、等各單位領導及業(yè)界專家共計80余人共同出席,分享在AI大模型領域取得的最新成果和經(jīng)驗,探討人工智能在實
    的頭像 發(fā)表于 01-11 10:38 ?509次閱讀

    完成新一輪首期兩億元融資

    科技股份有限公司(以下簡稱“”)完成新一輪首期兩億元融資,后續(xù)
    的頭像 發(fā)表于 01-11 10:37 ?480次閱讀

    語音算法與芯片的完美結(jié)合 人機交互

    TH1520芯片解決方案AISpeech深圳羲頓科技有限公司TH1520是深聰智能
    的頭像 發(fā)表于 12-29 11:43 ?680次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b><b class='flag-5'>語音</b>算法與芯片的完美結(jié)合 人機交互

    DFM-2大模型助力構(gòu)建產(chǎn)業(yè)新生態(tài)

    近日,DFM-2大模型通過《生成式人工智能服務管理暫行辦法》備案,成為江蘇省本土人工智能首個通過大模型備案的企業(yè),后續(xù)
    的頭像 發(fā)表于 12-20 13:35 ?731次閱讀

    探討大模型下的智能座艙新生態(tài)

    為應對行業(yè)挑戰(zhàn),發(fā)布了定位為“針對垂域的、具有通用智能的行業(yè)語言大模型”DFM-2。它不僅具備通用語言計算大模型的所有AGI特性,包括文案創(chuàng)作、代碼生成、邏輯推理、常識問答、多輪
    發(fā)表于 12-19 14:55 ?384次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>探討大模型下的<b class='flag-5'>智能</b>座艙新生態(tài)

    :離線語音識別芯片簡介

    ?此時如果你有一個智能語音風扇,你只需要說一句打開風扇即可。關(guān)于語音識別這個功能,市面上有多家公司開發(fā)有關(guān)離線識別的芯片和算法,可是識別效果不是很理想,但是
    的頭像 發(fā)表于 10-19 18:03 ?550次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>:離線<b class='flag-5'>語音</b>識別芯片簡介

    AISpeech 語音算法與芯片的完美結(jié)合 人機交互

    TH1520是深聰智能旗下的芯片設計企業(yè))根據(jù)語音交互市場及算法的需求及發(fā)展方向,自主定義開發(fā)的 “芯片+算法” 的人工
    的頭像 發(fā)表于 10-18 14:43 ?1996次閱讀
    AISpeech <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b> <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b><b class='flag-5'>語音</b>算法與芯片的完美結(jié)合 人機交互

    攜手華為云昇騰AI云服務推進行業(yè)智能

    專業(yè)的對話式人工智能平臺型企業(yè),出席本次大會。
    的頭像 發(fā)表于 09-27 10:37 ?810次閱讀