0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音交互領(lǐng)域亞馬遜能否一直占到先機(jī)

454398 ? 來源:網(wǎng)絡(luò)整理 ? 作者:工程師1 ? 2018-05-24 14:50 ? 次閱讀

別調(diào)戲各路中文語音助手了,了解 Echo 和 Alexa 才是正經(jīng)事。

語音時(shí)代核心硬件形態(tài):Echo 定義

四年前,搭載語音助手 Alexa 的亞馬遜智能音箱 Echo 問世,伴隨其出現(xiàn)的,還有一個(gè)全新的概念,“Voice First”。當(dāng)時(shí)亞馬遜 Echo 的負(fù)責(zé)人 Mike George 認(rèn)為,語音交互具有完全無門檻的易用性和高度直覺化的引導(dǎo),所以人機(jī)交互的未來將圍繞著“語音”展開。這套理論在當(dāng)時(shí)并沒有得到廣泛的認(rèn)可,畢竟彼時(shí) Siri 問世已有 3 年,并沒有做出什么實(shí)質(zhì)性的成績(jī),人們對(duì) Siri 的使用更多是停留在“調(diào)戲”的層面,很少有人會(huì)真的從實(shí)用的角度去討論如何使用 Siri。

人們對(duì)語音交互有著天然的不信任,也很難從過去幾十年的圖形界面的舒適區(qū)中馬上走出來。亞馬遜卻認(rèn)為問題并不出在“語音交互”本身。它通過 Echo,大刀闊斧地砍掉了“圖形界面”的存在,用音箱這種形式,“強(qiáng)迫”用戶通過語音去和這樣一個(gè)計(jì)算設(shè)備進(jìn)行交互。

在屏幕消失之后,用戶開始發(fā)現(xiàn)其實(shí)語音交互在一些場(chǎng)景下反而相當(dāng)方便且高效。早上起來一邊刷牙一邊問問 Alexa 今天的天氣,讓 Alexa 播放自己喜歡的音樂。Echo 的誕生讓人機(jī)之間的“有效交互距離”被顯著延長(zhǎng)了,你不需要將手放到鍵盤鼠標(biāo)上,不需要將手指放到觸摸屏上,就可以“隔空”和一個(gè)計(jì)算設(shè)備進(jìn)行交互,這是智能音箱的核心產(chǎn)品優(yōu)勢(shì)。

后來的故事我們都知道了,谷歌、蘋果反而成為了跟隨者,Google Home、HomePod,是這兩大巨頭對(duì)“Voice First”理論的認(rèn)可。蘋果在 HomePod 的產(chǎn)品設(shè)計(jì)上主打音質(zhì)而非“智能助手”,且在發(fā)售時(shí)間上姍姍來遲,緊隨其后的消息就是其銷量上的滑鐵盧。三個(gè)月 60 萬臺(tái)的銷量,使蘋果在智能音箱這個(gè)新戰(zhàn)場(chǎng)上僅僅占據(jù)了 6% 的市場(chǎng)份額。而同期 Echo 的銷量卻高達(dá) 400 萬臺(tái)。

Echo 在語音交互世界里,為亞馬遜獲得了產(chǎn)品形態(tài)的領(lǐng)先,最新的數(shù)據(jù)顯示,Echo 已經(jīng)占據(jù)了這個(gè)市場(chǎng) 73% 的份額。亞馬遜也在過去的幾年里盡自己所能,讓 Alexa 進(jìn)入越來越多的硬件。無論是智能家居還是車載智能系統(tǒng),亞馬遜希望 Alexa 無處不在。

谷歌也是這么想的,所以從去年到今年的 CES 上,亞馬遜和谷歌圍繞著第三方硬件支持展開了一場(chǎng)軍備競(jìng)賽,越來越多的第三方硬件開始支持 Alexa 或 Google Assistant,正在漸漸形成一種“一呼百應(yīng)”的態(tài)勢(shì)。

從 Skills 到 Blueprints,Alexa 開始做得更多更好

但亞馬遜深知,硬件層面的產(chǎn)品形態(tài)只是“Voice First”的第一步。更關(guān)鍵的深層次問題仍然在于軟件的體驗(yàn),如何讓 Alexa 可以做的事情越來越多,最終圍繞著語音交互搭建起一個(gè)豐富完備的平臺(tái),逐漸開始生態(tài)化,才是亞馬遜完成這樣一個(gè)“語音烏托邦”的關(guān)鍵。

所以亞馬遜為 Alexa 打造了“Skills”(技能)。Skills 允許第三方開發(fā)者針對(duì) Alexa 開發(fā)應(yīng)用和功能,讓用戶可以借由 Alexa 使用第三方的服務(wù)。(類似于開發(fā)者為蘋果生態(tài)開發(fā)的可在 App Store 下載的 App。)到去年,Alexa 上的 Skills 數(shù)量超過了 15000 個(gè),遠(yuǎn)超谷歌的同類產(chǎn)品“Action”(動(dòng)作)。更不必說蘋果必須配合 App 才能工作的 SiriKit,在發(fā)布兩年之后還處于一個(gè)幾乎未起步的狀態(tài)。

第三方開發(fā)生態(tài)的蓬勃發(fā)展,讓 Alexa 在第三方服務(wù)接入的生態(tài)豐富性上一騎絕塵。但這并不代表 Alexa 的體驗(yàn)?zāi)軌蚰雺?Google Assistant。Alexa 的平臺(tái)上仍然存在著大量沒什么人用的冷門 Skills,市場(chǎng)調(diào)研結(jié)果也顯示,絕大多數(shù)情況下用戶仍然只用亞馬遜本身開發(fā)的那些簡(jiǎn)單的基礎(chǔ)功能。而論基礎(chǔ)功能,Alexa 和 Google Assistant 甚至 Siri,在體驗(yàn)上并沒有很大的差別。

這可能是 Blueprints 誕生的源動(dòng)力。

一個(gè)月前,亞馬遜為 Alexa 帶來了 Skill Blueprints 功能。直譯過來的意思就是“技能藍(lán)圖”。Blueprints 有點(diǎn)像針對(duì) Alexa 的 Workflow,用戶不需要任何編程語言知識(shí),就可以利用 Blueprints 中預(yù)設(shè)的模版,將你想要提供的信息以“答案”的形式寫進(jìn)已經(jīng)準(zhǔn)備好的“問題”里,打造屬于用戶自己的“技能”。

盡管目前 Blueprints 所支持的預(yù)設(shè)功能還非常有限,只能在預(yù)設(shè)的模版下,為特定問題預(yù)設(shè)答案。這使其在應(yīng)用層面沒有太多的靈活性,僅僅能用它來制作一些“問答游戲”。包括其中一個(gè)比較實(shí)用的功能是,讓來到家里的訪客可以問 Alexa 家里的 Wi-Fi 密碼,以及如何使用電視這樣的問題。目前制作好的“藍(lán)圖”也不能被發(fā)布或分享,嚴(yán)格與制作者的亞馬遜賬號(hào)綁定。

但 Blueprints 的產(chǎn)品邏輯使其完全有潛力成為亞馬遜自己的 Workflow 或 IFTTT,通過設(shè)置一系列的條件和操作,其完全可以讓 Alexa 平臺(tái)上的眾多功能更加有機(jī)地結(jié)合起來。

想象一下,你對(duì) Alexa 喊出“我要去上班了”,Alexa 就可以自動(dòng)關(guān)閉家里的燈、在關(guān)門后自動(dòng)落鎖,開啟洗衣機(jī),然后自動(dòng)為你叫一輛 Uber。這在未來將成為 Alexa 上眾多功能的粘合與催化劑,也會(huì)讓目前的語音交互到達(dá)一個(gè)全新的次元,在定義上也將更加接近于“系統(tǒng)”的概念。

語音時(shí)代:將語音交互的邊界推向更遠(yuǎn)的遠(yuǎn)方

在“培養(yǎng)用戶的語音交互習(xí)慣”取得了初步成果之后,亞馬遜推出了帶屏幕但主要交互仍基于語音的 Echo Show。而在今年 Google I/O 的首場(chǎng) KeyNote 上,谷歌也宣布其將在今年力推帶屏幕的 Smart Display 產(chǎn)品。在消費(fèi)者已經(jīng)開始慢慢習(xí)慣與智能設(shè)備進(jìn)行語音交互之后,帶屏幕的 Smart Display 存在的產(chǎn)品意義很明顯,就是要拓寬這樣一個(gè)語音交互世界的版圖,讓智能助手有更強(qiáng)大的信息展示功能。當(dāng)用戶問接下來一周的天氣時(shí),與其將每一天的天氣用語音播報(bào)出來,直接在屏幕上顯示一張氣溫折線圖,一定是更高效的。將語音交互和圖形界面進(jìn)行更深度的結(jié)合,有助于將智能語音助手進(jìn)一步打造成一個(gè)完整的,擁有強(qiáng)勢(shì)功能的“下一代操作系統(tǒng)”。

作為語音交互領(lǐng)域的領(lǐng)軍者,亞馬遜已經(jīng)繪出了一副完整的藍(lán)圖,描繪了這樣一個(gè)“語音烏托邦”。無論未來的世界是否將被語音交互所主導(dǎo),它至少會(huì)成為一塊誰都不可忽視的大蛋糕。今年的 CES,亞馬遜和谷歌在智能硬件領(lǐng)域仍打得熱火朝天,兩邊都想獲得這樣一個(gè)“語音烏托邦”的主導(dǎo)權(quán)。

有一種觀點(diǎn)認(rèn)為,亞馬遜之所以要搶占語音交互領(lǐng)域的先機(jī),其中的最關(guān)鍵原因在于,作為一家零售商,亞馬遜想要占領(lǐng)一個(gè)“最簡(jiǎn)單、最直接的指令入口”。這種解釋是很合理的,在語音交互的抽象世界里,“默認(rèn)選項(xiàng)”的壟斷力量只會(huì)比圖形界面更強(qiáng)大。如果人們習(xí)慣了對(duì)著智能音箱喊一句指令就可以買東西的生活,將這些指令接入到亞馬遜自身零售業(yè)務(wù)的重要性是不言而喻的。

無論是作為“下一代人機(jī)交互標(biāo)準(zhǔn)”,還是作為“零售行業(yè)的重要入口”,亞馬遜成功地驅(qū)動(dòng)了用戶和計(jì)算機(jī)“說話”的欲望。人機(jī)交互的公式被圖形界面定義了數(shù)十年之久,整個(gè)行業(yè)也幾乎被巨頭們籠罩得嚴(yán)嚴(yán)實(shí)實(shí)。亞馬遜通過自己敏銳的產(chǎn)品洞察力,在其之上撕開了一個(gè)大裂口。而如何將新的交互方式與自身的業(yè)務(wù)線有機(jī)結(jié)合,將會(huì)是亞馬遜未來 5 - 10 年的機(jī)遇與挑戰(zhàn)。

剛剛過去的 Google I/O,谷歌在語音助手這一塊展現(xiàn)出了空前的重視程度。而接下來的 WWDC 18,蘋果也將在這個(gè)領(lǐng)域交出一份自己的答卷。無論是把握著互聯(lián)網(wǎng)軟件服務(wù)的谷歌,還是把握著硬件制造和銷售主導(dǎo)地位的蘋果,都不希望看到計(jì)算機(jī)交互的未來被把握在亞馬遜的手上。而 Alexa 能否成為亞馬遜走向美國(guó)科技界制高點(diǎn)的關(guān)鍵動(dòng)力,會(huì)是未來幾年內(nèi)不可忽視的重要話題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104948
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24336

    瀏覽量

    195563
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2618

    瀏覽量

    83131
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    點(diǎn)煙器充電器可以一直插著嗎

    關(guān)于點(diǎn)煙器充電器是否可以一直插著的問題,存在不同的觀點(diǎn)和建議。以下是對(duì)這問題的分析: 支持一直插著的觀點(diǎn) 安全無憂 :點(diǎn)煙器充電器在汽車熄火后會(huì)自動(dòng)斷電,靜態(tài)電流很?。s1~2毫安),因此不存在
    的頭像 發(fā)表于 10-14 15:42 ?388次閱讀

    【實(shí)操文檔】在智能硬件的大模型語音交互流程中接入RAG知識(shí)庫

    本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯 智能硬件的語音交互接入大模型后可以直接理解自然語言內(nèi)容,但大模型作為個(gè)語言模型,對(duì)專業(yè)領(lǐng)域知識(shí)
    發(fā)表于 09-29 17:12

    在rtthreadstudio中安裝platformio,一直報(bào)出platformio未安裝怎么解決?

    我在rtthreadstudio中安裝platformio,顯示是成功的,但是創(chuàng)建基于platformio的應(yīng)用工程時(shí),一直報(bào)出platformio未安裝。能否解決。電話:131**4391,可加微信。能否幫忙解決?
    發(fā)表于 07-25 06:12

    亞馬遜語音助手的競(jìng)賽中上遠(yuǎn)遠(yuǎn)落后

    在AI浪潮席卷全球之際,科技巨頭們無不爭(zhēng)先恐后,力圖搶占先機(jī)。然而,在語音助手的競(jìng)賽中,曾經(jīng)的領(lǐng)先者亞馬遜可能即將獲得最后名。 繼蘋果在其WWDC 2024大會(huì)上發(fā)布了
    的頭像 發(fā)表于 06-18 16:54 ?1259次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語音交互技術(shù)是指通過語音識(shí)別、語音合成和自然語言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語言的交流和互動(dòng)。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語音
    的頭像 發(fā)表于 05-23 15:14 ?346次閱讀

    WTK6900G語音識(shí)別芯片在車載語音交互氛圍燈上的應(yīng)用案例解析

    隨著智能汽車的快速發(fā)展,車載語音交互技術(shù)逐漸成為提升駕駛體驗(yàn)的關(guān)鍵技術(shù)之。傳統(tǒng)的車載燈光控制系統(tǒng)往往依賴于手動(dòng)操作,不僅操作繁瑣,而且在駕駛過程中容易分散駕駛員的注意力。因此,開發(fā)
    的頭像 發(fā)表于 05-17 13:57 ?348次閱讀

    標(biāo)貝語音識(shí)別技術(shù)在金融領(lǐng)域中的應(yīng)用實(shí)例

    隨著語音識(shí)別技術(shù)與文本挖掘、自然語言處理等技術(shù)的不斷融合,智能語音交互技術(shù)在金融領(lǐng)域中爆發(fā)了出巨大的應(yīng)用潛力。標(biāo)貝科技根據(jù)自身與金融領(lǐng)域合作
    的頭像 發(fā)表于 05-16 16:55 ?495次閱讀
    標(biāo)貝<b class='flag-5'>語音</b>識(shí)別技術(shù)在金融<b class='flag-5'>領(lǐng)域</b>中的應(yīng)用實(shí)例

    求助蜂鳴器一直

    線路板功能正常,在蜂鳴器上接了個(gè)電磁牽引后,蜂鳴器一直響,本來是蜂鳴器是產(chǎn)量到達(dá)指定數(shù)值才響次。有懂的不
    發(fā)表于 04-23 12:42

    使用modustoolbox_v3.0 創(chuàng)建XMC7200_kit的工程,但是在github上獲取一直失敗的原因?

    我使用modustoolbox_v3.0 創(chuàng)建XMC7200_kit的工程,但是在github上獲取一直失敗。 能否提供個(gè)支持XMC7000的offline_packet_content文件。
    發(fā)表于 02-02 06:07

    Pod一直處于Pending狀態(tài)?什么是Pod拓?fù)浼s束?

    起因: 今天在部署組件的時(shí)候,發(fā)現(xiàn)組件的pod一直處于Pending狀態(tài),報(bào)錯(cuò)顯示的原因是:不滿足Pod拓?fù)浞植技s束,看了代碼發(fā)現(xiàn)是原來同事給組件新增了Pod拓?fù)浼s束。
    的頭像 發(fā)表于 12-18 11:46 ?1142次閱讀
    Pod<b class='flag-5'>一直</b>處于Pending狀態(tài)?什么是Pod拓?fù)浼s束?

    SIMCom,一直在路上

    發(fā)展。 芯訊通從成立之初就開始了國(guó)際化征程,出海二十幾年來一直與走向國(guó)際市場(chǎng)的無數(shù)“中國(guó)方案”和“中國(guó)故事”共同前進(jìn)發(fā)展。值此之際,和大家聊聊在與“路”息息相關(guān)的數(shù)字基建、智慧
    的頭像 發(fā)表于 12-16 16:05 ?481次閱讀
    SIMCom,<b class='flag-5'>一直</b>在路上

    離線語音識(shí)別技術(shù):掌控未來的語音交互

    離線語音識(shí)別技術(shù)的核心優(yōu)勢(shì)在于其獨(dú)立性和實(shí)時(shí)性。在沒有網(wǎng)絡(luò)連接的情況下,設(shè)備依然能夠迅速識(shí)別用戶的語音指令,實(shí)現(xiàn)各種功能。這使得語音交互更加自然、流暢,讓用戶隨時(shí)隨地享受智能科技帶來的
    的頭像 發(fā)表于 12-13 11:12 ?539次閱讀
    離線<b class='flag-5'>語音</b>識(shí)別技術(shù):掌控未來的<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    python如何一直循環(huán)個(gè)代碼

    滿足某個(gè)條件才停止循環(huán)。以下是使用while循環(huán)的般語法: while 條件:代碼塊 在代碼塊中,你可以編寫需要重復(fù)執(zhí)行的代碼。循環(huán)將一直執(zhí)行,直到條件為False為止。下面是個(gè)示例,該示例無限循環(huán)
    的頭像 發(fā)表于 11-23 15:54 ?2425次閱讀

    情感語音識(shí)別技術(shù)在人機(jī)交互中的應(yīng)用與展望

    、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)交互已經(jīng)滲透到日常生活的方方面面。情感語音識(shí)別作為人機(jī)交互中的關(guān)鍵技術(shù)之,能夠通過分析人類
    的頭像 發(fā)表于 11-22 10:40 ?714次閱讀

    情感語音識(shí)別在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

    、引言 情感語音識(shí)別是近年來人工智能領(lǐng)域的研究熱點(diǎn)之,它能夠通過分析人類語音中的情感信息實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)
    的頭像 發(fā)表于 11-15 15:42 ?519次閱讀