0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音識別成主流!Alexa,你能保守秘密嗎?

MEMS ? 來源:YXQ ? 2019-08-03 11:28 ? 次閱讀

我們都習(xí)慣了便捷的智能揚聲器,比如在家中使用的亞馬遜Echo和手機上的Siri等語音助手,然而,除了方便,我們是否應(yīng)該更關(guān)注它們對隱私的影響?當(dāng)我們將數(shù)據(jù)交給亞馬遜、谷歌或其他一些大公司后,我們的數(shù)據(jù)和對話是否會被泄露?

語音識別成為主流

對語音識別最早的嘗試出現(xiàn)在20世紀(jì)60年代,但直到20世紀(jì)90年代,這項技術(shù)才在電腦上實現(xiàn)并變得普及。Siri在iPhone 4S上的首次亮相為市場帶來了真正的巨變,而這竟然已經(jīng)是2011年的事情了。

今天,許多產(chǎn)品和設(shè)備上都設(shè)有語音控制的“虛擬助手”,例如蘋果的Siri和谷歌訪問助手。事實上,現(xiàn)在有六分之一的美國人擁有智能揚聲器。目前,雖然亞馬遜憑借在其Echo揚聲器和其他設(shè)備上運行的Alexa引領(lǐng)市場,但它依然面臨著強勁的競爭對手,比如谷歌、蘋果和其他公司。

當(dāng)然,采用語音界面的不只是智能揚聲器和移動設(shè)備,還有智能顯示器,他們通常包含與智能揚聲器相同的語音助手界面和AI功能,例如亞馬遜的Echo Show。語音控制也被添加到智能電視和汽車,以及家用恒溫器等普通電器中,而微軟已將Cortana作為Windows系統(tǒng)的核心部分。

語音識別熱潮背后的技術(shù)是在高性能云服務(wù)器上運行的人工智能(AI)和人工神經(jīng)網(wǎng)絡(luò)(ANN)。在本地設(shè)備中還需要一些復(fù)雜的信號處理,例如遠(yuǎn)場拾音,它可以從背景噪聲中提取語音。

隱私問題

我們都知道技術(shù)有用,但一旦這些設(shè)備能收聽、處理和響應(yīng)我們的語音,那么會發(fā)生什么?微軟最近的一項調(diào)查顯示,41%的語音助手用戶存有隱私方面的擔(dān)憂。

通常,大多數(shù)智能揚聲器會接收您的問題或指令音頻,并將其上傳到自己的服務(wù)器進(jìn)行處理。這意味著您詢問或告知揚聲器的任何內(nèi)容至少暫時由服務(wù)提供商存儲。

雖然智能揚聲器總是在“聽”,但只有在聽到“喚醒詞”時才會上傳音頻,例如“Alexa”。但有些建議說,在實際使用中,揚聲器可能會將你說的其它話誤認(rèn)為喚醒詞,在違背你意愿的情況下開始錄音和上傳。

另一個值得關(guān)注的領(lǐng)域是服務(wù)提供商的員工對錄音和數(shù)據(jù)的訪問權(quán)限。最近的新聞報道稱亞馬遜有專門的人員聽取錄音以提高質(zhì)量,這似乎合乎邏輯,但也帶來了一些理論上的風(fēng)險。另一方面,我們已經(jīng)習(xí)慣了大公司存儲我們的網(wǎng)絡(luò)瀏覽歷史和聊天消息,添加語音真的有什么不同嗎?

有人擔(dān)心這些員工會將語音數(shù)據(jù)鏈接到我們的其他個人詳細(xì)信息,包括位置。了解你居住的地方對于提供本地化推薦很有用,例如您所在城市的最佳餐廳,但這確實會引發(fā)對于隱私的擔(dān)憂。

本地處理

解決這些隱私問題的一種方法是將云處理與更多的本地AI處理相結(jié)合。這可以通過使用能夠理解指令并做出相應(yīng)響應(yīng)的專用處理器來實現(xiàn)。

對于控制智能家居的許多交互,是可以無需與云進(jìn)行任何通信的。而在需要交換信息的情況下——例如,當(dāng)用戶提出問題或者請求控制諸如Spotify或互聯(lián)網(wǎng)廣播電臺之類的網(wǎng)絡(luò)應(yīng)用程序時,智能揚聲器可以只將元信息(而不是實際對話)發(fā)送到云。

隨著語音激活和控制被添加到更多的消費產(chǎn)品中,已經(jīng)足夠成熟的神經(jīng)網(wǎng)絡(luò)處理器可以部署到嵌入式應(yīng)用程序中,并且可以用于本地計算,而無需將數(shù)據(jù)發(fā)送到云,這將有助于減輕許多人的隱私擔(dān)憂。

雖然云公司更喜歡收集原始對話以建立數(shù)據(jù)庫,但如果家用設(shè)備能發(fā)揮安全網(wǎng)關(guān)的作用,限制哪些信息可以與云共享,用戶將更有可能信任語音服務(wù)。

這里的透明度至關(guān)重要:設(shè)備制造商需要向消費者表明哪些數(shù)據(jù)將在本地進(jìn)行處理,哪些會發(fā)送到云。當(dāng)然,關(guān)于這一問題的爭論亦存在一個積極的角度:不難想象,設(shè)備供應(yīng)商會使用其本地處理能力作為一個差異化因素,說服消費者購買具有更多“僅限本地”功能的智能揚聲器。

OEM可以做什么?

提高公眾信心的另一個方法是提供“從設(shè)計著手保護(hù)隱私”的功能,以便用戶可以看到設(shè)備在提供信息保密。例如,亞馬遜的Echo Show 5智能顯示器帶有覆蓋攝像頭的物理快門。所有智能揚聲器設(shè)備都設(shè)有一個靜音按鈕,用于禁用麥克風(fēng)。

無論硬件功能如何,無論我們的技術(shù)能力或經(jīng)驗水平如何,軟件都必須提供讓我們信任的用戶體驗。一個重要的步驟是為用戶提供明確的路徑,讓用戶能夠設(shè)置隱私偏好,以及隨時刪除所有錄音和歷史記錄。

保護(hù)隱私的另一個步驟是確保“喚醒詞”提?。ㄔ诒镜貓?zhí)行)盡可能準(zhǔn)確,以便消費者確信他們可以在不回避語音界面的情況下談?wù)撍矫?a href="http://ttokpm.com/v/tag/" target="_blank">話題。隨著更強大的處理器和更復(fù)雜的算法在語音控制設(shè)備中趨于普遍,智能揚聲器也能夠可靠地確定用戶是否在請求它們的幫助。

結(jié)論

未來的語音界面只會更加普及,那些能夠提供優(yōu)質(zhì)產(chǎn)品和隱私保護(hù)的供應(yīng)商擁有廣闊商機。消費者想要便捷,有關(guān)其他技術(shù)產(chǎn)品的證據(jù)表明,如果供應(yīng)商能夠證明隱私可以得到保護(hù),消費者會很樂意與語音控制設(shè)備進(jìn)行交談,就像在智能手機上打字一樣。

最后,我剛剛問我Echo揚聲器中的Alexa:“你能保守秘密嗎?”它回答:“你可以放心地告訴我你想讓我知道的秘密?!甭犐先ビ行┖@是一個很好的起點。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1712

    瀏覽量

    112503
  • Alexa
    +關(guān)注

    關(guān)注

    2

    文章

    196

    瀏覽量

    23264

原文標(biāo)題:淺析語音界面帶來的隱私問題

文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識別芯片 物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識別芯片的原因主要基于以下幾個方面: 1、實時性與可靠性 實時性好:離線語音
    的頭像 發(fā)表于 09-26 17:56 ?384次閱讀
    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案_離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片分析

    WTK6900FC語音識別模塊

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線語音識別方案# #語音芯片 #語音識別 #唯創(chuàng)知音

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    什么是離線語音識別芯片?與在線語音識別的區(qū)別

    離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性高、響應(yīng)快,無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別準(zhǔn)確率高,但依賴穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?350次閱讀

    請問ESP-VA-SDK中怎么獲取alexa技能響應(yīng)返回的內(nèi)容?

    目前在基于 ESP32-Vaquita-DSPG 開發(fā)板調(diào)研 alexa 控制相關(guān)的開發(fā)流程,目前需求是希望可以在 開發(fā)板 上獲取通過 alexa 語音控制,返回的響應(yīng)內(nèi)容。 目前翻閱了大量資料文章,好像沒有找到相關(guān)的內(nèi)容,是
    發(fā)表于 06-13 07:13

    同樣的語音識別芯片,告訴,我們厲害在哪里?

    語音識別芯片
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年05月30日 17:04:58

    離線語音識別與在線語音識別有什么不一樣?

    離線語音識別與在線語音識別有什么不一樣? 離線語音識別和在線
    的頭像 發(fā)表于 12-12 14:36 ?1135次閱讀

    離線語音識別,“自然說”為產(chǎn)品賦

    相比于云端語音識別,離線語音識別技術(shù)具有更高的識別準(zhǔn)確率和更快的響應(yīng)速度。因為離線語音
    的頭像 發(fā)表于 12-11 11:20 ?436次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>,“自然說”為產(chǎn)品賦<b class='flag-5'>能</b>

    電阻的秘密——必須知道的電阻參數(shù)

    電阻的秘密——必須知道的電阻參數(shù)
    的頭像 發(fā)表于 12-06 14:31 ?806次閱讀
    電阻的<b class='flag-5'>秘密</b>——<b class='flag-5'>你</b>必須知道的電阻參數(shù)

    情感語音識別的應(yīng)用與挑戰(zhàn)

    一、引言 情感語音識別是一種通過分析人類語音中的情感信息實現(xiàn)智能化和個性化人機交互的技術(shù)。本文將探討情感語音識別的應(yīng)用領(lǐng)域、優(yōu)勢以及所面臨的
    的頭像 發(fā)表于 11-30 10:40 ?604次閱讀

    亞馬遜Alexa部門再次裁員,傳統(tǒng)智能語音助手已來到終章

    生成式AI所帶來的強大競爭壓力。 ? 引領(lǐng)一個時代的Alexa ,正在走向艱難轉(zhuǎn)型 ? 20世紀(jì)50年代的早期,當(dāng)時美國科學(xué)家們開始研究語音識別技術(shù)。這種技術(shù)經(jīng)歷了多個階段的發(fā)展,從簡單的詞匯量有限、孤立詞的
    的頭像 發(fā)表于 11-28 01:22 ?1560次閱讀

    影響語音芯片識別率的因素概述

    語音芯片識別率是指芯片對人類語音信號的識別能力。在實際應(yīng)用中,語音芯片識別率的高低直接影響了用戶
    的頭像 發(fā)表于 11-27 10:21 ?527次閱讀

    離線語音識別及控制是怎樣的技術(shù)?

    引言:隨著人工智能的飛速發(fā)展,離線語音識別技術(shù)成為了一項備受矚目的創(chuàng)新。離線語音識別技術(shù)能夠?qū)⑷说?b class='flag-5'>語音轉(zhuǎn)化為可理解的文本,無需依賴網(wǎng)絡(luò)連接,
    的頭像 發(fā)表于 11-24 17:44 ?1080次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>及控制是怎樣的技術(shù)?

    離線語音識別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語音識別技術(shù)成為了一項備受矚目的創(chuàng)新。離線語音識別技術(shù)能夠?qū)⑷说?b class='flag-5'>語音轉(zhuǎn)化為可理解的文本,無需依賴網(wǎng)絡(luò)連
    發(fā)表于 11-24 17:41

    情感語音識別:現(xiàn)狀、挑戰(zhàn)與解決方案

    一、引言 情感語音識別是人工智能領(lǐng)域的前沿研究課題,它通過分析人類語音中的情感信息,實現(xiàn)更加智能化和個性化的人機交互。然而,在實際應(yīng)用中,情感語音
    的頭像 發(fā)表于 11-23 11:30 ?778次閱讀