我們都習(xí)慣了便捷的智能揚聲器,比如在家中使用的亞馬遜Echo和手機上的Siri等語音助手,然而,除了方便,我們是否應(yīng)該更關(guān)注它們對隱私的影響?當(dāng)我們將數(shù)據(jù)交給亞馬遜、谷歌或其他一些大公司后,我們的數(shù)據(jù)和對話是否會被泄露?
語音識別成為主流
對語音識別最早的嘗試出現(xiàn)在20世紀(jì)60年代,但直到20世紀(jì)90年代,這項技術(shù)才在電腦上實現(xiàn)并變得普及。Siri在iPhone 4S上的首次亮相為市場帶來了真正的巨變,而這竟然已經(jīng)是2011年的事情了。
今天,許多產(chǎn)品和設(shè)備上都設(shè)有語音控制的“虛擬助手”,例如蘋果的Siri和谷歌訪問助手。事實上,現(xiàn)在有六分之一的美國人擁有智能揚聲器。目前,雖然亞馬遜憑借在其Echo揚聲器和其他設(shè)備上運行的Alexa引領(lǐng)市場,但它依然面臨著強勁的競爭對手,比如谷歌、蘋果和其他公司。
當(dāng)然,采用語音界面的不只是智能揚聲器和移動設(shè)備,還有智能顯示器,他們通常包含與智能揚聲器相同的語音助手界面和AI功能,例如亞馬遜的Echo Show。語音控制也被添加到智能電視和汽車,以及家用恒溫器等普通電器中,而微軟已將Cortana作為Windows系統(tǒng)的核心部分。
語音識別熱潮背后的技術(shù)是在高性能云服務(wù)器上運行的人工智能(AI)和人工神經(jīng)網(wǎng)絡(luò)(ANN)。在本地設(shè)備中還需要一些復(fù)雜的信號處理,例如遠(yuǎn)場拾音,它可以從背景噪聲中提取語音。
隱私問題
我們都知道技術(shù)有用,但一旦這些設(shè)備能收聽、處理和響應(yīng)我們的語音,那么會發(fā)生什么?微軟最近的一項調(diào)查顯示,41%的語音助手用戶存有隱私方面的擔(dān)憂。
通常,大多數(shù)智能揚聲器會接收您的問題或指令音頻,并將其上傳到自己的服務(wù)器進(jìn)行處理。這意味著您詢問或告知揚聲器的任何內(nèi)容至少暫時由服務(wù)提供商存儲。
雖然智能揚聲器總是在“聽”,但只有在聽到“喚醒詞”時才會上傳音頻,例如“Alexa”。但有些建議說,在實際使用中,揚聲器可能會將你說的其它話誤認(rèn)為喚醒詞,在違背你意愿的情況下開始錄音和上傳。
另一個值得關(guān)注的領(lǐng)域是服務(wù)提供商的員工對錄音和數(shù)據(jù)的訪問權(quán)限。最近的新聞報道稱亞馬遜有專門的人員聽取錄音以提高質(zhì)量,這似乎合乎邏輯,但也帶來了一些理論上的風(fēng)險。另一方面,我們已經(jīng)習(xí)慣了大公司存儲我們的網(wǎng)絡(luò)瀏覽歷史和聊天消息,添加語音真的有什么不同嗎?
有人擔(dān)心這些員工會將語音數(shù)據(jù)鏈接到我們的其他個人詳細(xì)信息,包括位置。了解你居住的地方對于提供本地化推薦很有用,例如您所在城市的最佳餐廳,但這確實會引發(fā)對于隱私的擔(dān)憂。
本地處理
解決這些隱私問題的一種方法是將云處理與更多的本地AI處理相結(jié)合。這可以通過使用能夠理解指令并做出相應(yīng)響應(yīng)的專用處理器來實現(xiàn)。
對于控制智能家居的許多交互,是可以無需與云進(jìn)行任何通信的。而在需要交換信息的情況下——例如,當(dāng)用戶提出問題或者請求控制諸如Spotify或互聯(lián)網(wǎng)廣播電臺之類的網(wǎng)絡(luò)應(yīng)用程序時,智能揚聲器可以只將元信息(而不是實際對話)發(fā)送到云。
隨著語音激活和控制被添加到更多的消費產(chǎn)品中,已經(jīng)足夠成熟的神經(jīng)網(wǎng)絡(luò)處理器可以部署到嵌入式應(yīng)用程序中,并且可以用于本地計算,而無需將數(shù)據(jù)發(fā)送到云,這將有助于減輕許多人的隱私擔(dān)憂。
雖然云公司更喜歡收集原始對話以建立數(shù)據(jù)庫,但如果家用設(shè)備能發(fā)揮安全網(wǎng)關(guān)的作用,限制哪些信息可以與云共享,用戶將更有可能信任語音服務(wù)。
這里的透明度至關(guān)重要:設(shè)備制造商需要向消費者表明哪些數(shù)據(jù)將在本地進(jìn)行處理,哪些會發(fā)送到云。當(dāng)然,關(guān)于這一問題的爭論亦存在一個積極的角度:不難想象,設(shè)備供應(yīng)商會使用其本地處理能力作為一個差異化因素,說服消費者購買具有更多“僅限本地”功能的智能揚聲器。
OEM可以做什么?
提高公眾信心的另一個方法是提供“從設(shè)計著手保護(hù)隱私”的功能,以便用戶可以看到設(shè)備在提供信息保密。例如,亞馬遜的Echo Show 5智能顯示器帶有覆蓋攝像頭的物理快門。所有智能揚聲器設(shè)備都設(shè)有一個靜音按鈕,用于禁用麥克風(fēng)。
無論硬件功能如何,無論我們的技術(shù)能力或經(jīng)驗水平如何,軟件都必須提供讓我們信任的用戶體驗。一個重要的步驟是為用戶提供明確的路徑,讓用戶能夠設(shè)置隱私偏好,以及隨時刪除所有錄音和歷史記錄。
保護(hù)隱私的另一個步驟是確保“喚醒詞”提?。ㄔ诒镜貓?zhí)行)盡可能準(zhǔn)確,以便消費者確信他們可以在不回避語音界面的情況下談?wù)撍矫?a href="http://ttokpm.com/v/tag/" target="_blank">話題。隨著更強大的處理器和更復(fù)雜的算法在語音控制設(shè)備中趨于普遍,智能揚聲器也能夠可靠地確定用戶是否在請求它們的幫助。
結(jié)論
未來的語音界面只會更加普及,那些能夠提供優(yōu)質(zhì)產(chǎn)品和隱私保護(hù)的供應(yīng)商擁有廣闊商機。消費者想要便捷,有關(guān)其他技術(shù)產(chǎn)品的證據(jù)表明,如果供應(yīng)商能夠證明隱私可以得到保護(hù),消費者會很樂意與語音控制設(shè)備進(jìn)行交談,就像在智能手機上打字一樣。
最后,我剛剛問我Echo揚聲器中的Alexa:“你能保守秘密嗎?”它回答:“你可以放心地告訴我你想讓我知道的秘密?!甭犐先ビ行┖@是一個很好的起點。
-
語音識別
+關(guān)注
關(guān)注
38文章
1712瀏覽量
112503 -
Alexa
+關(guān)注
關(guān)注
2文章
196瀏覽量
23264
原文標(biāo)題:淺析語音界面帶來的隱私問題
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論