亚洲区与欧美区,国产黄网免费视频在线观看,日韩人妻精品一区

歷史書可能會將語音控制視為人機接口中最重要的進步。我們不再打字，不再指點，只需說出想要什么就可以了。這個領(lǐng)域的初期進展十分緩慢，直到智能揚聲器的出現(xiàn)，讓我們開始意識到了解決方案?，F(xiàn)在，隨著在手機、耳機、可穿戴設(shè)備和智能家居中識別功能和應(yīng)用的改進，這場競爭已然開始。如今，最廣為人知的解決方案依賴于少數(shù)提供商控制的平臺和服務(wù)，但這種情況正在發(fā)生改變。語音激活可嵌入到任何地方，不僅可以定制，還可提高抗噪性，降低功率，擴大范圍，而且在語音識別方面與大型平臺一樣有效。

消費類語音產(chǎn)品市場的歷史饒有趣味，而語音識別功能在其中起著重要作用。FutureSource 顯示，從 2008 年到 2012 年，語音體驗主要集中在智能手機上，整體市場價值下降。從 2012 年到 2014 年，市場基本持平。然后，從 2015 年到 2018 年，主要受語音激活驅(qū)動，它再次以 15% 的復(fù)合年增長率增長。展望未來，Yole Développement 預(yù)計到 2023 年，復(fù)合年增長率至少為 30%，這主要得益于語音識別。這一增長將主要集中在智能手機上，其次是耳機和可穿戴設(shè)備、個人助理和智能家居功能（電視、電器等）。同一份報告得出的結(jié)論是，我們現(xiàn)在正進入智能語音的第二階段，隨著消費者對這種控制方法越來越滿意，語音控制將變得越來越普遍。

無論部署在哪里，他們的目標(biāo)都是增強實別能力。在智能手機或任何其他電池供電的設(shè)備中，一個明顯的優(yōu)勢是支持始終在線聆聽；在發(fā)出命令之前無需按下按鈕。這就需要超低功耗的觸發(fā)命令詞檢測，眾所周知，這意味著硬件與軟件的契合，以盡量降低待機功耗。當(dāng)然，用戶都希望為自己的品牌定制個性化觸發(fā)命令詞或短語的功能，并且可以支持多種語言，以便在其所在地區(qū)甚至國際市場上獲得強大的滲透力。您仍然將后續(xù)命令傳遞給某個主要的語音識別提供商來識別請求?；蛘?，也許不必。如果您的設(shè)備只需要對有限的詞匯表提供支持，并且您的語音識別引擎可以滿足該目標(biāo)，則可能無需第三方的幫助。

另一個關(guān)鍵需求是在嘈雜的環(huán)境中進行識別，也許還有身份驗證。語音識別所面臨的挑戰(zhàn)與目標(biāo)識別不同。例如，在起居室或汽車中，可能會有多個聲源：人們說話、電視和獨立的音樂/無線電、室內(nèi)外的噪音、以及房間或汽車內(nèi)部表面反射的回聲。隔離命令源、消除回聲和降低背景噪聲需要一些復(fù)雜的技術(shù)，這取決于多麥克風(fēng)、波束成形和回聲消除，以及噪聲抑制。

當(dāng)然，鑒于這些需求，CEVA 等公司已備好滿足這些需求的可用解決方案。最近推出的 CEVA Whispro? 語音識別產(chǎn)品解決方案就采用了在 CEVA DSP 平臺上運行的，基于神經(jīng)網(wǎng)絡(luò)的軟件。Whispro 已經(jīng)支持“Alexa”和“Ok Google”作為觸發(fā)命令詞，并且可以在培訓(xùn)中進行自定義，以支持任何客戶要求的觸發(fā)命令詞。它支持多種語言，可以處理多種語音觸發(fā)。該方案在多噪聲背景下進行培訓(xùn)，因此，識別具有嵌入的抗擾性，識別率大于 95%，每小時錯誤接受率小于 1 次，且無需進行云識別。

通過添加專門的語音拾取解決方案 CEVA ClearVox?，開發(fā)人員可實現(xiàn)多麥克風(fēng)支持和波束成形，以改進遠(yuǎn)場語音拾取、消除回聲和進一步降低噪音。Whispro 與 ClearVox 的組合可以在更遠(yuǎn)的距離內(nèi)（最遠(yuǎn) 7 米），尤其是在嘈雜的環(huán)境中，也能夠提供具有競爭力的觸發(fā)識別。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴