電子發(fā)燒友網(wǎng)報道(文/黃山明)智能家居之所以被冠以“智能”的名義,其中非常重要的一點便是人機交互。通常智能家居的交互方式有許多種,生物識別技術(shù)便是其中之一,常用的有手勢控制、指紋識別、語音控制等等。
但從智能語音市場來看,近些年來國內(nèi)相關(guān)市場持續(xù)穩(wěn)定增長,需求旺盛,據(jù)中國語音產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)顯示,2021年中國智能語音產(chǎn)業(yè)市場規(guī)模將達到285億元,預(yù)計同比增長44%。
如果從網(wǎng)絡(luò)來區(qū)分,語音控制通常分為兩種,一種為離線語音,另一種為在線語音。
所謂離線語音,也被稱為本地語音,顧名思義便是儲存在本地設(shè)備中的固定命令詞,這種命令詞匯通常比較簡短,方便用于喚醒與控制。
相比在線語音,離線語音的優(yōu)勢在于無需聯(lián)網(wǎng),不需要后臺服務(wù)器,響應(yīng)快速,低延時。低成本、低功耗、體積小,支持多樣化命令詞定制開發(fā)等都是離線語音的優(yōu)勢,同時為了保證能夠成功喚醒命令詞,相比在線語音,其語音識別率會有相應(yīng)的降低。不過盡管如此,如今的離線語音識別率已經(jīng)達到了95%以上。
當然,離線語音的劣勢也在于命令詞比較固定,采用離線語音只不過是將傳統(tǒng)的控制方式改為語音操控,但如果要真正做到人機交互的程度,還遠遠不夠。
并且相比在線方案,離線語音的開發(fā)周期偏久,因為量產(chǎn)的離線語音產(chǎn)品都需要重新錄詞并進行訓(xùn)練。
這時候就體現(xiàn)出在線語音的優(yōu)勢,不再受到命令詞長度和條數(shù)的限制,廠商開發(fā)也比較方便,市場方案有很多的選擇。
這也意味著用戶可以用更加豐富的詞匯與設(shè)備進行交互,而不只是局限在幾個固定的命令詞上。
不過相應(yīng)地,由于需要聯(lián)網(wǎng),在線語音對于網(wǎng)絡(luò)要求較高,同時響應(yīng)速度也相對較慢,并且體積也相對較大,成本較高,這都是目前智能在線語音的一些弊端。
從目前情況來看,智能語音在語音識別率上已經(jīng)有了長足的進步,但這項技術(shù)背后涉及的聲學(xué)研究、模式識別研究、通用NLP研究以及垂直場景的深度語義理解等還遠遠沒有達到完善的地步。智能語音在交互體驗、使用效果、場景性優(yōu)化等方面還需要持續(xù)優(yōu)化。
國內(nèi)也有數(shù)家在智能語音方面較為優(yōu)秀的企業(yè),如科大訊飛已經(jīng)是國內(nèi)智能語音的代表企業(yè),在實時語音翻譯上走在了行業(yè)的前列。
還有如搜狗,從2012年開始在輸入法與地圖上加入語音輸入功能,通過多年用戶大數(shù)據(jù)的沉淀與積累,搜狗提升了用戶日常生活中表達、傳遞信息的效率,用軟硬件結(jié)合起來形成商業(yè)閉環(huán)。
云知聲也在2012年將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音識別系統(tǒng),在那時,云知聲已經(jīng)建立起完整的人工智能語音技術(shù)體系,實現(xiàn)對核心技術(shù)的自主可控,并開始人工智能語音技術(shù)商業(yè)化落地的早期探索。
在產(chǎn)品上,云知聲也具備了使智能家居擁有3-5畝的高精度語音控制能力。
思必馳同樣是國內(nèi)專業(yè)的對話式人工智能平臺公司,創(chuàng)立于2007年,目前不僅在語音識別率上有了大幅提升,同時在識別精度上也有了新的進展。比如其最新推出的直面喚醒技術(shù),可以模擬真人使用情況,優(yōu)先朝向結(jié)合距離選擇被喚醒的設(shè)備。
距離相同情況下,聲音朝向的位置先喚醒;聲音朝向相同的情況下,可以讓距離更近的先喚醒。這在如今大多數(shù)智能設(shè)備都具備語音喚醒功能情況下,有較大的商用價值。
依圖科技則是語音識別、NLP、聲紋識別間距的人工智能公司,目前依圖結(jié)合自身對企業(yè)級和公共級市場的服務(wù)經(jīng)驗,將智能語音相關(guān)技術(shù)與多應(yīng)用場景相結(jié)合,在智能家居領(lǐng)域也有不小的突破。
依圖科技基于深度學(xué)習(xí)的自然語言理解技術(shù)在過去幾年取得了長足的進步,分別在建模方式、問題描述、無監(jiān)督學(xué)習(xí)上有質(zhì)的突破,體現(xiàn)在單個任務(wù)上取得比傳統(tǒng)算法顯著更高的準確率。
總體來看,當前自然語言理解技術(shù)仍有較多難點需要解決,如算法上還需要改進建模方式,引入實體概念,增強模型的邏輯性;另外,還需要對現(xiàn)有模型進行加速使得應(yīng)用的成本更低。當前自然語言理解技術(shù)逐步成熟,已被應(yīng)用于智能音箱、智能客服、翻譯、智能文檔分析等多個場景。
但從智能語音市場來看,近些年來國內(nèi)相關(guān)市場持續(xù)穩(wěn)定增長,需求旺盛,據(jù)中國語音產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)顯示,2021年中國智能語音產(chǎn)業(yè)市場規(guī)模將達到285億元,預(yù)計同比增長44%。
數(shù)據(jù)來源:沙利文資訊
如果從網(wǎng)絡(luò)來區(qū)分,語音控制通常分為兩種,一種為離線語音,另一種為在線語音。
所謂離線語音,也被稱為本地語音,顧名思義便是儲存在本地設(shè)備中的固定命令詞,這種命令詞匯通常比較簡短,方便用于喚醒與控制。
相比在線語音,離線語音的優(yōu)勢在于無需聯(lián)網(wǎng),不需要后臺服務(wù)器,響應(yīng)快速,低延時。低成本、低功耗、體積小,支持多樣化命令詞定制開發(fā)等都是離線語音的優(yōu)勢,同時為了保證能夠成功喚醒命令詞,相比在線語音,其語音識別率會有相應(yīng)的降低。不過盡管如此,如今的離線語音識別率已經(jīng)達到了95%以上。
當然,離線語音的劣勢也在于命令詞比較固定,采用離線語音只不過是將傳統(tǒng)的控制方式改為語音操控,但如果要真正做到人機交互的程度,還遠遠不夠。
并且相比在線方案,離線語音的開發(fā)周期偏久,因為量產(chǎn)的離線語音產(chǎn)品都需要重新錄詞并進行訓(xùn)練。
這時候就體現(xiàn)出在線語音的優(yōu)勢,不再受到命令詞長度和條數(shù)的限制,廠商開發(fā)也比較方便,市場方案有很多的選擇。
這也意味著用戶可以用更加豐富的詞匯與設(shè)備進行交互,而不只是局限在幾個固定的命令詞上。
不過相應(yīng)地,由于需要聯(lián)網(wǎng),在線語音對于網(wǎng)絡(luò)要求較高,同時響應(yīng)速度也相對較慢,并且體積也相對較大,成本較高,這都是目前智能在線語音的一些弊端。
從目前情況來看,智能語音在語音識別率上已經(jīng)有了長足的進步,但這項技術(shù)背后涉及的聲學(xué)研究、模式識別研究、通用NLP研究以及垂直場景的深度語義理解等還遠遠沒有達到完善的地步。智能語音在交互體驗、使用效果、場景性優(yōu)化等方面還需要持續(xù)優(yōu)化。
國內(nèi)也有數(shù)家在智能語音方面較為優(yōu)秀的企業(yè),如科大訊飛已經(jīng)是國內(nèi)智能語音的代表企業(yè),在實時語音翻譯上走在了行業(yè)的前列。
還有如搜狗,從2012年開始在輸入法與地圖上加入語音輸入功能,通過多年用戶大數(shù)據(jù)的沉淀與積累,搜狗提升了用戶日常生活中表達、傳遞信息的效率,用軟硬件結(jié)合起來形成商業(yè)閉環(huán)。
云知聲也在2012年將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音識別系統(tǒng),在那時,云知聲已經(jīng)建立起完整的人工智能語音技術(shù)體系,實現(xiàn)對核心技術(shù)的自主可控,并開始人工智能語音技術(shù)商業(yè)化落地的早期探索。
在產(chǎn)品上,云知聲也具備了使智能家居擁有3-5畝的高精度語音控制能力。
圖源:云知聲IPO招股書
思必馳同樣是國內(nèi)專業(yè)的對話式人工智能平臺公司,創(chuàng)立于2007年,目前不僅在語音識別率上有了大幅提升,同時在識別精度上也有了新的進展。比如其最新推出的直面喚醒技術(shù),可以模擬真人使用情況,優(yōu)先朝向結(jié)合距離選擇被喚醒的設(shè)備。
距離相同情況下,聲音朝向的位置先喚醒;聲音朝向相同的情況下,可以讓距離更近的先喚醒。這在如今大多數(shù)智能設(shè)備都具備語音喚醒功能情況下,有較大的商用價值。
依圖科技則是語音識別、NLP、聲紋識別間距的人工智能公司,目前依圖結(jié)合自身對企業(yè)級和公共級市場的服務(wù)經(jīng)驗,將智能語音相關(guān)技術(shù)與多應(yīng)用場景相結(jié)合,在智能家居領(lǐng)域也有不小的突破。
依圖科技基于深度學(xué)習(xí)的自然語言理解技術(shù)在過去幾年取得了長足的進步,分別在建模方式、問題描述、無監(jiān)督學(xué)習(xí)上有質(zhì)的突破,體現(xiàn)在單個任務(wù)上取得比傳統(tǒng)算法顯著更高的準確率。
總體來看,當前自然語言理解技術(shù)仍有較多難點需要解決,如算法上還需要改進建模方式,引入實體概念,增強模型的邏輯性;另外,還需要對現(xiàn)有模型進行加速使得應(yīng)用的成本更低。當前自然語言理解技術(shù)逐步成熟,已被應(yīng)用于智能音箱、智能客服、翻譯、智能文檔分析等多個場景。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
家居控制
+關(guān)注
關(guān)注
0文章
12瀏覽量
8750 -
無線智能家居
+關(guān)注
關(guān)注
2文章
14瀏覽量
7551
發(fā)布評論請先 登錄
相關(guān)推薦
智能消毒柜語音識別芯片推動智能家居技術(shù)發(fā)展
智能消毒柜語音識別芯片,作為現(xiàn)代智能家居技術(shù)的重要一環(huán),其背后蘊含著豐富的技術(shù)背景與廣泛的功能應(yīng)用。這款芯片,如同一個敏銳的聽覺器官,時刻準
AI加速智能家居分布式語音技術(shù)發(fā)展
電子發(fā)燒友網(wǎng)報道(文/黃山明)生成式AI的出現(xiàn),讓人與機器的交流將變得更加自然,也在不斷推動分布式語音入口在智能家居中的智能化水平升級,讓家庭自動化和人機交互變得更加自然、便捷和高效,能夠讓用戶在家
語音數(shù)據(jù)集在智能家居安全系統(tǒng)中的應(yīng)用與挑戰(zhàn)
提供了更加便捷和人性化的交互方式。本文將詳細介紹語音數(shù)據(jù)集在智能家居安全系統(tǒng)中的應(yīng)用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。
語音數(shù)據(jù)集在智能家居中的應(yīng)用與挑戰(zhàn)
隨著科技的快速發(fā)展,智能家居已經(jīng)逐漸走進人們的生活。語音數(shù)據(jù)集在智能家居中發(fā)揮著重要的作用,為家居設(shè)備提供了
情感語音識別:技術(shù)發(fā)展與跨文化應(yīng)用
一、引言 情感語音識別是人工智能領(lǐng)域的前沿研究領(lǐng)域,它通過分析人類語音中的情感信息,實現(xiàn)更加智能化和個性化的人機交互。隨著技術(shù)的不斷
語音識別技術(shù)在智能家居控制系統(tǒng)中的應(yīng)用與前景
隨著智能家居技術(shù)的不斷發(fā)展,人們對于家居環(huán)境的智能化控制需求也越來越高。語音識別
語音識別技術(shù)在智能家居領(lǐng)域的創(chuàng)新應(yīng)用與挑戰(zhàn)
隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,智能家居成為了人們?nèi)粘I畹闹匾糠帧?b class='flag-5'>語音識別技術(shù)作為
語音模塊能給智能家居風(fēng)扇帶來什么?
離線語音模塊是一種基于語音識別技術(shù)的設(shè)備,它可以在不需要網(wǎng)絡(luò)連接的情況下進行語音識別。這種模塊具有高效、便捷的特點,被廣泛應(yīng)用于各種智能家居
語音識別技術(shù)在智能家居領(lǐng)域的應(yīng)用與前景
一、引言 隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,智能家居成為了人們?nèi)粘I畹闹匾糠帧?b class='flag-5'>語音識別技術(shù)
語音識別技術(shù)在智能家居中的應(yīng)用與挑戰(zhàn)
隨著人工智能和物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能家居成為了人們生活中不可或缺的一部分。語音識別技術(shù)作為一
語音識別技術(shù)的行業(yè)應(yīng)用與發(fā)展趨勢
助手是一種廣受歡迎的語音識別技術(shù)應(yīng)用,它能夠理解用戶的聲音指令,并執(zhí)行相應(yīng)的操作。例如,蘋果的Siri、谷歌助手等智能助手應(yīng)用,為用戶提供了便捷的交互方式。 2.智能家居:
離線語音與IoT結(jié)合:智能家居發(fā)展新增長點
/BLE芯片,成本更低,使得智能化更加經(jīng)濟實惠。
7、可采用啟英泰倫私有云,保障數(shù)據(jù)隱私和安全,讓用戶享受智能科技帶來的便利與安心。
8、個性化體驗:IoT和離線語音控制結(jié)合可以提供個性化的家
發(fā)表于 10-17 11:06
語音識別技術(shù):現(xiàn)狀、挑戰(zhàn)與未來發(fā)展
一、引言 語音識別技術(shù)是一種將人類語音轉(zhuǎn)化為計算機可讀文本的技術(shù),它在許多領(lǐng)域都有廣泛的應(yīng)用,如智能助手、
評論