0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文看懂智能家居語音系統(tǒng)

Simon觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃山明 ? 2023-02-07 01:14 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/黃山明)多種交互方式已經(jīng)成為當下智能家居的一大特點,許多產(chǎn)品已經(jīng)不再需要手動調(diào)整和控制,更常用的是語音喚醒及操控,這也是最符合人類所習慣的交互方式。有研究表明,人類大腦皮層每天處理的信息中心,聲音信息占20%,是溝通最重要的紐帶。

但想要讓機器理解人聲,就需要在前端把聲音信號進行處理,轉(zhuǎn)化為文字或代碼的形式供機器理解,在機器生成語言之后,再用語言合成技術(shù)將這些信息轉(zhuǎn)化為聲波,從而使用人聲來進行回應。

語音系統(tǒng)的發(fā)展

語音技術(shù)的發(fā)明最早可以追溯到半個世紀之前,1952年,貝爾實驗室制作了一臺高6英尺的自動數(shù)字識別機“Audrey”,能夠識別數(shù)字0-9的發(fā)音,準確率達到90%以上。

不過這一系統(tǒng)主要基于簡單的模板匹配方法識別個體說出的孤立數(shù)字,也導致作為模板的熟人說出的語音識別會更精準,而陌生人識別率會低一些。在此之后,連續(xù)語音識別系統(tǒng)開始出現(xiàn),語音合成的參數(shù)合成法能夠生成比較自然的語音。

到二十世紀八十年代中期,IBM創(chuàng)造了一臺可以用語音控制的打字機“Tangora”,基于隱形馬爾科夫鏈模型(HMM),在信號處理技術(shù)中加入了統(tǒng)計信息,可以讓機器在聽到第一個音節(jié)時,便能夠預測單詞。到了1984年,這一系統(tǒng)在5000個詞匯量級上達到了95%的識別率。

時間來到2011年,微軟研究院將DNN技術(shù)應用在大詞匯量連續(xù)語音識別任務上,極大地降低了語音識別錯誤率。

2016年,微軟團隊已經(jīng)將語音識別的詞錯率(WER)降低至了5.9%,這一數(shù)據(jù)已經(jīng)相當于專業(yè)速錄員速記同樣一段話的水平。這標志著機器的語音識別準確率第一次達到人類水平,智能語音語言技術(shù)開始逐步落地。

到了這一階段,端到端的語音識別開始被廣泛應用,智能語音助手、智能音箱等多款應用智能語音識別的產(chǎn)品相繼落地。發(fā)展到近期,語音識別的準確率進一步提升,且針對遠場的語音識別和喚醒得到進一步發(fā)展,全雙工語音交互開始出現(xiàn)。語音識別準確率已經(jīng)達到98%以上,并且能根據(jù)實際應用痛點針對性強化。

從2011年第一款手機語音助手Siri伴隨著iPhone 4S的亮相,讓全球各大廠商紛紛入局,也標志著正式開啟智能語音應用元年,到2017年下半年開始通過開放語音生態(tài)系統(tǒng)進行產(chǎn)業(yè)內(nèi)合作,語音識別系統(tǒng)也開始向可穿戴、智能家居、車載等領(lǐng)域延伸。

據(jù)ReportLinker的預測:到2024年全球智能語音市場規(guī)模將達到215億美元,其中智慧醫(yī)療健康、智慧金融以及各類智能終端智能語音技術(shù)需求將成為主要的驅(qū)動因素。目前國內(nèi)主要智能語音服務商如百度、科大訊飛、思必馳、樂言科技、聲揚科技、竹間智能等。

智能家居語音系統(tǒng)

從整個智能家居語音系統(tǒng)來看,主要構(gòu)成為語音采集模塊、語音前級處理模塊、語音訓練模塊、語音識別模塊、語音提示模塊和輸出控制模塊等。

語音采集模塊主要起到完成信號調(diào)理和信號采集的功能,通過將語音信號轉(zhuǎn)換為語音脈沖序列,模塊中主要包括聲音與電信號的轉(zhuǎn)換、信號調(diào)理和采樣等信號處理過程。

其中采樣位數(shù)與采樣率對音頻接口而言是最重要的兩個指標,也是選擇聲音模塊的重要標準。每增加一個采樣位數(shù)相當于力度范圍增加了6dB,采樣位數(shù)越多則捕捉到的信號越精準。

而采樣頻率是指計算機每秒鐘采集多少個聲音樣本,是描述聲音文件的音質(zhì)、音調(diào),衡量聲卡、聲音文件的質(zhì)量標準。采樣率越高,計算機攝取的圖片越多,對于原始音頻的還原也越加精確。

語音前級處理模塊主要用于濾除干擾信號、提取語音特征矢量,并將提取的語音特征矢量量化為標準語音特征矢量。

而語音訓練模塊主要功能是將多次采集、提取到的語音特征標準矢量進行概率統(tǒng)計,避免語音受到人自身情緒、環(huán)境等因素引起的干擾。簡而言之,這一模塊是幫助進行語音校準,減少誤差。

語音識別模塊,顧名思義,主要通過將新采集到的語音特征矢量與語音模板庫中的語音模型進行比較,然后再判斷當前語音命令功能。而語音模板庫中,主要存儲訓練后的最佳標準語音特征矢量。

其他如語音提示模塊的主要功能為提示用戶進行相關(guān)操作的進度,以及前往完成的情況;而輸出控制模塊便是針對智能語音識別的結(jié)果來輸出相應的控制信號,比如開關(guān)、音量調(diào)節(jié)、溫度大小等。

通過這些模塊的加入,便能夠讓語音識別人機交互成為現(xiàn)實。并依照這個框架,語音識別技術(shù)已經(jīng)開始有了長遠的發(fā)展。

在近幾年的研究中,端到端的語音識別仍然是ASR( Automatic Speech Recognition)研究的熱點,同時基于Attention機制的識別系統(tǒng)已經(jīng)成為語音技術(shù)研究的主流。此外,遠場語音識別、模型結(jié)構(gòu)、模型訓練、跨語種或者多語種語音識別都成為了研究的熱門選項。

小結(jié)

到今年,語音識別技術(shù)已經(jīng)發(fā)展了71年,從最初只能識別特定單詞,到慢慢實現(xiàn)理解人的語音、語義,并參與到智能家居等落地應用中來,為人們實現(xiàn)更好的生活體驗。相比智能視覺只是針對人臉這一個變量而言,智能語音技術(shù)需要解決的是更復雜的語義、繁雜的環(huán)境、精準關(guān)鍵詞的檢測等來提升輸入效率,而這些都需要時間來完成。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能家居
    +關(guān)注

    關(guān)注

    1926

    文章

    9483

    瀏覽量

    183938
  • 語音系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    27

    瀏覽量

    12986
收藏 人收藏

    評論

    相關(guān)推薦

    STM32項目分享:智能家居(機智云)系統(tǒng)

    STM32項目分享:智能家居(機智云)系統(tǒng)
    的頭像 發(fā)表于 07-28 08:10 ?1388次閱讀
    STM32項目分享:<b class='flag-5'>智能家居</b>(機智云)<b class='flag-5'>系統(tǒng)</b>

    智能家居系統(tǒng)設計方案

    、安全的生活體驗。本案例將詳細介紹智能家居系統(tǒng)的設計方案,包括系統(tǒng)架構(gòu)、功能模塊、設備選型、應用場景以及實施步驟等方面。
    的頭像 發(fā)表于 07-23 15:28 ?1328次閱讀

    智能家居控制系統(tǒng)如何設計

    智能家居的控制系統(tǒng)設計是個復雜而細致的過程,它涉及到多個方面的考慮,包括需求分析、設備選型、系統(tǒng)架構(gòu)設計、網(wǎng)絡安全、用戶交互以及后期維護等。以下是對
    的頭像 發(fā)表于 07-23 14:45 ?1127次閱讀

    繼電器在智能家居中的應用

    隨著科技的飛速發(fā)展,智能家居已經(jīng)成為現(xiàn)代家庭不可或缺的部分。在智能家居系統(tǒng)中,繼電器作為種重要的電子控制元件,發(fā)揮著至關(guān)重要的作用。本文
    的頭像 發(fā)表于 06-24 11:36 ?803次閱讀

    智能家居控制系統(tǒng)解決方案功能

    智能家居,這現(xiàn)代科技與生活完美融合的代表,正逐漸改變著我們的居住體驗。借助計算機科技、網(wǎng)絡連接技術(shù)和簡易布線裝置,智能家居將家庭生活中的各種系統(tǒng)緊密地聯(lián)系在
    的頭像 發(fā)表于 04-09 15:58 ?573次閱讀

    壁壘林立,誰能統(tǒng)智能家居

    電子發(fā)燒友網(wǎng)報道(/黃山明)隨著技術(shù)的發(fā)展,智能家居以潤物細無聲的姿態(tài)開始慢慢的滲透到了我們的生活當中,比如智能門鎖、智能電視、智能燈具等
    的頭像 發(fā)表于 02-07 00:59 ?5150次閱讀

    AI加速智能家居分布式語音技術(shù)發(fā)展

    電子發(fā)燒友網(wǎng)報道(/黃山明)生成式AI的出現(xiàn),讓人與機器的交流將變得更加自然,也在不斷推動分布式語音入口在智能家居中的智能化水平升級,讓家庭自動化和人機交互變得更加自然、便捷和高效,
    的頭像 發(fā)表于 02-01 00:16 ?5738次閱讀

    Python智能家居系統(tǒng)代碼介紹

    Python智能家居系統(tǒng)種基于Python編程語言開發(fā)的智能家居控制系統(tǒng),在現(xiàn)代家庭中得到了越來越廣泛的應用。本文將詳細介紹Python
    的頭像 發(fā)表于 01-25 09:46 ?1224次閱讀

    智能家居控制系統(tǒng)原理與應用

    智能家居控制系統(tǒng)是指利用先進的計算機科學和通信技術(shù),將各種家居設備和系統(tǒng)進行連接和集成,實現(xiàn)智能化控制和管理的
    的頭像 發(fā)表于 01-10 11:44 ?2633次閱讀

    語音數(shù)據(jù)集在智能家居安全系統(tǒng)中的應用與挑戰(zhàn)

    隨著智能家居的普及,家庭安全問題日益受到人們的關(guān)注。智能家居安全系統(tǒng)通過整合各種傳感器和設備,實現(xiàn)對家庭環(huán)境的實時監(jiān)控和報警,保障家庭成員的安全。語音數(shù)據(jù)集在
    的頭像 發(fā)表于 12-25 09:50 ?585次閱讀

    語音數(shù)據(jù)集在智能家居中的應用與挑戰(zhàn)

    隨著科技的快速發(fā)展,智能家居已經(jīng)逐漸走進人們的生活。語音數(shù)據(jù)集在智能家居中發(fā)揮著重要的作用,為家居設備提供了語音交互的能力,提升了用戶體驗。
    的頭像 發(fā)表于 12-25 09:48 ?592次閱讀

    看懂BLE Mesh

    看懂BLE Mesh
    的頭像 發(fā)表于 12-06 16:24 ?1398次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>BLE Mesh

    離線語音“自然說”為智能家居賦能

    離線語音技術(shù),顧名思義,就是在沒有網(wǎng)絡連接的情況下,通過語音指令來控制智能家居設備的技術(shù)。這種技術(shù)的出現(xiàn),讓我們的家居生活變得更加自然、便捷。無論是想要打開燈光還是調(diào)節(jié)溫度,只需要簡單
    的頭像 發(fā)表于 11-29 14:05 ?577次閱讀
    離線<b class='flag-5'>語音</b>“自然說”為<b class='flag-5'>智能家居</b>賦能

    智能家居中無處不在的電聲元件

    電子發(fā)燒友網(wǎng)報道(/黃山明)隨著生成式AI的加入,可以預見未來的智能家居產(chǎn)品將加入越來越多的互動能力,包括但不限語音、動作等。而想要實現(xiàn)語音的互動,電聲元件必不可少。通過電聲元件,它
    的頭像 發(fā)表于 11-28 09:04 ?3282次閱讀

    網(wǎng)絡化智能家居系統(tǒng)設計案例

    電子發(fā)燒友網(wǎng)站提供《網(wǎng)絡化智能家居系統(tǒng)設計案例.zip》資料免費下載
    發(fā)表于 11-17 10:19 ?0次下載
    網(wǎng)絡化<b class='flag-5'>智能家居</b><b class='flag-5'>系統(tǒng)</b>設計案例