0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

離線自然說,無需記固定喚醒詞也能語音控制設備!

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-04-29 09:12 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)離線語音識別是指不需要依賴網(wǎng)絡,在本地設備實現(xiàn)語音識別的過程,通常以端側(cè)AI語音芯片作為載體來進行數(shù)據(jù)的采集、計算和決策。

離線語音識別技術在諸多領域都具有廣泛的應用前景,如用戶可以通過語音控制智能家居設備,實現(xiàn)燈光、空調(diào)、電視等的自動化操作;在醫(yī)療設備領域,離線語音識別技術可以用于控制輪椅、病床等設備,為行動不便的患者提供便利;在車載系統(tǒng)中,離線語音識別技術可以實時識別駕駛者的語音指令,確保駕駛安全。

但是語音芯片的存儲空間有限,通過傳統(tǒng)的語音算法技術,最多也只能存儲數(shù)百條詞條,導致用戶只能使用固定的詞條來控制設備,大大降低了用戶與設備之間的語音交互體驗。

離線自然說,解決當前語音識別痛點

近日,在啟英泰倫最新語音方案發(fā)布及技術交流會上,該公司技術支持總監(jiān)孫振奎介紹了啟英泰倫推出的一種輕量級NLP技術——離線自然說。

它的實現(xiàn)原理是,通過語義協(xié)議和語音識別構(gòu)圖結(jié)合,在進行語音識別同時對指令包含的意圖和槽位進行解析(NLU),實現(xiàn)設備功能語音指令的理解和泛化。并且支持同時生成控制指令和反饋播報,完成識別、理解、播報的閉環(huán)。通過矩陣分解、權重共享等技術,保持低資源提高建模能力,支持說法突破萬種。

據(jù)孫振奎介紹,離線自然說,可以很好地解決當前語音識別的諸多痛點,如需要聯(lián)網(wǎng)、不會說、記不住詞、反應慢、詞條太少、普通話不標準、經(jīng)常掉線等。離線自然說的價值在于,用戶無需記憶固定詞條,只需知道功能和喚醒詞,即可語音控制設備,真正做到了自然、方便的人機交互。

59733f9a1f0549c1af9b402e7c29b478~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=7XZFUiUWMrX4sOJACwtFzmrDWlM%3D

具體來看,用戶如果通過傳統(tǒng)離線語音交互來打開空調(diào),他只能說:“打開空調(diào)”。而如果通過離線自然說來打開空調(diào),他可以說:“打開空調(diào)”、“幫我開空調(diào)”、“空調(diào)打開吧”、“開一下空調(diào)”、“我要開空調(diào)”、“空調(diào)開啟”、“啟動空調(diào)”、“吹空調(diào)”……

啟英泰倫認為,相對于手機APP/小程序、紅外遙控器、觸摸按鍵等傳統(tǒng)控制方式而言,自然化的語音交互更便捷、更高效、更人性化。

目前,啟英泰倫離線自然說方案,已經(jīng)在在風扇、吸頂燈、空調(diào)、茶吧機、油煙機、空調(diào)伴侶、窗簾電機、晾曬機、風扇燈等上完成應用,在風扇、取暖器上的應用已經(jīng)非常成熟。另外,離線自然說方案在洗衣機、馬桶、按摩椅、浴霸、微波爐等上的應用也在開發(fā)中。

不斷迭代的語音芯片及全鏈條語音算法技術

啟英泰倫是一家集語音芯片、語音算法、應用方案、開發(fā)平臺于一體的語音解決方案供應商。其芯片產(chǎn)品已歷經(jīng)三次大迭代,四次小迭代,共計推出15款型號的智能語音芯片,涵蓋AI語音芯片,AI語音Wi-Fi芯片,AI語音BLE芯片,形成系列化的芯片產(chǎn)品布局。

公司芯片產(chǎn)品現(xiàn)已廣泛應用于智慧家居家電、智慧養(yǎng)老、智慧穿戴、智慧醫(yī)療、智慧酒店、智慧安防、智慧教育、智慧汽車和機器人等領域,服務客戶超過5000家。

從發(fā)展歷程來看,2016年,啟英泰倫首度提出腦神經(jīng)網(wǎng)絡處理器(BNPU),發(fā)布全球首款AI語音芯片CI1006;2017年AI語音芯片進入家電巨頭美的供應體系,支持英文語音識別;2018年發(fā)布1.5代AI語音芯片,性能不變,成本降低30%;2019年發(fā)布高性價比2代AI語音芯片(搭載BNPU V2),上線語音AI開發(fā)平臺;2020年發(fā)布2.5代AI語音芯片,成本更低,支持日文等小語種語音識別;

2021年離線NLP算法取得突破,深度人聲分離算法取得突破;2022年量產(chǎn)3代AI語音芯片、AI語音Wi-Fi Combo芯片(搭載BNPU V3),算法算力登上新臺階;2023年AIOT方案成熟,推出AI語音BLE芯片Cl231,預推出語音MCU芯片Cl132。

啟英泰倫第三代CI13系列是一款極具性價比的離線AI語音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型號,據(jù)稱其年裝機達數(shù)千萬臺。

CI13系列基于啟英泰倫自研BNPU 3.0,系統(tǒng)主頻最高可達240MHz,內(nèi)置高達640KByte SRAM,集成PMU電源管理單元和RC振蕩器,集成雙通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外圍控制接口。芯片僅需少量電阻電容等外圍器件就可以實現(xiàn)各類智能語音產(chǎn)品硬件方案,性價比極高。

e98fe0f9a3254f6e9e7fce530e7e9bad~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=ApbzjtogJXReJM4ZkHv4zWbIkBY%3D

CI13系列具有強大的自然語言交互能力,70dB噪聲下,可以做到85%識別率及90%喚醒率(降噪模式),命令詞數(shù)支持10001+詞條,支持離線自然說。

在語音算法上,啟英泰倫擁有完全自主知識產(chǎn)權的語音交互技術鏈條,包括語音識別、語音增強、深度降噪、回聲消除、低功耗喚醒、本地語義理解、聲紋識別、本地命令詞自學習等語音算法。

此次交流會上,孫振奎還介紹了啟英泰倫的多個語音算法。如,聲紋識別,基于特定詞條的聲紋識別,可以通過注冊聲紋來區(qū)分講話人,從而提供定制化的服務,如場景1:注冊成人聲紋,防止小孩不當操作導致危險;場景2:不同的人說“打開空調(diào)”,自動設置為不同人喜歡的模式,溫度,檔位等。

男女性別識別,基于聲音特征,區(qū)分男女性別,進行不同的定制化功能開發(fā),如識別到性別后,進行不同聲音的播放;部分產(chǎn)品對性別有要求的,可以進行性別識別并進行個性化展示:例如智能馬桶的洗潔方式。

特定聲音檢測,如鼾聲識別:可用于智能床墊,智能枕頭;嬰兒哭聲識別:嬰兒監(jiān)護產(chǎn)品,嬰兒搖搖床等。

寫在最后

用過語音控制產(chǎn)品的朋友們可能都知道,目前市面上大多數(shù)產(chǎn)品都需要精準通過喚醒詞控制,然而如果一個設備一段時間沒使用,或者其中一些喚醒詞長時間沒用過,當突然需要使用的時候,會忘記這個詞,而無法順利控制設備。而且對于一些功能較復雜的設備,需要記大量的喚醒詞,稍有偏差都可能難以控制。而離線自然說算法技術,則打破了傳統(tǒng)離線語音識別的這種局限性,只需要說出大意,設備就能聽懂,互動更為高效。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    29805

    瀏覽量

    268102
  • 智能家居
    +關注

    關注

    1926

    文章

    9471

    瀏覽量

    183865
  • 語音控制
    +關注

    關注

    5

    文章

    481

    瀏覽量

    28213
  • nlp
    nlp
    +關注

    關注

    1

    文章

    484

    瀏覽量

    21987
收藏 人收藏

    評論

    相關推薦

    HLK-V20支持用戶修改喚醒和命令 海凌科語音定制后臺系統(tǒng)上線

    離線語音模塊物美價廉,單價低、開發(fā)簡單且性能良好,但是其最大的遺憾在于其語音命令喚醒
    的頭像 發(fā)表于 07-28 08:38 ?531次閱讀
    HLK-V20支持用戶修改<b class='flag-5'>喚醒</b><b class='flag-5'>詞</b>和命令<b class='flag-5'>詞</b> 海凌科<b class='flag-5'>語音</b>定制后臺系統(tǒng)上線

    十萬級口語識別,離線自然技術讓智能照明更懂你

    在智能照明中,語音控制因其便捷性而備受青睞。然而,傳統(tǒng)的離線語音控制方式存在諸多局限,如支持的詞條數(shù)量有限、用戶需要記憶
    的頭像 發(fā)表于 04-30 08:15 ?342次閱讀
    十萬級口語識別,<b class='flag-5'>離線</b><b class='flag-5'>自然</b><b class='flag-5'>說</b>技術讓智能照明更懂你

    **十萬級口語識別,離線自然技術,讓智能照明更懂你**

    固定詞條等。針對這些問題,啟英泰倫現(xiàn)已推出成熟的可應用于照明設備離線自然方案,該方案已在多家智能照明廠商最新產(chǎn)品上實現(xiàn)應用落地。 照明
    發(fā)表于 04-29 17:09

    設備更聰明 |離線自然,開啟智能語音交互新體驗!

    ,導致用戶只能使用固定的詞條來控制設備,大大降低了用戶與設備之間的語音交互體驗。用戶A通過傳統(tǒng)離線
    的頭像 發(fā)表于 01-10 08:15 ?905次閱讀
    讓<b class='flag-5'>設備</b>更聰明 |<b class='flag-5'>離線</b><b class='flag-5'>自然</b><b class='flag-5'>說</b>,開啟智能<b class='flag-5'>語音</b>交互新體驗!

    設備更聰明 |啟英泰倫離線自然,開啟智能語音交互新體驗!

    啟英泰倫新推出「離線自然」——一種輕量級的離線NLP技術。通過該技術,語音芯片可支持數(shù)萬條離線
    的頭像 發(fā)表于 01-04 11:24 ?692次閱讀
    讓<b class='flag-5'>設備</b>更聰明 |啟英泰倫<b class='flag-5'>離線</b><b class='flag-5'>自然</b><b class='flag-5'>說</b>,開啟智能<b class='flag-5'>語音</b>交互新體驗!

    離線語音識別,“自然”為產(chǎn)品賦

    相比于云端語音識別,離線語音識別技術具有更高的識別準確率和更快的響應速度。因為離線語音識別技術是在本地
    的頭像 發(fā)表于 12-11 11:20 ?434次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>識別,“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”為產(chǎn)品賦<b class='flag-5'>能</b>

    離線語音識別“自然”:掌控未來的智能交互

    離線語音識別“自然”以其獨特優(yōu)勢,為用戶帶來了前所未有的便捷與舒適體驗。它無需依賴網(wǎng)絡環(huán)境,讓用戶在任何地點、任何時間都能享受到高效的
    的頭像 發(fā)表于 12-05 10:55 ?498次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>識別“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”:掌控未來的智能交互

    離線語音自然”為智能家居賦

    離線語音技術,顧名思義,就是在沒有網(wǎng)絡連接的情況下,通過語音指令來控制智能家居設備的技術。這種技術的出現(xiàn),讓我們的家居生活變得更加
    的頭像 發(fā)表于 11-29 14:05 ?575次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”為智能家居賦<b class='flag-5'>能</b>

    離線語音自然”讓風扇更智能

    離線語音自然”技術是一種先進的語音識別技術,它能夠在沒有網(wǎng)絡連接的情況下識別用戶的語音指令,
    的頭像 發(fā)表于 11-27 10:48 ?656次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”讓風扇更智能

    離線語音識別“自然”——開啟智能生活新篇章

    離線語音識別技術允許設備在沒有網(wǎng)絡連接的情況下,通過預先錄入的語音指令來控制設備。相較于在線
    的頭像 發(fā)表于 11-25 10:26 ?702次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>識別“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”——開啟智能生活新篇章

    離線語音識別及控制是怎樣的技術?

    識別離線語音識別是指在設備本地進行語音信號的識別和轉(zhuǎn)換,而無需依賴互聯(lián)網(wǎng)連接或云端服務。具體來說,離線
    的頭像 發(fā)表于 11-24 17:44 ?1072次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>識別及<b class='flag-5'>控制</b>是怎樣的技術?

    離線語音識別及控制是怎樣的技術?

    、什么是離線語音識別  離線語音識別是指在設備本地進行語音信號的識別和轉(zhuǎn)換,而
    發(fā)表于 11-24 17:41

    離線語音識別“自然”——輕生活科技引領智能語音新時代

    離線語音識別“自然”的最大特點在于其無需聯(lián)網(wǎng)、無需APP即可實現(xiàn)
    的頭像 發(fā)表于 11-24 10:48 ?466次閱讀
    <b class='flag-5'>離線</b><b class='flag-5'>語音</b>識別“<b class='flag-5'>自然</b><b class='flag-5'>說</b>”——輕生活科技引領智能<b class='flag-5'>語音</b>新時代

    方言離線語音控制場景解決方案

    情況下,留守老人和小孩方言比較多,在雷龍離線語音模塊 自定義語音的幫助下,老人或小孩不再需要手動操作復雜的電子設備。他們只需對
    發(fā)表于 11-17 17:57