0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小米聲學(xué)語音技術(shù)已經(jīng)實(shí)現(xiàn)全面自研,4項(xiàng)技術(shù)實(shí)現(xiàn)了業(yè)內(nèi)突破

我快閉嘴 ? 來源:與非網(wǎng) ? 作者:與非網(wǎng) ? 2020-06-24 14:52 ? 次閱讀

小米的聲學(xué)語音技術(shù)目前已經(jīng)實(shí)現(xiàn)全面自研,并在自研部分領(lǐng)域持續(xù)領(lǐng)先,聲學(xué)語音技術(shù)已迎來全新時代。

據(jù)了解,小米聲學(xué)語音的 4 項(xiàng)技術(shù)實(shí)現(xiàn)了業(yè)內(nèi)突破,分別是語音交互實(shí)現(xiàn)“情感化”、AIoT 放音技術(shù)升級、就近喚醒全新升級、兩麥陣列喚醒新策略。

語音交互實(shí)現(xiàn)“情感化”:小米 AI 實(shí)驗(yàn)室在“情感數(shù)據(jù)量有限”的前提下,通過不同聲學(xué)模型、不同聲碼器組合最終上線自然、擬人效果的情感 TTS(Text to speech,人工語音合成),成為業(yè)內(nèi)首家情感化 TTS 大規(guī)模落地的企業(yè)。

此次小米小愛同學(xué) Art 全面支持情感化語音交互,基于有限但類型不同的情感音頻數(shù)據(jù)(如開心、關(guān)心、害羞、驚訝等),通過不同技術(shù)訓(xùn)練并迭代聲學(xué)模型,最終支持情感 TTS 合成并實(shí)現(xiàn)“小愛同學(xué)”音色情感化、擬人化。未來,小米語音將升級此技術(shù)——支持情感 TTS 實(shí)時合成。

AIoT 放音技術(shù)升級:首次實(shí)現(xiàn)一句話全屋同步播放相同音頻功能。據(jù)悉,小米小愛音箱 Art 是首款可以實(shí)現(xiàn)語音支持全屋播放的設(shè)備。用戶直接對小愛同學(xué)說“全屋播放 XXX”,無需提前在 App 端進(jìn)行手動設(shè)置,即可實(shí)現(xiàn)一句話語音交互。

就近喚醒全新升級:業(yè)內(nèi)首次上線跨設(shè)備關(guān)閉鬧鐘功能。此次小米小愛音箱 Art 就近喚醒全新升級,可支持跨設(shè)備關(guān)閉鬧鐘。遠(yuǎn)處的音箱鬧鐘響了,喚醒近處的音箱可以直接關(guān)閉遠(yuǎn)處的鬧鐘。此功能在業(yè)內(nèi)首次上線,小米小愛音箱 Art 也是首款支持該功能的產(chǎn)品

兩麥陣列喚醒新策略:兼顧低功耗與高性能,高效降噪,獲得干凈人聲。小米小愛音箱 Art 同步支持兩麥陣列喚醒技術(shù)。在麥克風(fēng)陣列方面,小米采用兩麥盲源分離降噪前端,通過盲源分離、降噪、回聲消除等技術(shù),在多聲源的嘈雜環(huán)境、音箱自身播放音樂時,都能結(jié)合語音增強(qiáng)技術(shù),消除噪音的強(qiáng)干擾,獲得干凈、準(zhǔn)確的人聲音頻。

目前,小米 IoT 平臺連接的智能硬件數(shù)已達(dá)到 2.5 億臺,音箱出貨量已經(jīng)達(dá)到 2200 萬臺。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音箱
    +關(guān)注

    關(guān)注

    36

    文章

    635

    瀏覽量

    67486
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29014

    瀏覽量

    266470
  • 小米
    +關(guān)注

    關(guān)注

    69

    文章

    14277

    瀏覽量

    143098
收藏 人收藏

    評論

    相關(guān)推薦

    樂鑫聲學(xué)前端算法:打造智能語音交互新體驗(yàn),ESP32-S3 SOC技術(shù)方案

    隨著人工智能技術(shù)的不斷進(jìn)步,智能語音設(shè)備正逐漸成為我們生活中不可或缺的一部分。然而,在嘈雜的現(xiàn)實(shí)環(huán)境中,如何實(shí)現(xiàn)清晰、準(zhǔn)確的語音交互,一直是業(yè)界面臨的一大挑戰(zhàn)。今天,我們要介紹的是樂鑫
    的頭像 發(fā)表于 08-03 08:04 ?588次閱讀
    樂鑫<b class='flag-5'>聲學(xué)</b>前端算法:打造智能<b class='flag-5'>語音</b>交互新體驗(yàn),ESP32-S3 SOC<b class='flag-5'>技術(shù)</b>方案

    據(jù)新華社等多家媒體報道!暢能達(dá)科技實(shí)現(xiàn)散熱技術(shù)重大突破!

    據(jù)新華社等多家媒體報道!暢能達(dá)科技實(shí)現(xiàn)散熱技術(shù)重大突破 由 廣東暢能達(dá)科技發(fā)展有限公司 自主研發(fā)的高熱流密度散熱相變封裝基板,其散熱性能遠(yuǎn)遠(yuǎn)超過現(xiàn)有的金剛石鋁和金剛石銅。該技術(shù)可廣泛運(yùn)
    發(fā)表于 05-29 14:39

    微軟AI大模型即將問世

    微軟正悄然醞釀一項(xiàng)重大技術(shù)突破,據(jù)內(nèi)部消息人士透露,公司正全力訓(xùn)練一款名為“MAI-1”的人工智能大模型。這款模型備受期待,其規(guī)模龐大,
    的頭像 發(fā)表于 05-07 14:46 ?398次閱讀

    **十萬級口語識別,離線自然說技術(shù),讓智能照明更懂你**

    隨著人工智能技術(shù)的普及,智能家居設(shè)備開始走進(jìn)千家萬戶。而智能照明系統(tǒng)作為其不可或缺的一部分,占據(jù)著舉足輕重的地位。 所謂智能照明,就是通過語音、手機(jī)/平板應(yīng)用程序、無線面板或遙控技術(shù)實(shí)現(xiàn)
    發(fā)表于 04-29 17:09

    2024年小米汽車產(chǎn)業(yè)鏈分析及新品上市全景洞察報告

    2024年小米汽車產(chǎn)業(yè)鏈分析及新品上市全景洞察報告 *附件:小米汽車全面洞察報告.pdf 本文主要介紹小米汽車在市場中的布局和優(yōu)勢,以及其
    發(fā)表于 03-29 13:46

    真是變天!華為存儲曝光

    據(jù)百能云芯電子元器件商城了解,華為近日曝光了一項(xiàng)顛覆性的存儲技術(shù),據(jù)報道,這項(xiàng)被稱為“磁電”存儲技術(shù)的創(chuàng)新將徹底改變數(shù)據(jù)存儲行業(yè)的格局。
    的頭像 發(fā)表于 03-21 19:06 ?236次閱讀

    海信發(fā)布星海大模型,引領(lǐng)AI技術(shù)突破

    在近日舉行的AWE 2024盛會上,海信集團(tuán)憑借其深厚的研發(fā)實(shí)力,正式發(fā)布的星海大模型。這款大模型不僅實(shí)現(xiàn)傳統(tǒng)指令式語言對話的流暢交
    的頭像 發(fā)表于 03-19 11:30 ?827次閱讀

    知語云全景監(jiān)測技術(shù):現(xiàn)代安全防護(hù)的全面解決方案

    隨著信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)安全問題日益突出,企業(yè)和個人對安全防護(hù)的需求也越來越迫切。在這個背景下,知語云全景監(jiān)測技術(shù)應(yīng)運(yùn)而生,為現(xiàn)代安全防護(hù)提供一個全面而高效的解決方案。 知語云全
    發(fā)表于 02-23 16:40

    那些杠鴻蒙的現(xiàn)在怎么樣?

    Android的道路的,好比現(xiàn)在的小米澎湃系統(tǒng)亦是如此。 而作為國家主推的鴻蒙系統(tǒng),現(xiàn)在展現(xiàn)出未來大好的局面。先后推出4.0、星河版。其中最新星河版已經(jīng)全面對開發(fā)者開發(fā)申請。 1、鴻蒙系統(tǒng)采用全棧
    發(fā)表于 02-16 22:03

    連“ALR Connected”新技術(shù)發(fā)布!實(shí)現(xiàn)低功耗遠(yuǎn)距離無線通信

    連科技全新的AlinketLongRangeConnectivity(“簡稱ALRConnected”)技術(shù)是對無線通信技術(shù)的革命性創(chuàng)新,在實(shí)現(xiàn)高速、穩(wěn)定的遠(yuǎn)距離通信的同時,將能耗降
    的頭像 發(fā)表于 01-17 08:16 ?745次閱讀
    <b class='flag-5'>自</b>連“ALR Connected”新<b class='flag-5'>技術(shù)</b>發(fā)布!<b class='flag-5'>實(shí)現(xiàn)</b>低功耗遠(yuǎn)距離無線通信

    小米汽車技術(shù)發(fā)布會 小米在電機(jī)電控領(lǐng)域已申請155項(xiàng)專利

    小米汽車技術(shù)發(fā)布會 小米在電機(jī)電控領(lǐng)域已申請155項(xiàng)專利 小米汽車技術(shù)發(fā)布會正在緊張進(jìn)行中,雷軍
    的頭像 發(fā)表于 12-28 14:23 ?748次閱讀
    <b class='flag-5'>小米</b>汽車<b class='flag-5'>技術(shù)</b>發(fā)布會 <b class='flag-5'>小米</b>在電機(jī)電控領(lǐng)域已申請155<b class='flag-5'>項(xiàng)</b>專利

    uPOL封裝技術(shù)如何實(shí)現(xiàn)高電流密度供電突破

    uPOL封裝技術(shù)如何實(shí)現(xiàn)高電流密度供電突破
    的頭像 發(fā)表于 12-01 16:12 ?651次閱讀
    uPOL封裝<b class='flag-5'>技術(shù)</b>如何<b class='flag-5'>實(shí)現(xiàn)</b>高電流密度供電<b class='flag-5'>突破</b>

    離線語音識別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語音識別技術(shù)成為了一項(xiàng)備受矚目的創(chuàng)新。離線語音識別技術(shù)能夠?qū)⑷说?b class='flag-5'>語
    發(fā)表于 11-24 17:41

    iQOO首款電競芯片Q1,實(shí)現(xiàn)真正低時延插幀技術(shù)

    iQOO Q1芯片采用了新一代超分技術(shù),使用并行渲染算法,采樣效率比前一代提升了4倍,執(zhí)行效率提升30%,同時功耗降低了10%。iQOO 12系列手機(jī)
    的頭像 發(fā)表于 11-08 16:36 ?3623次閱讀

    基于SOPC技術(shù)實(shí)現(xiàn)語音處理系統(tǒng)的設(shè)計方法

    電子發(fā)燒友網(wǎng)站提供《基于SOPC技術(shù)實(shí)現(xiàn)語音處理系統(tǒng)的設(shè)計方法.pdf》資料免費(fèi)下載
    發(fā)表于 10-26 14:34 ?0次下載
    基于SOPC<b class='flag-5'>技術(shù)</b><b class='flag-5'>實(shí)現(xiàn)</b>的<b class='flag-5'>語音</b>處理系統(tǒng)的設(shè)計方法