0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一站式自動優(yōu)化,思必馳"千語千訓(xùn)"系統(tǒng)高效迭代語音識別模型

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2022-08-30 17:16 ? 次閱讀

“因為啥子不可以辦銀行卡?”

——語音識別結(jié)果:“為啥不能辦理銀行卡?”

隨著科技的發(fā)展,語音識別技術(shù)不斷迭代,逐漸由普通話識別向多語種、方言以及混合語言識別的方向發(fā)展,語音識別效果顯著提升,滿足了多樣化的場景需求。

目前業(yè)界普遍采用的語音識別系統(tǒng)的核心主要由聲學(xué)模型、語言模型、解碼器三部分構(gòu)成。語音識別的效果,離不開語音廠商對聲學(xué)模型、語言模型的不斷更新優(yōu)化。

“千語千訓(xùn)”是一套融合算法技術(shù)與工程服務(wù)創(chuàng)新的語音識別自動優(yōu)化系統(tǒng),可以將原本由算法工程師承擔(dān)的工作以自動化執(zhí)行的方式完成,一方面可以將算法人員從重復(fù)性的工作中解放出來,另一方面,可提高語音識別效果、降低模型更新周期和成本。

思必馳依托于“千語千訓(xùn)”系統(tǒng),可以實現(xiàn)算法人員0人工介入,自動更新模型,實現(xiàn)語音識別系統(tǒng)更新頻率從周級到天級的提升。

自動化更新,三大法寶助力語音識別技術(shù)升級

影響語音識別效果的外部因素主要為說話人、周圍環(huán)境和收音設(shè)備,內(nèi)在因素則是前端的信號處理、特征提取、聲學(xué)模型、語言模型,語音識別探索之路上,離不開對聲音模型、語言模型等模塊的訓(xùn)練優(yōu)化。

1)主動學(xué)習(xí)技術(shù),有效篩選數(shù)據(jù)

目前,語音識別建模的主流方法是基于深度學(xué)習(xí)的有監(jiān)督數(shù)據(jù)建模,這需要大量帶標注的數(shù)據(jù)供模型進行學(xué)習(xí)。

隨著海量訓(xùn)練數(shù)據(jù)的應(yīng)用,語音識別系統(tǒng)已經(jīng)能夠較準確的識別常見語音。但對于“元宇宙”“數(shù)字藏品”“栓Q”等新興領(lǐng)域以及復(fù)雜環(huán)境下的語音,準確率尚待進一步提高。目前,業(yè)內(nèi)常用的優(yōu)化方法是及時將這類識別準確率不高的語音進行標注用以訓(xùn)練模型,那么,該如何在海量的線上數(shù)據(jù)中尋找此類具有訓(xùn)練價值的數(shù)據(jù)呢?

思必馳采用基于主動學(xué)習(xí)數(shù)據(jù)篩選的方法來解決上述問題。通過自監(jiān)督學(xué)習(xí)、置信度和神經(jīng)網(wǎng)絡(luò)預(yù)測等技術(shù)結(jié)合的方法,快速定位更具價值的數(shù)據(jù),經(jīng)專家標注后用于模型的優(yōu)化迭代。這種方法既減少了優(yōu)化模型所需的數(shù)據(jù)量,降低了成本,又提升了語音識別效果。

2)混合監(jiān)督語音識別模型,低成本、高效益

語音識別模型準確率的提高,需要大量的有監(jiān)督數(shù)據(jù)對模型進行優(yōu)化訓(xùn)練,但獲取此類有準確標注結(jié)果的數(shù)據(jù)費用較高,周期較長,一定程度上提高了優(yōu)化語音識別系統(tǒng)的成本。

近年來,半監(jiān)督訓(xùn)練、自監(jiān)督訓(xùn)練等技術(shù)取得了良好的研究和應(yīng)用成果,特別是在低資源識別場景中,能夠較為明顯的提升語音識別優(yōu)化效果。思必馳融合了有監(jiān)督、半監(jiān)督、自監(jiān)督等方法,提出混合監(jiān)督優(yōu)化方案,充分挖掘數(shù)據(jù)價值,持續(xù)優(yōu)化語音識別模型,獲得更好的語音識別效果。

3)一站式自動化,語音識別系統(tǒng)高頻迭代

傳統(tǒng)上,語音識別系統(tǒng)中只有熱詞和定制語言模型部分可以通過自動化手段以較高頻率進行優(yōu)化,而聲學(xué)模型等其它系統(tǒng)關(guān)鍵模塊則因為需要算法專家介入,難以高頻更新。

思必馳最新推出的“千語千訓(xùn)”自動優(yōu)化系統(tǒng),是一款融合了基于主動學(xué)習(xí)的數(shù)據(jù)篩選、自動送標、混合監(jiān)督聲學(xué)和語言模型訓(xùn)練、自動化測試和上線發(fā)布等功能模塊的集成自動化方案。

“千語千訓(xùn)”自動優(yōu)化系統(tǒng),全流程只有部分數(shù)據(jù)標注環(huán)節(jié)需要人員參與,其余流程均可以自動化完成,實現(xiàn)語音識別模型更新頻率從周級到天級的提升,及時優(yōu)化時效熱點話術(shù)和難點場景,保證模型與時俱進。

穩(wěn)扎穩(wěn)打,語音識別技術(shù)碩果累累

在語音識別技術(shù)上,思必馳獲得業(yè)內(nèi)多項肯定。

poYBAGMN1WGARDXTAABoNnUX9Ys678.png

錢彥旻團隊的成果“魯棒語音信號模式分析與識別的深度結(jié)構(gòu)化建模理論與方法”摘得吳文俊人工智能自然科學(xué)獎一等獎;思必馳-上海交大聯(lián)合團隊榮獲IWSLT 2022英中同聲傳譯冠軍;思必馳語音識別準確率高達98%(中國信息通信研究院檢測,報告編號:V21Y000005),并具有反饋速度快、快速定制、強魯棒性等優(yōu)勢。

目前,思必馳語音識別技術(shù)除可以支持中文普通話外,還可以支持川、粵等十余種方言,以及英語等多種外語,廣泛落地于車載、家居、金融、辦公等領(lǐng)域。此外,思必馳推出DUI標注訓(xùn)練一體化平臺,賦能客戶自主優(yōu)化應(yīng)用場景中的識別體驗。

時間的書頁不斷被掀開,AI發(fā)展日新月異。思必馳語音識別技術(shù)不斷邁向更準確、更豐富、更智能的道路。未來,思必馳將不斷優(yōu)化語音識別鏈路策略,進一步縮短通用語音識別模型更新周期,滿足不斷發(fā)展的業(yè)務(wù)需要,支持更多場景領(lǐng)域。

審核編輯 黃昊宇


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1696

    瀏覽量

    112248
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    263

    瀏覽量

    14232
收藏 人收藏

    評論

    相關(guān)推薦

    拱墅區(qū)智慧照明產(chǎn)業(yè)質(zhì)量基礎(chǔ)設(shè)施“一站式” 服務(wù)平臺于羅萊迪正式設(shè)立

    杭州市拱墅區(qū)市場監(jiān)管局大力推進智慧照明產(chǎn)業(yè)質(zhì)量基礎(chǔ)設(shè)施“一站式”服務(wù)平臺建設(shè),并落地羅萊迪,為產(chǎn)業(yè)集群、產(chǎn)業(yè)鏈、企業(yè)質(zhì)量升級提供“一站式”服務(wù)。
    的頭像 發(fā)表于 09-20 10:41 ?69次閱讀
    拱墅區(qū)智慧照明產(chǎn)業(yè)質(zhì)量基礎(chǔ)設(shè)施“<b class='flag-5'>一站式</b>” 服務(wù)平臺于羅萊迪<b class='flag-5'>思</b>正式設(shè)立

    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&amp;amp;quot;進&amp;amp;quot;

    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&quot;進&quot;
    的頭像 發(fā)表于 07-15 09:53 ?228次閱讀
    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;進&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    特應(yīng)用 | 模型鏈接應(yīng)俱全:IC多類別視覺檢測一站式解決方案

    高精度IC制造工藝需要對產(chǎn)品進行全方位檢測以保證工藝質(zhì)量過關(guān)。友特 Neuro-T 通過調(diào)用平臺的流程圖功能,搭建多類深度學(xué)習(xí)模型,形成了一站式的視覺檢測解決方案。
    的頭像 發(fā)表于 06-18 18:19 ?371次閱讀
    友<b class='flag-5'>思</b>特應(yīng)用 | <b class='flag-5'>模型</b>鏈接<b class='flag-5'>一</b>應(yīng)俱全:IC多類別視覺檢測<b class='flag-5'>一站式</b>解決方案

    CCS集成母排一站式測試

    CCS集成母排,一站式測試,多點耐壓測試,焊接小電阻測試,NTC電阻測試,瞬間短斷路測試
    的頭像 發(fā)表于 06-04 20:00 ?711次閱讀
    CCS集成母排<b class='flag-5'>一站式</b>測試

    EMC與EMI一站式解決方案:高效電磁兼容性與干擾防護

    深圳比創(chuàng)達|EMC與EMI一站式解決方案:高效電磁兼容性與干擾防護
    的頭像 發(fā)表于 05-16 09:50 ?330次閱讀
    EMC與EMI<b class='flag-5'>一站式</b>解決方案:<b class='flag-5'>高效</b>電磁兼容性與干擾防護

    深圳比創(chuàng)達電子|EMI一站式解決方案:提升企業(yè)電磁兼容性的路徑.

    和個人在應(yīng)用EMI一站式解決方案時,需要密切關(guān)注市場動態(tài)和技術(shù)發(fā)展,及時調(diào)整和優(yōu)化解決方案。 總之,隨著電子技術(shù)的不斷進步和市場需求的不斷變化,EMI一站式解決方案將繼續(xù)朝著更高效、更
    發(fā)表于 05-08 11:51

    機房建設(shè)一站式整體解決方案

    紛紛轉(zhuǎn)向種全面而高效的建設(shè)模式----機房建設(shè)一站式整體解決方案。 、一站式方案:從規(guī)劃到運維的全程服務(wù) 這種整體式的服務(wù)模式覆蓋了機房
    的頭像 發(fā)表于 04-02 16:15 ?286次閱讀

    科沃斯掃地機器人通過TüV萊茵&amp;quot;防纏繞&amp;quot;和&amp;quot;高效邊角清潔&amp;quot;認證

    3月15日,在2024中國家電及消費電子博覽會(AWE)上,國際獨立第三方檢測、檢驗和認證機構(gòu)德國萊茵TüV大中華區(qū)(簡稱&quot;TüV萊茵&quot;)為科沃斯兩款掃地機器人(型號:DDX14、DDX11)
    的頭像 發(fā)表于 03-17 10:49 ?725次閱讀

    聳智科技加入元腦生態(tài),將打造基于&amp;quot;源2.0&amp;quot;大模型的智能客服

    、數(shù)字員工等智能客服應(yīng)用,幫助金融、醫(yī)療、通信等行業(yè)客戶提高服務(wù)效率、提升智能交互體驗、規(guī)范服務(wù)流程、降低人力成本,推動行業(yè)智能化應(yīng)用的轉(zhuǎn)型與升級。 聳智科技致力于為客戶提供實用的AIGC大模型一站式服務(wù)平臺,已為上百家知名保險公司、商業(yè)銀
    的頭像 發(fā)表于 03-11 07:04 ?297次閱讀

    一站式晶圓三維檢測機WM系列

    優(yōu)可測一站式晶圓三維檢測機WM系列:一站式檢測晶圓粗糙度、臺階高度、研磨紋路、切割深度、字符深度等,支持客制化定制。
    發(fā)表于 03-05 14:14 ?2次下載

    中創(chuàng)新航榮獲逸動科技2023年度&amp;quot;優(yōu)秀戰(zhàn)略合作伙伴獎&amp;quot;

    近日,中創(chuàng)新航憑借電動船舶領(lǐng)域領(lǐng)先的技術(shù)實力、卓越的產(chǎn)品質(zhì)量、持續(xù)穩(wěn)定的交付能力以及優(yōu)質(zhì)高效的服務(wù),榮獲逸動科技2023年度&quot;優(yōu)秀戰(zhàn)略合作伙伴獎&quot;。
    的頭像 發(fā)表于 02-29 13:51 ?366次閱讀

    為什么選擇一站式PCBA加工?PCBA一站式服務(wù)的優(yōu)勢

    一站式PCBA智造廠家今天為大家講講PCBA一站式服務(wù)是什么?為什么選擇PCBA一站式服務(wù)。隨著科技的不斷更新和發(fā)展,越來越多的公司開始選擇PCBA一站式服務(wù)。那么,為什么越來越多的客
    的頭像 發(fā)表于 01-03 08:49 ?521次閱讀

    DFM-2大模型助力構(gòu)建產(chǎn)業(yè)新生態(tài)

    近日,DFM-2大模型通過《生成人工智能服務(wù)管理暫行辦法》備案,成為江蘇省本土人工智能首個通過大
    的頭像 發(fā)表于 12-20 13:35 ?731次閱讀

    :離線語音識別芯片簡介

    ?此時如果你有個智能語音風(fēng)扇,你只需要說句打開風(fēng)扇即可。關(guān)于語音識別這個功能,市面上有多家公司開發(fā)有關(guān)離線
    的頭像 發(fā)表于 10-19 18:03 ?550次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>:離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片簡介

    AISpeech 語音算法與芯片的完美結(jié)合 人機交互

    TH1520是深聰智能(旗下的芯片設(shè)計企業(yè))根據(jù)語音交互市場及算法的需求及發(fā)展方向,自主定義開發(fā)的 “芯片+算法” 的人工智能人機語音
    的頭像 發(fā)表于 10-18 14:43 ?1996次閱讀
    AISpeech <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b> <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b><b class='flag-5'>語音</b>算法與芯片的完美結(jié)合 人機交互