0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聲紋識別技術排名全球前三,快商通憑什么?

電子工程師 ? 來源:lp ? 2019-03-15 14:57 ? 次閱讀

在由美國國家標準技術署(NIST)主辦的說話人識別技術評測(Speaker Recognition Evaluation, SRE)公布的最新評測結果中,由快商通首席科學家李海洲教授及快商通聲紋研究院領銜的I4U團隊獲得綜合成績第三名的好成績,在大中華區(qū)參賽團隊中排名第一。

lNIST SRE:國際最權威、標準最嚴、影響力最大的聲紋識別技術評測

SRE 2018 是由NIST(National Institute of Standards and Technology,美國國家標準與技術研究院,直屬美國商務部)承辦的國際上規(guī)模最大、標準最嚴、最權威的聲紋識別技術評測,為全球參賽研究機構提供了一個公平的統(tǒng)一測試平臺,旨在關注聲紋識別領域的核心技術問題。從1996年開始舉辦至今,參加 NIST SRE 評測的隊伍逐年增加,今年有包括麻省理工、清華大學、聲揚科技等在內的25個國家、78支隊伍參賽。

近年來,NIST SRE 的重點任務是對于現(xiàn)階段實用領域中,口語對話電話語音(CTS)的說話人檢測。

今年,除了在各種手機上錄制的CTS 之外,SRE18中的開發(fā)和測試材料還加入了IP語音(VOIP)數(shù)據(jù),以及視頻音頻(AfV)數(shù)據(jù)。數(shù)據(jù)庫環(huán)境的復雜程度更高、干擾因素更多,已遠遠超過一般的實際應用場景,意味著對參評機構的算法性能和系統(tǒng)魯棒性等提出更高的要求。

另外,由于現(xiàn)實應用中,系統(tǒng)往往要根據(jù)不同的需求來決定閾值的選取。今年,為綜合考核參評系統(tǒng)的靈活度、實用度以及綜合實力,NIST 將C_primary(或稱為actDCF)作為首要核心指標,用于描述說話人識別系統(tǒng)的整體辨別能力,評判標準不再僅看在某個閾值點的FAR/FRR或DCF,進一步提升了競賽的難度。

因此,NIST SRE 測評結果不僅為當前說話人識別的最新技術進步水平,也代表著該技術在目前實戰(zhàn)場景應用中能夠具備的最佳表現(xiàn)。

l 聲紋識別技術排名全球前三,快商通憑什么?

在眾多多場景測評中,快商通聲紋識別系統(tǒng)在十萬分之一的誤報率下識別準確率超過99%。是國內聲紋識別領域企業(yè)中在該指標下的最好水平,也體現(xiàn)了我國說話人識別技術已達到世界領先水平。

“NIST SRE 評測挑戰(zhàn)最大的是單信道多說話人識別?!笨焐掏?a href="http://ttokpm.com/tags/ai/" target="_blank">AI事業(yè)部研究員葉志堅表示,“測試數(shù)據(jù)中,每段語音使用麥克風陣列錄制用來混合測試,比如電話信道涵蓋了移動電話,固定電話等。麥克風類型也幾乎覆蓋實際應用中所有類型。其次,環(huán)境噪聲也更‘廣義化’,包括環(huán)境噪聲、人聲非語言、彩鈴炫鈴等各種背景噪聲情況。我們的系統(tǒng)采用了經(jīng)典的DNN-ivector系統(tǒng)和基于端到端深度神經(jīng)網(wǎng)絡(DNN)的說話人特征提取系統(tǒng),在不同語種中使用的結果都不錯?!?/p>

今年,快商通聲紋研究院在單信道多說話人識別方面取得了重大的進展,提出“單耳語音分離技術”,實現(xiàn)單音頻定向人聲分離,開創(chuàng)性解決聲紋識別中“雞尾酒會問題”難題。經(jīng)實測、在嘈雜的環(huán)境中能夠準確分辨多說話人聲音。

這套強大聲紋識別系統(tǒng)出色的完成了 NIST SRE 的說話人檢測任務,特別是在降低環(huán)境“噪聲”干擾,以及同一段語音中多聲紋特征提取方面表現(xiàn)優(yōu)異,系統(tǒng)將語音樣本分割聚類成獨立的片段,準確標注出“誰”從“什么時候”到“什么時候”在說話。

l 美國“最嚴技術封鎖”,國產(chǎn)AI能力崛起

美國商務部工業(yè)安全署(BIS)根據(jù)出口行政規(guī)定(ExportAdministration Regulations, EAR)對軍民兩用和較為不敏感的軍品出口進行監(jiān)管,主要甄別涉及國家安全和高技術范疇的出口。根據(jù)美國商務部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),從美國公布的清單中甄別篩選出的代表性產(chǎn)業(yè)類別來看,可謂條條針對中國最新計劃發(fā)展的高科技產(chǎn)業(yè)。

圖:美國擬管制的14項技術出口

來源:據(jù)公開資料查找

近年來,中國人工智能高速發(fā)展。無人超市,無人物流,無人加油站,無人駕駛,無人酒店……再加上各種功能健全的機器人!在我們毫無察覺中,人工智能正在日夜不息地自我迭代進化,沖擊著我們生活的方方面面。

在人臉識別技術的研發(fā)和應用上,中國在其上投入巨大,在各項國際人臉領域的評測中中國的企業(yè)穩(wěn)拿第一,如依圖科技,曠世科技,商湯科技(SenseTime)、云從科技、百度等企業(yè)。

在聲紋領域,快商通已將自主研發(fā)的聲紋識別技術落地應用在金融、安防、社保、智能家居、物聯(lián)網(wǎng)等領域,推出“金融信貸身份反欺詐”、“社保異地生存驗證”等行業(yè)解決方案。 在豐富項目經(jīng)驗積累下,快商通在國內銀行、保險等領域商業(yè)測試中均取得聲紋技術排名第一,目前,快商通已為平安集團、上海華瑞銀行,國家電網(wǎng)、常州司法局等用戶落地聲紋行業(yè)解決方案。

在推動人工智能落地應用的同時,快商通也在持續(xù)加大對前沿技術投入。在成立快商通新加坡研究院之后,還與福建本土高校廈門大學、華僑大學建立聯(lián)合建立人工智能研究院,推進產(chǎn)學研用結合,為廈門市乃至福建省的人工智能產(chǎn)業(yè)規(guī)模化發(fā)展增光添彩,為提升我國科技創(chuàng)新實力、為我國高科技產(chǎn)業(yè)的核心技術發(fā)展做積極貢獻。

2018年,快商通首席科學家李海洲教授帶領的新加坡國立大學團隊榮獲2018年第二屆國際大學生類腦計算大賽一等獎;

2017年,快商通聲紋團隊在Interspeech2017的ASVspoof2017自動說話人驗證欺騙和對策挑戰(zhàn)賽(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,獲得全球第一。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3752

    瀏覽量

    64233
  • 人工智能
    +關注

    關注

    1789

    文章

    46652

    瀏覽量

    237087
  • 聲紋識別
    +關注

    關注

    3

    文章

    137

    瀏覽量

    21490

原文標題:聲紋識別最權威評測 NIST SRE18結果公布:快商通排名全球前三!

文章出處:【微信號:kuairobot,微信公眾號:小快機器人】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    調試PCM3500E,DAC輸出噪聲紋波峰峰值居然高達600mV,為什么?

    你好!最近在調試PCM3500E,發(fā)現(xiàn)其DAC部分,輸出噪聲紋波峰峰值居然高達600mV,將芯片power down之后噪聲就消除了。附圖是DIN輸入全零時,紋波的波形特征。
    發(fā)表于 11-08 07:25

    ?FP6601Q:兼容充協(xié)議控制器,智能識別充電設備,高效安全新體驗

    and Dlines●支持蘋果Apple設備●支持星設備●可以直接PIN對PINFP6601(QC2.0識別IC)●SOT23-6無鉛封裝 FP6601Q是QC3.0,QC2.0和華為海思
    發(fā)表于 10-28 17:22

    梅賽德斯-奔馳攜手通實現(xiàn)激光器全球數(shù)字化維護

    在智能工廠浪潮中,梅賽德斯-奔馳與通深化合作,通過云數(shù)據(jù)的監(jiān)測技術,對其全球生產(chǎn)網(wǎng)絡中的通激光器進行實時數(shù)字維護 通過MO360數(shù)字生態(tài)系統(tǒng),通
    的頭像 發(fā)表于 06-18 14:01 ?322次閱讀
    梅賽德斯-奔馳攜手通<b class='flag-5'>快</b>實現(xiàn)激光器<b class='flag-5'>全球</b>數(shù)字化維護

    重磅!中國企業(yè)躋身全球

    來源:半導體封測,謝謝 編輯:感知芯視界 Link 5月24日,最新研究報告顯示,中芯國際在2024年第一季度成功躍升至全球大晶圓代工廠,僅次于臺積電和星,市場份額達到6%。這一成績標志著中芯
    的頭像 發(fā)表于 05-27 11:10 ?620次閱讀

    廣汽埃安3月全球銷量32530輛,環(huán)比增長95.1%,穩(wěn)居主流純電

    廣汽埃安3月全球銷量32530輛,環(huán)比增長95.1%,穩(wěn)居主流純電
    的頭像 發(fā)表于 04-02 09:50 ?261次閱讀
    廣汽埃安3月<b class='flag-5'>全球</b>銷量32530輛,環(huán)比增長95.1%,穩(wěn)居主流純電<b class='flag-5'>前</b><b class='flag-5'>三</b>

    平芯微FP6601Q:智能充芯片的新里程碑

    QC3.0識別芯片F(xiàn)P6601Q:平芯微技術引領充新時代
    的頭像 發(fā)表于 03-04 14:40 ?587次閱讀
    平芯微FP6601Q:智能<b class='flag-5'>快</b>充芯片的新里程碑

    智能聲控燈具應用語音識別芯片AT6811

    AT6811是一款超低功耗的離線智能語音識別芯片,集成了先進的語音活動監(jiān)測(VAD)、聲紋識別、自動消噪神經(jīng)網(wǎng)絡,擁有高效的電源管理模塊、數(shù)字和模擬語音信號輸入接口以及ARMCortex-M0內核,并且搭配了GPIO、UART、SPI、I2C、I2S等片內外設。
    的頭像 發(fā)表于 02-28 16:41 ?571次閱讀
    智能聲控燈具應用語音<b class='flag-5'>識別</b>芯片AT6811

    人臉識別技術的原理是什么 人臉識別技術的特點有哪些

    人臉識別技術的原理 人臉識別技術是一種通過計算機以圖像或視頻為輸入,識別、檢測、跟蹤和分析人臉的技術
    的頭像 發(fā)表于 02-18 13:52 ?1570次閱讀

    測電源噪聲紋波時為什么選無源探頭

    在測量電源的噪聲紋波時,采用無源探頭是一種常見的選擇。無源探頭是指在測量過程中不需要額外的電源供電的探頭。那么,為什么我們要選擇無源探頭呢?下面將詳細解釋這個問題。 首先,無源探頭具有高頻
    的頭像 發(fā)表于 02-01 10:10 ?566次閱讀
    測電源噪<b class='flag-5'>聲紋</b>波時為什么選無源探頭

    第四大運營,攻擊大運營

    1&1稱其委托Aetha Consulting開展的研究發(fā)現(xiàn)德國大移動運營相比歐洲其他有四家移動運營的國家的排名
    的頭像 發(fā)表于 01-30 16:00 ?772次閱讀

    簡單認識射頻識別技術

    技術無須識別系統(tǒng)與目標間建立機械或者光學連接,應用靈活、識別速度,相關設備具有使用簡單、壽命長、安全性高的特點。RFID技術是構建物聯(lián)網(wǎng)
    的頭像 發(fā)表于 01-08 09:43 ?1105次閱讀

    激光技術及其應用

    激光技術及其應用? 超激光技術是一種非常先進的光學技術,它利用超激光脈沖進行高精度的物質
    的頭像 發(fā)表于 12-20 15:35 ?773次閱讀

    離線語音識別及控制是怎樣的技術?

    引言:  隨著人工智能的飛速發(fā)展,離線語音識別技術成為了一項備受矚目的創(chuàng)新。離線語音識別技術能夠將人的語音轉化為可理解的文本,無需依賴網(wǎng)絡連接,極大地提升了語音
    發(fā)表于 11-24 17:41

    汽車多模態(tài)交互研究:大模型及多模態(tài)融合,推進AI Agent上車

    語音交互方面:語音交互在AI大模型的賦能下,功能愈加智能化、情感化。唇動識別、聲紋識別技術的上車,使語音交互精準度得到進一步提升,控制范圍也從車內拓展至車外;
    的頭像 發(fā)表于 11-24 16:12 ?1416次閱讀
    汽車多模態(tài)交互研究:大模型及多模態(tài)融合,推進AI Agent上車

    華為成功擠進全球網(wǎng)絡安全專利

    全球網(wǎng)絡安全專利數(shù)據(jù)顯示,截至今年 8 月,位列專利持有量排名十的企業(yè)中,中國企業(yè)占據(jù)了 6 席。
    的頭像 發(fā)表于 11-22 17:22 ?709次閱讀