0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲進一步夯實AGI技術(shù)底座

云知聲 ? 來源:云知聲 ? 2023-08-31 16:07 ? 次閱讀

Unisound News

2023年8月20號,最后一屆VoxSRC Workshop 在都柏林召開。VoxSRC 2023 國際說話人識別競賽公布比賽榜單,云知聲團隊奪得Track1(固定訓練集說話人確認)第一名、Track2(開放訓練集說話人確認)第二名的優(yōu)異成績。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大學)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等組織聯(lián)合發(fā)起的國際說話人識別競賽,是在說話人識別領(lǐng)域最具影響力和權(quán)威性的國際賽事之一。

VoxSRC 2023測試集數(shù)據(jù)來自訪談、新聞、談話、辯論等多個場景,包括專業(yè)編輯音頻和隨意的談話音頻,同時混雜著笑聲、其他說話人噪聲等復雜的背景噪音,涉及跨年齡、跨語種說話人識別,同時今年的測試數(shù)據(jù)繼續(xù)加大難度,專注于短語音說話人識別,音頻時長大部分在2-3s區(qū)間,是VoxSRC有史以來最難的一屆。

在此次競賽中,云知聲采用并進一步優(yōu)化了當前最領(lǐng)先的算法。這些算法包括基于ResNet系列主干網(wǎng)絡(luò),MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin損失函數(shù)。此外,云知聲還實施了多階段訓練調(diào)優(yōu)策略等技術(shù)。

除此之外,基于對比賽任務(wù)的深刻理解,云知聲團隊首次提出了Consistency Measure Factor(CMF) 算法,即建模音頻“說話人特征的一致性”,并將其引入說話人相似度決策中,大幅提升了說話人識別的準確率。同時,依托云知聲大規(guī)模算力中心,采用大規(guī)模模型訓練框架,訓練出ResNet314、ResNet518說話人模型。憑借對“說話人算法”的創(chuàng)新性研發(fā)和超強力的“算力”支持,云知聲團隊在Track1(固定訓練集說話人識別)賽道以minDCF(最小檢測代價函數(shù))0.085、EER(等錯誤率)1.588%的卓越表現(xiàn),一舉奪得本次大賽冠軍。

Track 1 (Verification fullysupervised, closed)

c1ed45ec-419c-11ee-a2ef-92fbcf53809c.png

Track 2 (Verification fullysupervised, open)

c2025630-419c-11ee-a2ef-92fbcf53809c.png

Track1 & Track2 榜單

值得注意的是,云知聲團隊將Track1(官方固定訓練數(shù)據(jù))賽道的結(jié)果,直接提交到Track2(可用任何規(guī)模數(shù)據(jù))賽道,卻依然取得了第二名的優(yōu)異成績,這充分證明了其算法的出眾性和領(lǐng)先性。

云知聲:通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界

c20bd534-419c-11ee-a2ef-92fbcf53809c.png

云知聲AI技術(shù)體系及U+X戰(zhàn)略

作為中國AGI技術(shù)產(chǎn)業(yè)化的先驅(qū)之一,云知聲于2016年建立了Atlas人工智能基礎(chǔ)設(shè)施,并據(jù)此開發(fā)了具有通用能力的專有大模型山海(UniGPT),成為公司技術(shù)平臺云知大腦(UniBrain)的新核心,與多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等各類智能組件相結(jié)合,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務(wù)提供高效的產(chǎn)品化支撐,推動“U(云知大腦)+X(應(yīng)用場景)”戰(zhàn)略落實,踐行公司使命:“通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界”。

說話人識別技術(shù),作為云知大腦(UniBrain)的重要組件,已在智能家居、車載、客服等領(lǐng)域廣泛應(yīng)用,包括身份識別、個性化服務(wù)、角色分離等。此次奪冠,進一步驗證了云知聲的AI技術(shù)實力,也將進一步通過云知大腦提供業(yè)界領(lǐng)先的說話人感知技術(shù)能力,以及更好的人機交互體驗和分析決策能力,夯實云知聲AGI技術(shù)底座,推動山海大模型在各領(lǐng)域的廣泛應(yīng)用,為千行百業(yè)的智慧化升級注入更強大的AI動力。

未來,云知聲將繼續(xù)堅定走在技術(shù)研發(fā)的前沿,不斷推動其在AGI相關(guān)技術(shù)的研發(fā)突破,為各行各業(yè)帶來新的增長范式與無限可能。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4592

    瀏覽量

    92538
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268157
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    76

    瀏覽量

    10185
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    163

    瀏覽量

    8359

原文標題:AGI技術(shù)底座再夯實,云知聲奪冠VoxSRC 2023

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    通過展頻進一步優(yōu)化EMI

    電子發(fā)燒友網(wǎng)站提供《通過展頻進一步優(yōu)化EMI.pdf》資料免費下載
    發(fā)表于 09-04 09:32 ?1次下載
    通過展頻<b class='flag-5'>進一步</b>優(yōu)化EMI

    西門子與微軟進一步擴展戰(zhàn)略合作關(guān)系

    近日,西門子數(shù)字化工業(yè)軟件與微軟宣布進一步擴展雙方的戰(zhàn)略合作關(guān)系。通過微軟Azure服務(wù),西門子正式推出Xcelerator as a Service工業(yè)軟件解決方案,為客戶提供更靈活、高效的服務(wù)體驗。
    的頭像 發(fā)表于 05-21 10:47 ?632次閱讀

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    引入英偉達機密計算技術(shù),在不影響性能的情況下,增強了大規(guī)模實時s生成式人工智能推理的安全性。該架構(gòu)還具有新的解壓縮引擎和用于人工智能預防性維護的可靠性引擎,有助于診斷并預測潛在的可靠性問題,進一步鞏固
    發(fā)表于 05-13 17:16

    攜手耘途教育成立學院福建分院

    近日,與耘途教育攜手,共同成立了學院福建分院,此舉標志著雙方在智慧教育領(lǐng)域展開了深度合作。根據(jù)合作協(xié)議,
    的頭像 發(fā)表于 05-13 10:38 ?371次閱讀

    卓馭科技與高通合作宣布進一步推動汽車行業(yè)智能駕駛技術(shù)的發(fā)展

    今日,深圳市卓馭科技有限公司(以下簡稱:卓馭科技)與高通技術(shù)公司宣布擴展雙方的技術(shù)合作,利用基于Snapdragon Ride平臺的全新智能駕駛產(chǎn)品,進一步推動汽車行業(yè)智能駕駛技術(shù)的發(fā)
    的頭像 發(fā)表于 04-25 16:25 ?1587次閱讀
    卓馭科技與高通合作宣布<b class='flag-5'>進一步</b>推動汽車行業(yè)智能駕駛<b class='flag-5'>技術(shù)</b>的發(fā)展

    推進港交所主板上市進程

    近日,智能科技股份有限公司(以下簡稱“”)再次更新招股書,繼續(xù)其在港交所主板上市的征
    的頭像 發(fā)表于 03-22 14:45 ?925次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡稱)再次更新了其招股書,繼續(xù)穩(wěn)步推進其在
    的頭像 發(fā)表于 03-22 14:42 ?645次閱讀

    推進港股IPO!AI解決方案收入排名中國第四,2023年營收破7億

    于2012年,當時國內(nèi)的AI產(chǎn)業(yè)剛剛萌芽,它率先開啟AGI技術(shù)商業(yè)化。在成立僅三個月后,便發(fā)布了語音識別公有
    的頭像 發(fā)表于 03-22 00:12 ?3383次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>推進港股IPO!AI解決方案收入排名中國第四,2023年營收破7億

    再闖港股IPO,深耕AI領(lǐng)域

    近日,智能科技股份有限公司(簡稱:)正式向港交所遞交了招股書,計劃主板IPO上市。這
    的頭像 發(fā)表于 03-19 15:36 ?761次閱讀

    材料價格進一步下降,盈利觸底 鋰電材料企業(yè)如何應(yīng)對?

    在上游原料價格相對穩(wěn)定、終端銷量有所好轉(zhuǎn)的情況下,季度四大鋰電主材價格卻出現(xiàn)進一步下跌。
    的頭像 發(fā)表于 03-01 10:25 ?926次閱讀

    MediaTek宣布將進一步深化與海信的長期合作關(guān)系

    MediaTek 宣布將進一步深化與海信的長期合作關(guān)系。海信率先采用了 MediaTek Pentonic 智能電視芯片,顯著提升了流媒體內(nèi)容的畫質(zhì)表現(xiàn)。自 2024 年起,MediaTek AI 超級分辨率技術(shù)(AI-SR)將應(yīng)用于海信全系列智能電視產(chǎn)品。
    的頭像 發(fā)表于 01-12 09:37 ?754次閱讀

    有什么方法可以進一步提高AD7714的分辨率啊?

    級放大再加給AD7714時,測得人分辨率還要低些。由于是用干電池得到AD7714的輸入信號,該信號相對來說很穩(wěn)定,而且板上的噪聲也不是太大。請問各位大蝦,還有什么方法可以進一步提高AD7714的分辨率?。坎粍俑屑?!
    發(fā)表于 12-25 06:33

    借助人工智能,存儲器比重將進一步增加

    SK海力士預測在人工智能(AI)領(lǐng)域,存儲器解決方案的比重將進一步增加,可以通過類似AiMX的解決方案部分替代圖形處理單元(GPU)。
    發(fā)表于 12-04 09:52 ?395次閱讀
    借助人工智能,存儲器比重將<b class='flag-5'>進一步</b>增加

    ad9106如何將波形頻率設(shè)置為進一步降低到10Hz?

    你好,我有個小問題。我使用100m時鐘芯片。每個時鐘只有10ns,ad9106寄存器的最小輸出波形只有100Hz。如何將波形頻率設(shè)置為進一步降低到10Hz?我已將配置設(shè)置為相關(guān)寄存器的最大值。拍
    發(fā)表于 12-01 06:12

    智慧交通方案開啟2.0版本

    核心問題,探索智能交通前沿科技,分享創(chuàng)新理念與實踐。 作為智慧交通賽道的“老玩家”,受邀出席大會,通過主題論壇與展會活動,充分展示其在城市交通管理、智慧交通出行等多個領(lǐng)域的全方位解決方案,
    的頭像 發(fā)表于 11-21 09:40 ?941次閱讀