日韩人妻精品一区,永久免费看A片无码网站宅男

Unisound News

2023年8月20號，最后一屆VoxSRC Workshop 在都柏林召開。VoxSRC 2023 國際說話人識別競賽公布比賽榜單，云知聲團隊奪得Track1(固定訓練集說話人確認)第一名、Track2(開放訓練集說話人確認)第二名的優(yōu)異成績。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大學)、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等組織聯(lián)合發(fā)起的國際說話人識別競賽，是在說話人識別領(lǐng)域最具影響力和權(quán)威性的國際賽事之一。

VoxSRC 2023測試集數(shù)據(jù)來自訪談、新聞、談話、辯論等多個場景，包括專業(yè)編輯音頻和隨意的談話音頻，同時混雜著笑聲、其他說話人噪聲等復雜的背景噪音，涉及跨年齡、跨語種說話人識別，同時今年的測試數(shù)據(jù)繼續(xù)加大難度，專注于短語音說話人識別，音頻時長大部分在2-3s區(qū)間，是VoxSRC有史以來最難的一屆。

在此次競賽中，云知聲采用并進一步優(yōu)化了當前最領(lǐng)先的算法。這些算法包括基于ResNet系列主干網(wǎng)絡(luò)，MQMHA pooling，以及融合了Sub-center和inter-topK的Large-margin損失函數(shù)。此外，云知聲還實施了多階段訓練調(diào)優(yōu)策略等技術(shù)。

除此之外，基于對比賽任務(wù)的深刻理解，云知聲團隊首次提出了Consistency Measure Factor(CMF) 算法，即建模音頻“說話人特征的一致性”，并將其引入說話人相似度決策中，大幅提升了說話人識別的準確率。同時，依托云知聲大規(guī)模算力中心，采用大規(guī)模模型訓練框架，訓練出ResNet314、ResNet518說話人模型。憑借對“說話人算法”的創(chuàng)新性研發(fā)和超強力的“算力”支持，云知聲團隊在Track1(固定訓練集說話人識別)賽道以minDCF(最小檢測代價函數(shù))0.085、EER(等錯誤率)1.588%的卓越表現(xiàn)，一舉奪得本次大賽冠軍。

Track 1 (Verification fullysupervised, closed)

Track 2 (Verification fullysupervised, open)

Track1 & Track2 榜單

值得注意的是，云知聲團隊將Track1(官方固定訓練數(shù)據(jù))賽道的結(jié)果，直接提交到Track2(可用任何規(guī)模數(shù)據(jù))賽道，卻依然取得了第二名的優(yōu)異成績，這充分證明了其算法的出眾性和領(lǐng)先性。

云知聲：通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界

云知聲AI技術(shù)體系及U+X戰(zhàn)略

作為中國AGI技術(shù)產(chǎn)業(yè)化的先驅(qū)之一，云知聲于2016年建立了Atlas人工智能基礎(chǔ)設(shè)施，并據(jù)此開發(fā)了具有通用能力的專有大模型山海(UniGPT)，成為公司技術(shù)平臺云知大腦(UniBrain)的新核心，與多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等各類智能組件相結(jié)合,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務(wù)提供高效的產(chǎn)品化支撐，推動“U(云知大腦)+X(應(yīng)用場景)”戰(zhàn)略落實，踐行公司使命：“通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界”。

說話人識別技術(shù)，作為云知大腦(UniBrain)的重要組件，已在智能家居、車載、客服等領(lǐng)域廣泛應(yīng)用，包括身份識別、個性化服務(wù)、角色分離等。此次奪冠，進一步驗證了云知聲的AI技術(shù)實力，也將進一步通過云知大腦提供業(yè)界領(lǐng)先的說話人感知技術(shù)能力，以及更好的人機交互體驗和分析決策能力，夯實云知聲AGI技術(shù)底座，推動山海大模型在各領(lǐng)域的廣泛應(yīng)用，為千行百業(yè)的智慧化升級注入更強大的AI動力。

未來，云知聲將繼續(xù)堅定走在技術(shù)研發(fā)的前沿，不斷推動其在AGI相關(guān)技術(shù)的研發(fā)突破，為各行各業(yè)帶來新的增長范式與無限可能。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴