国产一级做a爰片在线看免费,亚洲av日韩av欧v在线天堂,亚洲小说区图片区另类春色63

國際頂級語音會議ASRU 2023（IEEE Workshop on Automatic Speech Recognition and Understanding，簡稱ASRU）于12月16日-20日順利舉辦。傳音AI技術(shù)部在ASRU 2023 MADASR（Model ADaptation for ASR in low-resource Indian languages，簡稱MADASR）關(guān)于孟加拉語和博杰普爾語的低資源語音識別比賽中斬獲多項佳績，在受限和非受限的4個賽道、2個語種與WER、CER 2個評價指標共16個細分子賽道上獲得2個第一名、6個第二名和5個第三名。

ASRU研討會是語音與語言處理學術(shù)圈的頂級會議，由IEEE語音和語言處理技術(shù)委員會主辦，每兩年舉行一次，歷史悠久，影響廣泛。此次MADASR比賽是ASRU 2023的重要賽事，由IBM、布爾諾理工大學、微軟研究院、愛丁堡大學和印度科學研究所舉辦，旨在以孟加拉語和博杰普爾語為例，探索低資源語言的語音識別難題。比賽吸引了中科院自動化所、愛沙尼亞塔林理工大學、印度坎普爾理工學院、印度科學研究所-馬德拉斯語音實驗室、印度科學研究所-孟買數(shù)字音頻處理實驗室、印度浦那高級計算發(fā)展中心等多家國內(nèi)外知名高校和研究機構(gòu)參賽。

自動語音識別（Automatic Speech Recognition，簡稱ASR）主要用于將人類語音轉(zhuǎn)換為計算機可讀的文本或命令，實現(xiàn)人機交互和自然語言處理。近年來，得益于基于自監(jiān)督學習的聲學模型（如 wav2vec2）和大規(guī)模多語言訓(xùn)練（如 Whisper），自動語音識別性能大幅提高，然而低資源語言由于音頻和文本數(shù)據(jù)有限，仍面臨巨大的挑戰(zhàn)。

在ASRU 2023 MADASR比賽中，傳音AI技術(shù)部開發(fā)的語音識別系統(tǒng)，在算法層面使用了兩種方案，一種是基于U2（Unified-2 pass）框架的編碼器和解碼器結(jié)構(gòu)，使用短時連接分類（Connectionist Temporal Classification）和注意力重打分（Attention Rescore）；另一種是基于Whisper的改進和微調(diào)的結(jié)構(gòu)。該系統(tǒng)顯著提升了低資源語言語音識別的準確性和效率，克服了語音數(shù)據(jù)的稀缺難題，其解決方案將為其他低資源語言提供參考。

據(jù)Ethnologue網(wǎng)站統(tǒng)計，世界上有7000多種語言，其中90%的語種使用人數(shù)少于10萬人，不同語種尤其是小語種之間的溝通交流仍面臨極大挑戰(zhàn)。傳音長期深耕新興市場，面對新興市場智能語音技術(shù)空白，不斷加強多語種數(shù)據(jù)建設(shè)，開發(fā)小語種語音識別、語義理解、知識圖譜、語音合成等算法模型，除了提供多語種語音轉(zhuǎn)寫的服務(wù)能力，未來還將提供大語言模型生成式交互和跨語種翻譯能力，使不同語種之間的交流更順暢，讓更多的小語種使用群體受益。

傳音始終以新興市場的消費者為中心，重視新興市場用戶的需求。未來，傳音將繼續(xù)結(jié)合行業(yè)技術(shù)發(fā)展趨勢和本地消費者洞察，在AI技術(shù)研究和智能終端應(yīng)用領(lǐng)域發(fā)力，通過技術(shù)為用戶、為社會創(chuàng)造更多價值，讓盡可能多的人盡早享受科技和創(chuàng)新帶來的美好生活。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

語音識別

語音識別

+關(guān)注

關(guān)注
38

文章
1710

瀏覽量
112493
ai技術(shù)

ai技術(shù)

+關(guān)注

關(guān)注
1

文章
1250

瀏覽量
24201
傳音

傳音

+關(guān)注

關(guān)注
0

文章
54

瀏覽量
6202

原文標題：傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項佳績

文章出處：【微信號：TranssionHoldings，微信公眾號：傳音控股】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集（硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集）

自定義大模型應(yīng)用并接入到開發(fā)套件上實現(xiàn)語音交互，由淺入深地展示如何開發(fā)自己的大模型助手。離線AI能力示例SDK清單序號AI 能力 1語音喚醒 + 坐姿檢測 2

發(fā)表于 06-18 17:33

加碼多膚色影像技術(shù) 這是傳音找到的“出海利器“？

全球化時代，市場競爭愈演愈烈，產(chǎn)品差異化已然成為了企業(yè)脫穎而出的關(guān)鍵。在黃、白膚色長期占據(jù)人像攝影主賽道的背景下，傳音就憑借獨一無二的多膚色影像技術(shù)走出非洲，走向了更廣闊的新興市場。

發(fā)表于 06-13 16:43 ?373次閱讀

傳音研發(fā)中心與騰訊游戲語音GVoice在移動語音技術(shù)領(lǐng)域展開深入合作

近日，傳音研發(fā)中心與騰訊游戲語音GVoice在上海傳音研創(chuàng)園簽署了技術(shù)創(chuàng)新合作協(xié)議，雙方將在移動

發(fā)表于 06-07 16:46 ?785次閱讀

傳音控股2023年業(yè)績出爐：手機出貨量增24%，營收增34.88%

5月17日夜晚，傳音控股發(fā)布了一項股權(quán)轉(zhuǎn)讓計劃，該公司旗下的深圳傳音投資將出售1%的股票。值得注意的是，傳

發(fā)表于 05-18 14:57 ?692次閱讀

復(fù)盤傳音控股2023年報：中國企業(yè)是如何贏得海外市場的？

近日，傳音控股相繼發(fā)布了2023年報和第一季度財報，根據(jù)兩階段報告顯示，新市場開拓、產(chǎn)品結(jié)構(gòu)升級及成本優(yōu)化，成為傳音整體出貨量及銷售收入增長

發(fā)表于 05-16 15:13 ?458次閱讀

傳音控股2023年凈利潤增幅達122.93%，非洲智能機市場占比再創(chuàng)新高

傳音控股表示，公司積極拓展新興市場，得益于產(chǎn)品結(jié)構(gòu)升級與成本優(yōu)化，整體出貨量和毛利率均有顯著提高。2023年，傳音控股手機總銷量約為1.94

發(fā)表于 04-24 09:36 ?353次閱讀

AI等前沿技術(shù)大放異彩傳音控股以創(chuàng)新突圍海外市場

近日，在第四屆深圳企業(yè)創(chuàng)新促進大會暨深圳工業(yè)總會2023年度年會上，傳音控股憑借扎實的創(chuàng)新實力入選“2023粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單——創(chuàng)

發(fā)表于 03-28 10:24 ?373次閱讀

車內(nèi)語音識別技術(shù)在智能駕駛中的應(yīng)用與前景

詳細介紹車內(nèi)語音識別技術(shù)在智能駕駛中的應(yīng)用、挑戰(zhàn)以及未來的發(fā)展趨勢。二、車內(nèi)語音識別

發(fā)表于 02-19 11:46 ?739次閱讀

首次躋身全球智能機市場第四傳音手機在新興市場“殺瘋了”？

近日，研究機構(gòu)IDC全球手機季度跟蹤報告顯示，2023年第四季度全球智能手機市場同比增長8.5%，出貨量達3.261 億臺，其中傳音控股的業(yè)績表現(xiàn)尤為亮眼，第四季度智能手機出貨量達2820萬部

發(fā)表于 01-31 10:44 ?625次閱讀

紫光展銳接連斬獲多項行業(yè)重要榮譽

近期，紫光展銳憑借在技術(shù)和產(chǎn)品創(chuàng)新領(lǐng)域的實力和成果，接連斬獲多項行業(yè)重要榮譽。

發(fā)表于 01-20 17:21 ?1230次閱讀

南芯科技獲傳音控股【2023年度精誠合作伙伴】稱號

本月5日，傳音控股2023年度優(yōu)秀供應(yīng)商頒獎典禮于傳音大廈隆重舉行。

發(fā)表于 01-18 18:17 ?1082次閱讀

傳音控股為晶能光電頒發(fā)2023年度“卓越質(zhì)量獎”

近日，素有“非洲手機之王”之稱的傳音控股（Transsion）為晶能光電隆重頒發(fā)了2023年度“卓越質(zhì)量獎”，

發(fā)表于 01-18 16:23 ?471次閱讀

敦泰榮獲傳音“2023年度精誠合作伙伴”獎

近日，知名智能終端廠商傳音向敦泰頒發(fā) “2023年度精誠合作伙伴”獎，以此表達對敦泰現(xiàn)場應(yīng)用技術(shù)支持服務(wù)的認可與信任。

發(fā)表于 01-15 10:46 ?560次閱讀

語音數(shù)據(jù)集：AI語音技術(shù)的靈魂

一、引言在人工智能領(lǐng)域，語音技術(shù)被譽為“未來人機交互的入口”，而語音數(shù)據(jù)集則是AI語音

發(fā)表于 12-14 14:33 ?945次閱讀

離線語音識別及控制是怎樣的技術(shù)？

了對網(wǎng)絡(luò)依賴的程度。　二、離線語音識別技術(shù)的優(yōu)勢　離線語音識別的優(yōu)勢主要體現(xiàn)在以下幾個方面：　1. 隱私保護：離線

發(fā)表于 11-24 17:41

搜索歷史

傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項佳績

評論

聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集（硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集）

加碼多膚色影像技術(shù) 這是傳音找到的“出海利器“？

傳音研發(fā)中心與騰訊游戲語音GVoice在移動語音技術(shù)領(lǐng)域展開深入合作

傳音控股2023年業(yè)績出爐：手機出貨量增24%，營收增34.88%

復(fù)盤傳音控股2023年報：中國企業(yè)是如何贏得海外市場的？

傳音控股2023年凈利潤增幅達122.93%，非洲智能機市場占比再創(chuàng)新高

AI等前沿技術(shù)大放異彩傳音控股以創(chuàng)新突圍海外市場

車內(nèi)語音識別技術(shù)在智能駕駛中的應(yīng)用與前景

首次躋身全球智能機市場第四傳音手機在新興市場“殺瘋了”？

紫光展銳接連斬獲多項行業(yè)重要榮譽

南芯科技獲傳音控股【2023年度精誠合作伙伴】稱號

傳音控股為晶能光電頒發(fā)2023年度“卓越質(zhì)量獎”

敦泰榮獲傳音“2023年度精誠合作伙伴”獎

語音數(shù)據(jù)集：AI語音技術(shù)的靈魂

離線語音識別及控制是怎樣的技術(shù)？