0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mozilla使用開源Common Voice語音識(shí)別數(shù)據(jù)集進(jìn)行多語言操作

JsPm_robot_1hjq ? 來源:未知 ? 作者:胡薇 ? 2018-06-12 11:18 ? 次閱讀

Mozilla 宣布它正在使其眾包項(xiàng)目 Common Voice 支持更多語言。Common Voice 是一個(gè)旨在創(chuàng)建開源語音識(shí)別數(shù)據(jù)集的項(xiàng)目,于去年6月發(fā)布,它邀請(qǐng)來自世界各地的志愿者通過網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序,用他們的聲音記錄文本片段。

業(yè)內(nèi)普遍認(rèn)為語音將成為下一個(gè)重要的技術(shù)平臺(tái),近年來隨著人工智能理論與技術(shù)的迅猛發(fā)展,語音識(shí)別技術(shù)在不斷突破,通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語音數(shù)據(jù)歸為公司自己所有,這些數(shù)據(jù)的價(jià)值或許目前很難被外界看出來,但是在信息化高度發(fā)達(dá),特別是今天這樣一個(gè)大數(shù)據(jù)和人工智能時(shí)代,為開發(fā)機(jī)器學(xué)習(xí)模型提供語音數(shù)據(jù)集怎么看都是一件有深遠(yuǎn)意義的事,這些語音數(shù)據(jù)的意義會(huì)慢慢體現(xiàn)。

而最終當(dāng)它們的價(jià)值逐漸顯現(xiàn),人們會(huì)發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語音技術(shù)的命門,主導(dǎo)了這場(chǎng)語音市場(chǎng)之爭(zhēng)。

Common Voice 項(xiàng)目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語音數(shù)據(jù)集開源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來將語音識(shí)別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語數(shù)據(jù)集的第一批成果,其中收錄了20000個(gè)人錄制的40萬個(gè)錄音、大約500小時(shí)的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數(shù)據(jù),同時(shí)也在為收集另外40種語言做準(zhǔn)備,巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經(jīng)準(zhǔn)備好啟動(dòng)眾包語音數(shù)據(jù)收集。

Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語言甚至方言的時(shí)候是可以被機(jī)器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門員一樣來完全把控語音服務(wù)?!?/p>

Common Voice 項(xiàng)目的意義與用于打擊私人平臺(tái)的開放許可證項(xiàng)目類似,OpenStreetMap 就是一個(gè)很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖,使得開發(fā)商不再需要依賴于 Google Maps 這樣的競(jìng)爭(zhēng)對(duì)手,不僅降低了成本開銷,技術(shù)上也不再受到限制。

“使用多種語言標(biāo)志著 Common Voice 邁出了重要的一步,我們希望它對(duì)整體語音技術(shù)來說也是一大步”,Mozilla Common Voice 項(xiàng)目的數(shù)字策略師 Michael Henretty 補(bǔ)充到:“語音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,也會(huì)讓人們獲取信息更加便捷?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Mozilla
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    11183
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1696

    瀏覽量

    112248

原文標(biāo)題:打破語音壟斷 Mozilla Common Voice 支持更多語言

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    有效提升智能會(huì)議系統(tǒng)語音識(shí)別準(zhǔn)確性案例分享

    多語言支持的語音識(shí)別技術(shù)還可以準(zhǔn)確識(shí)別不同語言和方言,對(duì)于夸全球交流的國(guó)際會(huì)議必不可缺。語音
    的頭像 發(fā)表于 06-21 11:15 ?200次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>準(zhǔn)確性案例分享

    有效提升智能會(huì)議系統(tǒng)語音識(shí)別準(zhǔn)確性案例分享

    多語言支持的語音識(shí)別技術(shù)還可以準(zhǔn)確識(shí)別不同語言和方言,對(duì)于夸全球交流的國(guó)際會(huì)議必不可缺。語音
    的頭像 發(fā)表于 06-21 11:13 ?311次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>準(zhǔn)確性案例分享

    這個(gè)多語言包 怎么搜不到

    大家好,這個(gè)多語言包怎么搜不到 seven language lib 誰有離線包不 感謝分享,
    發(fā)表于 03-24 10:06

    語言模型(LLMs)如何處理多語言輸入問題

    研究者們提出了一個(gè)框架來描述LLMs在處理多語言輸入時(shí)的內(nèi)部處理過程,并探討了模型中是否存在特定于語言的神經(jīng)元。
    發(fā)表于 03-07 14:44 ?415次閱讀
    大<b class='flag-5'>語言</b>模型(LLMs)如何處理<b class='flag-5'>多語言</b>輸入問題

    車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的價(jià)值與應(yīng)用

    車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的價(jià)值與應(yīng)用 一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用越來越廣泛。車內(nèi)語音
    的頭像 發(fā)表于 02-19 11:47 ?442次閱讀

    語音數(shù)據(jù):智能駕駛中車內(nèi)語音識(shí)別技術(shù)的基石

    一、引言 在智能駕駛中,車內(nèi)語音識(shí)別技術(shù)發(fā)揮著越來越重要的作用。語音數(shù)據(jù)作為這一技術(shù)的基石,其質(zhì)量和規(guī)模對(duì)
    的頭像 發(fā)表于 01-31 16:07 ?393次閱讀

    車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用與挑戰(zhàn)

    詳細(xì)介紹車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢(shì)。 二、車內(nèi)語音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用 語音控制:通過車內(nèi)
    的頭像 發(fā)表于 01-26 18:14 ?975次閱讀

    語音數(shù)據(jù):開啟智能語音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語音數(shù)據(jù)在推動(dòng)智能語音技術(shù)的進(jìn)步中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)
    的頭像 發(fā)表于 12-29 11:06 ?458次閱讀

    傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識(shí)別比賽斬獲多項(xiàng)佳績(jī)

    自動(dòng)語音識(shí)別(Automatic Speech Recognition,簡(jiǎn)稱ASR)主要用于將人類語音轉(zhuǎn)換為計(jì)算機(jī)可讀的文本或命令,實(shí)現(xiàn)人機(jī)交互和自然語言處理。近年來,得益于基于自監(jiān)督
    的頭像 發(fā)表于 12-21 16:33 ?772次閱讀
    傳音AI技術(shù)部在ASRU 2023 MADASR低資源<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>比賽斬獲多項(xiàng)佳績(jī)

    語音數(shù)據(jù)在智能語音助手中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著智能設(shè)備的普及和人工智能技術(shù)的不斷發(fā)展,智能語音助手已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>語音數(shù)據(jù)在智能語音助手中發(fā)揮著重
    的頭像 發(fā)表于 12-14 15:07 ?637次閱讀

    語音數(shù)據(jù):AI語音技術(shù)的靈魂

    提升語音識(shí)別和生成能力:語音數(shù)據(jù)為AI模型提供了豐富的語音樣本,通過訓(xùn)練和學(xué)習(xí)這些
    的頭像 發(fā)表于 12-14 14:33 ?819次閱讀

    多語言開發(fā)的流程詳解

    現(xiàn)在不少應(yīng)用都是要求有多語言切換的, 使用QT開發(fā)上位機(jī)也同樣需要做多語言功能, 不過QT是自帶了多語言翻譯功能, 可以很方便的借助原生工具進(jìn)行, 下面就簡(jiǎn)單來看看
    的頭像 發(fā)表于 11-30 09:08 ?895次閱讀

    如何在TSMaster面板和工具箱中實(shí)現(xiàn)多語言切換

    對(duì)應(yīng)的多語言文件,就可以同時(shí)滿足國(guó)內(nèi)外的需求,便于在公司內(nèi)部和國(guó)內(nèi)外合作伙伴進(jìn)行協(xié)作。今天重點(diǎn)和大家分享一下關(guān)于TSMaster中面板和工具箱的多語言版本切換如何實(shí)現(xiàn)。
    的頭像 發(fā)表于 11-11 08:21 ?695次閱讀
    如何在TSMaster面板和工具箱中實(shí)現(xiàn)<b class='flag-5'>多語言</b>切換

    車內(nèi)語音識(shí)別數(shù)據(jù):駕駛體驗(yàn)升級(jí)與智能出行的未來

    車內(nèi)語音識(shí)別數(shù)據(jù)是指在汽車內(nèi)部通過語音識(shí)別技術(shù)對(duì)駕駛員和乘客的語音指令進(jìn)行處理和響應(yīng)的
    的頭像 發(fā)表于 11-08 17:01 ?329次閱讀

    基于LLaMA的多語言數(shù)學(xué)推理大模型

    MathOctopus在多語言數(shù)學(xué)推理任務(wù)中,表現(xiàn)出了強(qiáng)大的性能。MathOctopus-7B 可以將LLmMA2-7B在MGSM不同語言上的平均表現(xiàn)從22.6%提升到40.0%。更進(jìn)一步,MathOctopus-13B也獲得了比ChatGPT更好的性能。
    發(fā)表于 11-08 10:37 ?379次閱讀
    基于LLaMA的<b class='flag-5'>多語言</b>數(shù)學(xué)推理大模型