0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟智能語音實現(xiàn)技術(shù)升級,新增了5 個聲音角色

工程師鄧生 ? 來源:IT之家 ? 作者:玄隱 ? 2020-12-11 18:03 ? 次閱讀

12月11日消息 近期,微軟智能語音實現(xiàn)技術(shù)升級,一次性新增了 5 個聲音角色供用戶自由選擇,覆蓋男女聲和不同年齡段,以及不同性格和聲線特征,包括陽光活潑的男青年(云希)和獨(dú)立自信的女青年(曉萱),溫柔大方的女中青年(曉涵)和多才多藝的女青年(曉墨),以及成熟睿智的女中老年(曉睿)。另外,中年男聲(云野)也同步更新了多種聲音風(fēng)格。他們與此前多個聲音角色一起,共同組成了微軟豐富的中文智能語音 “家族”。

下面是新增以及更新角色聲音 demo:

類似人類主播在播講一個有聲小說時會模擬不同的角色,微軟最新的智能語音也支持聲線變換,一人模擬多個角色,比如女生扮演男生,年輕人扮演老人的聲音,做到 “聲隨境轉(zhuǎn)”,大秀聲音 “演技”。同時,不同的聲線變化也包含多種情感變換,讓角色更加活靈活現(xiàn)。

正是基于這些豐富多樣且功能強(qiáng)大的聲音角色,用戶得以自由組合出豐富的音頻產(chǎn)品。

IT之家獲悉,這些新聲音在開發(fā)過程中采用了最新的遷移學(xué)習(xí)技術(shù),僅利用少量表現(xiàn)力語料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語音生成能力的源模型。該源模型通過對人類語音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語音情感表征,極大地豐富了合成語音的表現(xiàn)力與可控性。微軟還進(jìn)一步構(gòu)建了基于角色和風(fēng)格變換的隱式表達(dá)空間,可以靈活地將多個不同的角色和風(fēng)格適應(yīng)到一個新的表現(xiàn)力豐富的說話人模型。

目前,微軟語音合成多角色可應(yīng)用在有聲書、兒童故事、新聞串講等多種場景,滿足不同的產(chǎn)品矩陣。

對于音頻內(nèi)容產(chǎn)業(yè)而言,微軟此次語音合成多角色技術(shù)更新不僅令聲音風(fēng)格更為多樣且具有感染力,也將進(jìn)一步降低音頻內(nèi)容生產(chǎn)成本、提高制作速度和質(zhì)量。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6554

    瀏覽量

    103896
  • 聲音
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    16217
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    774

    瀏覽量

    48684
收藏 人收藏

    評論

    相關(guān)推薦

    微軟Copilot Studio新功能:支持定制Agent 賦能用戶構(gòu)建自主智能

    微軟宣布重大更新,用戶可通過Microsoft Copilot Studio構(gòu)建自主智能體。麥肯錫、湯森路透等全球知名企業(yè)己利用智能體,實現(xiàn)
    的頭像 發(fā)表于 11-10 09:59 ?250次閱讀
    <b class='flag-5'>微軟</b>Copilot Studio新功能:支持定制Agent 賦能用戶構(gòu)建自主<b class='flag-5'>智能</b>體

    微軟發(fā)布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發(fā)布智能辦公工具 OfficePLUS V 3.0 版本。全新升級的 OfficePLUS V 3.0 新增
    的頭像 發(fā)表于 06-27 09:26 ?658次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實現(xiàn)人機(jī)自然對話

    智能語音交互技術(shù)是指通過語音識別、語音合成和自然語言理解等技術(shù),
    的頭像 發(fā)表于 05-23 15:14 ?346次閱讀

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻中的聲音,進(jìn)而自動生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?354次閱讀

    **十萬級口語識別,離線自然說技術(shù),讓智能照明更懂你**

    隨著人工智能技術(shù)的普及,智能家居設(shè)備開始走進(jìn)千家萬戶。而智能照明系統(tǒng)作為其不可或缺的一部分,占據(jù)著舉足輕重的地位。 所謂智能照明,就是通過語音
    發(fā)表于 04-29 17:09

    JXW56語音芯片,智能家居安全新升級

    智能升級煙霧語音IC
    的頭像 發(fā)表于 04-28 10:48 ?288次閱讀

    語音IC-智能語音芯片方案-您身邊的智選升級

    語音IC方案開發(fā)-智能語音升級OTP開發(fā)應(yīng)用場景
    的頭像 發(fā)表于 04-12 17:00 ?428次閱讀

    車內(nèi)語音識別技術(shù)智能駕駛中的應(yīng)用與前景

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,車內(nèi)語音識別技術(shù)逐漸成為智能駕駛領(lǐng)域的研究熱點。語音識別
    的頭像 發(fā)表于 02-19 11:46 ?739次閱讀

    語音合成技術(shù)智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將
    的頭像 發(fā)表于 02-01 18:09 ?593次閱讀

    語音數(shù)據(jù)集:智能語音技術(shù)的燃料與推動力

    隨著人工智能技術(shù)的不斷進(jìn)步,語音技術(shù)作為人機(jī)交互的重要方式,正在逐漸滲透到我們的日常生活中。而語音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-29 11:11 ?367次閱讀

    語音數(shù)據(jù)集:開啟智能語音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語音數(shù)據(jù)集在推動智能語音技術(shù)的進(jìn)步中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)
    的頭像 發(fā)表于 12-29 11:06 ?594次閱讀

    WT588F02KD-24SS語音芯片集成數(shù)碼管顯示驅(qū)動算法:聲音播放提示的智能升級

    語音技術(shù)的不斷發(fā)展中,一顆新型的WT588F02KD-24SS語音芯片引起了廣泛關(guān)注,其特色在于集成了可直接調(diào)用的數(shù)碼管顯示驅(qū)動算法。本文將深入探討這一創(chuàng)新技術(shù)的好處,以及它對
    的頭像 發(fā)表于 12-15 08:38 ?331次閱讀
    WT588F02KD-24SS<b class='flag-5'>語音</b>芯片集成數(shù)碼管顯示驅(qū)動算法:<b class='flag-5'>聲音</b>播放提示的<b class='flag-5'>智能</b><b class='flag-5'>升級</b>

    唯創(chuàng)知音WTR096A-16S語音芯片:引領(lǐng)喊話器聲音還原新時代

    隨著科技的不斷發(fā)展,聲音在各種場景中扮演著至關(guān)重要的角色。在喊話器領(lǐng)域,唯創(chuàng)知音的WTR096A-16S語音芯片以其卓越的性能和聲音還原度的提高,為喊話器應(yīng)用帶來了全新的體驗。1.
    的頭像 發(fā)表于 12-06 09:26 ?538次閱讀
    唯創(chuàng)知音WTR096A-16S<b class='flag-5'>語音</b>芯片:引領(lǐng)喊話器<b class='flag-5'>聲音</b>還原新時代

    離線語音識別及控制是怎樣的技術(shù)?

    引言:  隨著人工智能的飛速發(fā)展,離線語音識別技術(shù)成為了一項備受矚目的創(chuàng)新。離線語音識別技術(shù)能夠?qū)⑷说?b class='flag-5'>語
    發(fā)表于 11-24 17:41

    芯知識 | Flash可更換聲音語音芯片—引領(lǐng)音頻IC技術(shù)革新的新篇章

    、優(yōu)勢以及應(yīng)用場景,展望其在未來科技發(fā)展中的潛力。 一、Flash可更換聲音語音芯片概述 Flash可更換聲音語音芯片是一種基于Flash存儲技術(shù)
    的頭像 發(fā)表于 11-23 11:47 ?488次閱讀