0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采用人工智能技術(shù)的高質(zhì)量合成語音開發(fā)和定制

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-08 09:28 ? 次閱讀

當(dāng)涉及到高質(zhì)量的合成語音開發(fā)和定制時(shí),深度學(xué)習(xí)被證明是一個(gè)強(qiáng)大的工具。一家總部位于多倫多的初創(chuàng)公司, NVIDIA Inception 成員類似人工智能正在利用一種新的生成語音工具增加賭注,該工具能夠創(chuàng)建高質(zhì)量的合成人工智能語音。

這項(xiàng)技術(shù)可以在 50 多種最流行的語言中生成跨語言和自然說話的聲音,通過相似填充,用戶可以創(chuàng)建編程音頻,編輯和替換音頻片段中的單詞。

構(gòu)建、部署和擴(kuò)展現(xiàn)實(shí)人工智能語音的能力將幫助眾多行業(yè)。應(yīng)用范圍廣泛,從為廣告創(chuàng)建人工智能生成的文本,到交互式語音應(yīng)答系統(tǒng),再到視頻游戲開發(fā)。

自 2020 年 7 月以來,相似人工智能團(tuán)隊(duì)與 NVIDIA 的對(duì)話人工智能團(tuán)隊(duì)密切合作,將 NVIDIA riva多模態(tài)對(duì)話人工智能 SDK 集成到他們的語音管道中。據(jù)人工智能創(chuàng)始人兼首席執(zhí)行官佐哈伊布·艾哈邁德( Zohaib Ahmed )稱,這種經(jīng)歷讓他們?cè)谡麄€(gè)人工智能對(duì)話管道中融入了獨(dú)特的 i NSight 。

“ NVIDIA Inception 計(jì)劃有助于為對(duì)話人工智能領(lǐng)域提供關(guān)鍵 i NSight 以及為我們作為產(chǎn)品的每項(xiàng)工作推薦 GPU 計(jì)算提供技術(shù)支持,” Ahmed 說。

為了訓(xùn)練他們的語音模型和推理能力,該團(tuán)隊(duì)正在使用 Amazon 彈性 Kubernetes 服務(wù)( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他們使用 NVIDIA Triton 推理服務(wù)器在生產(chǎn)中大規(guī)模部署他們訓(xùn)練有素的人工智能模型。

最近一個(gè)與 NVIDIA Omniverse Audio2Face集成的類似人工智能合成語音演示展示了組合技術(shù)如何從單一音頻源創(chuàng)建富有表情的面部動(dòng)畫和聲音。

Ahmed 說:“ Audio2Face 是一個(gè)很好的例子,它是一個(gè)強(qiáng)大的工具,可以很容易地與生成性人工智能語音相結(jié)合,在幾秒鐘內(nèi)產(chǎn)生結(jié)果,否則需要幾天時(shí)間?!?。

公司 已經(jīng)發(fā)展到擁有超過 150000 個(gè)用戶,建立了超過 60000 個(gè)語音。迄今為止, 類似人工智能在電信、金融、通訊中心、教育、游戲、媒體和娛樂等行業(yè)擁有 240 多個(gè)付費(fèi)客戶。

關(guān)于作者

Michelle Horton 是 NVIDIA 的高級(jí)開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點(diǎn)介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4793

    瀏覽量

    102425
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234968
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    ,對(duì)于每個(gè)交叉領(lǐng)域,本書通過案例進(jìn)行了詳盡的介紹,梳理了產(chǎn)業(yè)地圖,并給出了相關(guān)政策啟示。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》適合所有關(guān)注人工智能技術(shù)和產(chǎn)業(yè)發(fā)展的讀者閱讀,特別適合
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會(huì)暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能技術(shù)
    發(fā)表于 07-29 17:05

    四川將人工智能納入首個(gè)創(chuàng)新工程,助力高質(zhì)量發(fā)展

    四川作為我國“東數(shù)西算”工程的重要節(jié)點(diǎn),擁有兩家國家級(jí)算力平臺(tái),1100多家人工智能企業(yè),以及27所設(shè)有人工智能相關(guān)專業(yè)的高校。因此,四川將發(fā)展人工智能視為推進(jìn)高質(zhì)量發(fā)展的先導(dǎo)策略,集
    的頭像 發(fā)表于 05-28 09:56 ?315次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時(shí)長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https
    發(fā)表于 05-10 16:46

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國內(nèi)外科技巨頭紛紛爭(zhēng)先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時(shí),國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式AI開發(fā)
    發(fā)表于 02-26 10:17

    語音合成技術(shù)智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能
    的頭像 發(fā)表于 02-01 18:09 ?513次閱讀

    人工智能技術(shù)的優(yōu)勢(shì)有哪些

    人工智能技術(shù)的優(yōu)勢(shì)
    的頭像 發(fā)表于 01-19 15:58 ?2786次閱讀

    語音數(shù)據(jù)集:推動(dòng)人工智能語音技術(shù)的關(guān)鍵要素

    隨著人工智能技術(shù)的飛速發(fā)展,語音技術(shù)已成為人機(jī)交互領(lǐng)域的重要一環(huán)。語音數(shù)據(jù)集作為支撐語音技術(shù)研發(fā)
    的頭像 發(fā)表于 12-29 11:00 ?450次閱讀

    語音數(shù)據(jù)集在人工智能中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的快速發(fā)展,語音數(shù)據(jù)集在各種應(yīng)用中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)集是AI語音技術(shù)的基石,對(duì)于
    的頭像 發(fā)表于 12-14 15:00 ?504次閱讀

    雙目測(cè)寬儀高質(zhì)量生產(chǎn)利器 測(cè)寬儀價(jià)格

    :500Hz; 電源電壓:AC 220±15% V,50Hz; KX02-SY1000型雙目測(cè)寬儀是高質(zhì)量高精度的可應(yīng)用于熱軋、冷軋板材的在線檢測(cè)設(shè)備,熱軋時(shí)利用其自發(fā)光即可檢測(cè),冷軋時(shí),則需要安裝光源進(jìn)行補(bǔ)
    發(fā)表于 12-04 17:10

    賦能“AI+行業(yè)”應(yīng)用!廣州高企高質(zhì)量發(fā)展對(duì)接會(huì)(人工智能場(chǎng)景供需對(duì)接專場(chǎng))成功舉辦

    主體力量,助力廣州人工智能產(chǎn)業(yè)高地建設(shè)。11月7日,2023年民營企業(yè)服務(wù)周系列活動(dòng)之廣州人工智能應(yīng)用場(chǎng)景供需對(duì)接活動(dòng)(第三期廣州高企高質(zhì)量發(fā)展對(duì)接會(huì))順利舉行。 本次活動(dòng)是在廣州市科學(xué)技術(shù)
    的頭像 發(fā)表于 11-13 10:19 ?938次閱讀
    賦能“AI+行業(yè)”應(yīng)用!廣州高企<b class='flag-5'>高質(zhì)量</b>發(fā)展對(duì)接會(huì)(<b class='flag-5'>人工智能</b>場(chǎng)景供需對(duì)接專場(chǎng))成功舉辦

    高質(zhì)量LTE網(wǎng)絡(luò)改變傳統(tǒng)天線技術(shù)

    電子發(fā)燒友網(wǎng)站提供《高質(zhì)量LTE網(wǎng)絡(luò)改變傳統(tǒng)天線技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 11-10 15:25 ?0次下載
    <b class='flag-5'>高質(zhì)量</b>LTE網(wǎng)絡(luò)改變傳統(tǒng)天線<b class='flag-5'>技術(shù)</b>

    高質(zhì)量C、C++編程指南

    林銳-高質(zhì)量C、C++編程指南電子檔
    發(fā)表于 10-07 07:14

    人工智能重塑產(chǎn)業(yè)的奇點(diǎn)臨近

    制造業(yè)的高質(zhì)量發(fā)展,向來是經(jīng)濟(jì)高質(zhì)量發(fā)展的重中之重。而人工智能蘊(yùn)含的產(chǎn)業(yè)變革潛力,將促進(jìn)制造向“智造”躍遷。將人工智能技術(shù)應(yīng)用到制造業(yè),可以使制造業(yè)在數(shù)字化和網(wǎng)絡(luò)化的基礎(chǔ)上,實(shí)現(xiàn)機(jī)器的
    的頭像 發(fā)表于 09-22 16:23 ?593次閱讀
    <b class='flag-5'>人工智能</b>重塑產(chǎn)業(yè)的奇點(diǎn)臨近