0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI語音服務(wù)新增7種語言和31種聲音

電子那些事兒 ? 2019-03-01 10:37 ? 次閱讀

2月24日消息,為了擴(kuò)展AI語音服務(wù)的市場,谷歌除了加強語音辨識模型、語言支持?jǐn)?shù)量和聲音種類之外,也調(diào)整了語音服務(wù)的價格。

谷歌更新文字轉(zhuǎn)語音和語音轉(zhuǎn)文字服務(wù),除了優(yōu)化語音辨識模型、新支持7種語言和31種聲音之外,也調(diào)整了語音服務(wù)的價格,在特定的應(yīng)用情境中,用戶最多可以省下約50%的支出,而谷歌也提供每月前60分鐘免費的語言轉(zhuǎn)文字服務(wù)。

谷歌指出,語音辨識和生成技術(shù)在人機(jī)互動的應(yīng)用中非常關(guān)鍵,要讓人機(jī)互動更加自然、簡單且普遍,并不容易,即便使用準(zhǔn)確度高達(dá)90%的語音辨識模型,還是很難真正達(dá)到有效的對話,由于許多企業(yè)的語音辨識模型都是要在電話中運行,受到噪音的干擾,產(chǎn)生的文字資訊讓模型難以處理,谷歌于去年4月針對這種應(yīng)用場景推出電話和影片的語音轉(zhuǎn)文字服務(wù)。

經(jīng)過不斷優(yōu)化,現(xiàn)在電話的文字錯誤已降低了62%,而影片的語音轉(zhuǎn)文字模型錯誤率也降低了64%,除此之外,影片的語音轉(zhuǎn)文字模型在辨識多個說話者的情境中,像是會議或是廣播,也有很好的表現(xiàn)。

在價格方面,為了吸引更多用戶,谷歌將影片語音轉(zhuǎn)文字模型收費調(diào)降了25%,而在標(biāo)準(zhǔn)和影片模型服務(wù)中,選擇加入資料收集計畫的用戶,收費價格會減少33%,因此,若使用影片模型且選擇加入收集資料計畫的用戶,將能夠減少約50%的支出。

此外,支持的語言也是企業(yè)使用語音轉(zhuǎn)文字辨識模型的一大考量,現(xiàn)在谷歌新增了7個語言和方言,包含丹麥語、葡萄牙語、俄語、波蘭語、斯洛伐克語、烏克蘭語和挪威語,加上上述新增的語言,目前總共支持持21種語言,這些新增的語言都還是測試版。在語音生成模型方面,谷歌的語音生成系統(tǒng)WaveNet也新增了31種聲音,目前總共有包含21種語言的57種聲音。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢是什么?

    AI服務(wù)器是一專門為人工智能應(yīng)用設(shè)計的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合來滿足高吞吐量互聯(lián)的需求,為自然
    的頭像 發(fā)表于 09-21 11:43 ?51次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元

    在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標(biāo)志著
    的頭像 發(fā)表于 08-15 17:29 ?561次閱讀

    nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

    神經(jīng)語言(Neuro-Linguistic Programming,NLP) 神經(jīng)語言是一心理學(xué)方法,它研究人類思維、語言和行為之間的關(guān)系。NLP的核心理念是,我們可以通過改變我們的
    的頭像 發(fā)表于 07-09 10:35 ?560次閱讀

    語音識別和自然語言處理的區(qū)別和聯(lián)系

    Recognition) 1. 定義 語音識別,又稱為自動語音識別(Automatic Speech Recognition, ASR),是指將人類的語音信號轉(zhuǎn)換為計算機(jī)可識別的文本信息的過程。它是一
    的頭像 發(fā)表于 07-05 10:09 ?595次閱讀

    PLC編程語言和C語言的區(qū)別

    在工業(yè)自動化和計算機(jī)編程領(lǐng)域中,PLC(可編程邏輯控制器)編程語言和C語言各自扮演著重要的角色。盡管兩者都是編程語言,但它們在多個方面存在顯著的區(qū)別。本文將從多個維度深入探討PLC編程語言和
    的頭像 發(fā)表于 06-14 17:11 ?1575次閱讀

    三星Galaxy AI將支持19語言,覆蓋粵語及法語等

     截止當(dāng)前,三星Galaxy AI共支持13個語言,此舉將讓全球更多三星用戶享受到該產(chǎn)品的便利。此外,三星計劃至今年底再增加對羅馬尼亞語、土耳其語等8語言的支持。
    的頭像 發(fā)表于 04-15 15:56 ?823次閱讀

    谷歌Pixel 8將采用Gemini Nano模型,新增兩項AI功能

    經(jīng)谷歌披露,Pixel 8 在配備 Gemini Nano 后,首先將增加兩大創(chuàng)新 AI 功能:其中之一是 Recorder 應(yīng)用內(nèi)新增 Summarize 功能,無網(wǎng)絡(luò)情況下可記錄并歸納更多關(guān)于對話、采訪和演示的有用信息。
    的頭像 發(fā)表于 03-29 15:46 ?333次閱讀

    plc編程語言與c語言的聯(lián)系 c語言和PLC有什么區(qū)別

    PLC編程語言與C語言的聯(lián)系 PLC(可編程邏輯控制器)是一針對自動化控制系統(tǒng)的特殊計算機(jī)。PLC編程語言是為了控制和管理自動化生產(chǎn)過程中的各種設(shè)備而設(shè)計的。與之相比,C
    的頭像 發(fā)表于 02-05 14:21 ?3141次閱讀

    vb語言和c++語言的區(qū)別

    VB語言和C++語言是兩不同的編程語言,雖然它們都屬于高級編程語言,但在設(shè)計和用途上有很多區(qū)別。下面將詳細(xì)比較VB
    的頭像 發(fā)表于 02-01 10:20 ?1522次閱讀

    labview聲音采集與處理

    LabVIEW是一用于數(shù)據(jù)采集與處理的編程語言和開發(fā)環(huán)境。它具有強大的聲音采集和處理功能,可以幫助用戶實現(xiàn)聲音信號的采集、分析和處理。本文將詳細(xì)介紹LabVIEW在
    的頭像 發(fā)表于 01-04 10:48 ?1806次閱讀

    如何選擇創(chuàng)建c語言和c++

    選擇創(chuàng)建 C 語言和 C++ 都需要綜合考慮多個因素。在決定使用哪種語言之前,我們需要對這兩語言的特點、優(yōu)缺點、適用場景、學(xué)習(xí)成本等進(jìn)行全面的了解和對比。下面是關(guān)于選擇創(chuàng)建 C
    的頭像 發(fā)表于 11-27 15:58 ?455次閱讀

    腳本語言和編程語言的區(qū)別

    腳本語言和編程語言是計算機(jī)語言的兩個主要分類。盡管兩者都是用于編寫計算機(jī)程序的工具,但它們在設(shè)計和運行方式上存在一些顯著的區(qū)別。下面將詳細(xì)探討腳本語言和編程
    的頭像 發(fā)表于 11-22 14:33 ?2518次閱讀

    請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點?

    C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點?
    發(fā)表于 10-30 06:32

    請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點?

    C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點?
    發(fā)表于 10-26 07:47

    匯編語言和C語言哪個好用一點?

    匯編語言和C語言哪個好用一點
    發(fā)表于 10-25 08:02