亚洲嫩模久久精品,麻豆精品传媒一二三区入口

谷歌AI語音服務(wù)新增7種語言和31種聲音

2月24日消息，為了擴(kuò)展AI語音服務(wù)的市場，谷歌除了加強語音辨識模型、語言支持?jǐn)?shù)量和聲音種類之外，也調(diào)整了語音服務(wù)的價格。

谷歌更新文字轉(zhuǎn)語音和語音轉(zhuǎn)文字服務(wù)，除了優(yōu)化語音辨識模型、新支持7種語言和31種聲音之外，也調(diào)整了語音服務(wù)的價格，在特定的應(yīng)用情境中，用戶最多可以省下約50%的支出，而谷歌也提供每月前60分鐘免費的語言轉(zhuǎn)文字服務(wù)。

谷歌指出，語音辨識和生成技術(shù)在人機(jī)互動的應(yīng)用中非常關(guān)鍵，要讓人機(jī)互動更加自然、簡單且普遍，并不容易，即便使用準(zhǔn)確度高達(dá)90%的語音辨識模型，還是很難真正達(dá)到有效的對話，由于許多企業(yè)的語音辨識模型都是要在電話中運行，受到噪音的干擾，產(chǎn)生的文字資訊讓模型難以處理，谷歌于去年4月針對這種應(yīng)用場景推出電話和影片的語音轉(zhuǎn)文字服務(wù)。

經(jīng)過不斷優(yōu)化，現(xiàn)在電話的文字錯誤已降低了62%，而影片的語音轉(zhuǎn)文字模型錯誤率也降低了64%，除此之外，影片的語音轉(zhuǎn)文字模型在辨識多個說話者的情境中，像是會議或是廣播，也有很好的表現(xiàn)。

在價格方面，為了吸引更多用戶，谷歌將影片語音轉(zhuǎn)文字模型收費調(diào)降了25%，而在標(biāo)準(zhǔn)和影片模型服務(wù)中，選擇加入資料收集計畫的用戶，收費價格會減少33%，因此，若使用影片模型且選擇加入收集資料計畫的用戶，將能夠減少約50%的支出。

此外，支持的語言也是企業(yè)使用語音轉(zhuǎn)文字辨識模型的一大考量，現(xiàn)在谷歌新增了7個語言和方言，包含丹麥語、葡萄牙語、俄語、波蘭語、斯洛伐克語、烏克蘭語和挪威語，加上上述新增的語言，目前總共支持持21種語言，這些新增的語言都還是測試版。在語音生成模型方面，谷歌的語音生成系統(tǒng)WaveNet也新增了31種聲音，目前總共有包含21種語言的57種聲音。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

什么是AI服務(wù)器？AI服務(wù)器的優(yōu)勢是什么？

AI服務(wù)器是一種專門為人工智能應(yīng)用設(shè)計的服務(wù)器，它采用異構(gòu)形式的硬件架構(gòu)，通常搭載GPU、FPGA、ASIC等加速芯片，利用CPU與加速芯片的組合來滿足高吞吐量互聯(lián)的需求，為自然

發(fā)表于 09-21 11:43 ?51次閱讀

谷歌推出Gemini Live，開啟AI語音聊天新紀(jì)元

在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會上，谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live，該服務(wù)自今日起，率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標(biāo)志著

發(fā)表于 08-15 17:29 ?561次閱讀

nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

神經(jīng)語言（Neuro-Linguistic Programming，NLP）神經(jīng)語言是一種心理學(xué)方法，它研究人類思維、語言和行為之間的關(guān)系。NLP的核心理念是，我們可以通過改變我們的

發(fā)表于 07-09 10:35 ?560次閱讀

語音識別和自然語言處理的區(qū)別和聯(lián)系

Recognition） 1. 定義語音識別，又稱為自動語音識別（Automatic Speech Recognition, ASR），是指將人類的語音信號轉(zhuǎn)換為計算機(jī)可識別的文本信息的過程。它是一

發(fā)表于 07-05 10:09 ?595次閱讀

PLC編程語言和C語言的區(qū)別

在工業(yè)自動化和計算機(jī)編程領(lǐng)域中，PLC（可編程邏輯控制器）編程語言和C語言各自扮演著重要的角色。盡管兩者都是編程語言，但它們在多個方面存在顯著的區(qū)別。本文將從多個維度深入探討PLC編程語言和

發(fā)表于 06-14 17:11 ?1575次閱讀

三星Galaxy AI將支持19種語言，覆蓋粵語及法語等

　截止當(dāng)前，三星Galaxy AI共支持13個語言，此舉將讓全球更多三星用戶享受到該產(chǎn)品的便利。此外，三星計劃至今年底再增加對羅馬尼亞語、土耳其語等8種語言的支持。

發(fā)表于 04-15 15:56 ?823次閱讀

谷歌Pixel 8將采用Gemini Nano模型，新增兩項AI功能

經(jīng)谷歌披露，Pixel 8 在配備 Gemini Nano 后，首先將增加兩大創(chuàng)新 AI 功能：其中之一是 Recorder 應(yīng)用內(nèi)新增 Summarize 功能，無網(wǎng)絡(luò)情況下可記錄并歸納更多關(guān)于對話、采訪和演示的有用信息。

發(fā)表于 03-29 15:46 ?333次閱讀

plc編程語言與c語言的聯(lián)系 c語言和PLC有什么區(qū)別

PLC編程語言與C語言的聯(lián)系 PLC（可編程邏輯控制器）是一種針對自動化控制系統(tǒng)的特殊計算機(jī)。PLC編程語言是為了控制和管理自動化生產(chǎn)過程中的各種設(shè)備而設(shè)計的。與之相比，C

發(fā)表于 02-05 14:21 ?3141次閱讀

vb語言和c++語言的區(qū)別

VB語言和C++語言是兩種不同的編程語言，雖然它們都屬于高級編程語言，但在設(shè)計和用途上有很多區(qū)別。下面將詳細(xì)比較VB

發(fā)表于 02-01 10:20 ?1522次閱讀

labview聲音采集與處理

LabVIEW是一種用于數(shù)據(jù)采集與處理的編程語言和開發(fā)環(huán)境。它具有強大的聲音采集和處理功能，可以幫助用戶實現(xiàn)聲音信號的采集、分析和處理。本文將詳細(xì)介紹LabVIEW在

發(fā)表于 01-04 10:48 ?1806次閱讀

如何選擇創(chuàng)建c語言和c++

選擇創(chuàng)建 C 語言和 C++ 都需要綜合考慮多個因素。在決定使用哪種語言之前，我們需要對這兩種語言的特點、優(yōu)缺點、適用場景、學(xué)習(xí)成本等進(jìn)行全面的了解和對比。下面是關(guān)于選擇創(chuàng)建 C

發(fā)表于 11-27 15:58 ?455次閱讀

腳本語言和編程語言的區(qū)別

腳本語言和編程語言是計算機(jī)語言的兩個主要分類。盡管兩者都是用于編寫計算機(jī)程序的工具，但它們在設(shè)計和運行方式上存在一些顯著的區(qū)別。下面將詳細(xì)探討腳本語言和編程

發(fā)表于 11-22 14:33 ?2518次閱讀

請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

發(fā)表于 10-30 06:32

請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

發(fā)表于 10-26 07:47

匯編語言和C語言哪個好用一點？

匯編語言和C語言哪個好用一點

發(fā)表于 10-25 08:02

搜索歷史

谷歌AI語音服務(wù)新增7種語言和31種聲音

評論

什么是AI服務(wù)器？AI服務(wù)器的優(yōu)勢是什么？

谷歌推出Gemini Live，開啟AI語音聊天新紀(jì)元

nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

語音識別和自然語言處理的區(qū)別和聯(lián)系

PLC編程語言和C語言的區(qū)別

三星Galaxy AI將支持19種語言，覆蓋粵語及法語等

谷歌Pixel 8將采用Gemini Nano模型，新增兩項AI功能

plc編程語言與c語言的聯(lián)系 c語言和PLC有什么區(qū)別

vb語言和c++語言的區(qū)別

labview聲音采集與處理

如何選擇創(chuàng)建c語言和c++

腳本語言和編程語言的區(qū)別

請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

請問C語言和匯編語言在開發(fā)單片機(jī)時各有哪些優(yōu)缺點？

匯編語言和C語言哪個好用一點？