0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google以豐富的對(duì)話情境資訊改進(jìn)客服中心AI的語音識(shí)別能力

931T_ctiforumne ? 來源:YXQ ? 2019-07-30 15:57 ? 次閱讀

2018年Next大會(huì)上推出的人工智能預(yù)包裝服務(wù)客服中心AI(Contact Center AI),現(xiàn)在Google透過增加人工智能理解對(duì)話情境的方法,進(jìn)一步強(qiáng)化虛擬代理人語音識(shí)別的能力,用戶現(xiàn)在還可以更靈活地自訂定義Speech Context類別,減少人工智能對(duì)于文字概念混淆的問題。

Google提到,即便客服中心虛擬代理人的語音識(shí)別精準(zhǔn)度達(dá)90%,但是比起實(shí)驗(yàn)室,實(shí)際使用環(huán)境以及雜訊的影響,在部分情況下,仍然會(huì)使得自動(dòng)語音識(shí)別的結(jié)果變得很糟,因此現(xiàn)在Google進(jìn)一步更新客服中心AI所使用的技術(shù),特別是在Dialogflow以及云端語音轉(zhuǎn)文字兩服務(wù),以提升辨識(shí)品質(zhì)。

Dialogflow讓用戶能夠在網(wǎng)頁、行動(dòng)應(yīng)用程式或是熱門的傳訊平臺(tái),建構(gòu)對(duì)話服務(wù),而這次更新,Google為Dialogflow加入了自動(dòng)語音調(diào)適能力(Auto Speech Adaptation),以對(duì)話情境資訊,解決虛擬代理人混淆單字發(fā)音的問題。

由于許多單字的讀音很相似,在電話中可能無法很清楚傳遞,像是cheese和these的發(fā)音,還有可能把mail誤翻成male或nail,但是當(dāng)虛擬代理人知道這些對(duì)話背景,發(fā)生在速食餐廳或是商品退貨時(shí),便不容易混淆這些字。用戶只要在Dialogflow控制臺(tái)中,將自動(dòng)語音調(diào)適功能打開,就能讓語音識(shí)別準(zhǔn)確度上升40%以上。

Google也改進(jìn)了互動(dòng)式語音應(yīng)答(IVR)以及電話虛擬代理人,所使用的云端語音轉(zhuǎn)文字基線模型,而這將會(huì)使語音轉(zhuǎn)錄的結(jié)果更好,Google以電話用語的常用短句最佳化了該模型,使得新模型的表現(xiàn),在美國英文上的辨識(shí)準(zhǔn)確度提高15%,再加上自動(dòng)語音調(diào)適功能,還能進(jìn)一步提升辨識(shí)的品質(zhì)。

開發(fā)人員在使用云端語音轉(zhuǎn)文字服務(wù)時(shí),能使用SpeechContext參數(shù)來控制情境資訊,讓語音轉(zhuǎn)錄更加精確,以讓虛擬代理人更精準(zhǔn)地辨識(shí)企業(yè)產(chǎn)品等特定名詞。

而現(xiàn)在Google在SpeechContext中新增類別,而預(yù)定義的類別則對(duì)應(yīng)到流行或是通用的概念上,使用情境像是在數(shù)字溝通時(shí),4個(gè)數(shù)字的組合可能代表年、時(shí)間或是金錢,而開發(fā)者可以在SpeechContext類別,調(diào)校整個(gè)自動(dòng)語音識(shí)別的單字列表,改善輸入語音的轉(zhuǎn)錄結(jié)果。

不過,Google也提到,使用SpeechContext這樣的工具,會(huì)增加部分短句被擷取的機(jī)率,這可能降低了語音有提及卻沒出現(xiàn)在轉(zhuǎn)錄文字上的錯(cuò)誤,但同時(shí)也會(huì)增加語音未提及卻出現(xiàn)在轉(zhuǎn)錄文字的情形,自動(dòng)語音調(diào)適的強(qiáng)度需要權(quán)衡結(jié)果進(jìn)行調(diào)整,而SpeechContext的Boost功能解決了開發(fā)者這樣的煩惱,可以自動(dòng)為使用案例調(diào)整語音調(diào)適的最佳強(qiáng)度。

過去云端語音轉(zhuǎn)語音服務(wù),處理語音只能以1分鐘為單位,而這對(duì)于需要較長時(shí)間轉(zhuǎn)錄文字的使用案例,像是會(huì)議、即時(shí)影片或是電話等是個(gè)大問題,現(xiàn)在Google將處理語音時(shí)間上限提高至5分鐘,而且API也允許開發(fā)人員開啟新的串流對(duì)話,來接續(xù)前一個(gè)串流對(duì)話,以做到無限時(shí)間的串流語音轉(zhuǎn)錄文字。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1748

    瀏覽量

    57193
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1696

    瀏覽量

    112250

原文標(biāo)題:Google以豐富的對(duì)話情境資訊改進(jìn)客服中心AI的語音識(shí)別能力

文章出處:【微信號(hào):ctiforumnews,微信公眾號(hào):CTI論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評(píng)測SDK合集)

    大模型語音問答、拍照識(shí)圖、大模型繪圖等豐富供能示例,支持語音喚醒、多輪語音交互。 2智能對(duì)話除了大模型
    發(fā)表于 06-18 17:33

    【Longan Pi 3H 開發(fā)板試用連載體驗(yàn)】給ChatGPT裝上眼睛,還可以語音對(duì)話

    對(duì)話能力。 目前計(jì)劃使用的具體方案和流程如下: 使用speech_recognition進(jìn)行語音輸入,完成后將語音數(shù)據(jù)導(dǎo)入Whisper或googl
    發(fā)表于 04-12 12:41

    Google多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些能力

    前段時(shí)間Google推出Gemini多模態(tài)大模型,展示了不凡的對(duì)話能力和多模態(tài)能力,其表現(xiàn)究竟如何呢?
    的頭像 發(fā)表于 12-28 11:19 ?1013次閱讀
    從<b class='flag-5'>Google</b>多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些<b class='flag-5'>能力</b>

    語音數(shù)據(jù)集在智能客服系統(tǒng)中的應(yīng)用與挑戰(zhàn)

    的效率和質(zhì)量。本文將詳細(xì)介紹語音數(shù)據(jù)集在智能客服系統(tǒng)中的應(yīng)用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。 二、語音數(shù)據(jù)集在智能客服系統(tǒng)中的應(yīng)用 語音
    的頭像 發(fā)表于 12-25 09:46 ?334次閱讀

    語音數(shù)據(jù)集:AI語音技術(shù)的靈魂

    提升語音識(shí)別和生成能力語音數(shù)據(jù)集為AI模型提供了豐富
    的頭像 發(fā)表于 12-14 14:33 ?827次閱讀

    語音數(shù)據(jù)集:推動(dòng)AI語音技術(shù)的核心力量

    的發(fā)展趨勢。 二、語音數(shù)據(jù)集的重要性 提高語音識(shí)別和生成能力語音數(shù)據(jù)集包含大量的語音樣本,可以
    的頭像 發(fā)表于 12-12 11:32 ?520次閱讀

    情感語音識(shí)別技術(shù)的現(xiàn)狀與未來

    一、引言 情感語音識(shí)別技術(shù)是近年來人工智能領(lǐng)域的研究熱點(diǎn)之一,它通過分析人類語音中的情感信息,為智能客服、心理健康監(jiān)測、娛樂產(chǎn)業(yè)等多個(gè)領(lǐng)域提供了重要的支持。本文將探討情感
    的頭像 發(fā)表于 11-15 16:36 ?509次閱讀

    情感語音識(shí)別在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

    。 二、情感語音識(shí)別在人機(jī)交互中的應(yīng)用 智能客服:智能客服可以利用情感語音識(shí)別技術(shù),對(duì)用戶的
    的頭像 發(fā)表于 11-15 15:42 ?452次閱讀

    情感語音識(shí)別技術(shù)的應(yīng)用與未來發(fā)展

    的應(yīng)用、未來發(fā)展趨勢以及面臨的挑戰(zhàn)。 二、情感語音識(shí)別技術(shù)的應(yīng)用 人機(jī)交互:情感語音識(shí)別技術(shù)在人機(jī)交互領(lǐng)域有著廣泛的應(yīng)用。例如,智能客服可以
    的頭像 發(fā)表于 11-12 17:30 ?601次閱讀

    基于深度學(xué)習(xí)的情感語音識(shí)別模型優(yōu)化策略

    情感語音識(shí)別技術(shù)是一種將人類語音轉(zhuǎn)化為情感信息的技術(shù),其應(yīng)用范圍涵蓋了人機(jī)交互、智能客服、心理健康監(jiān)測等多個(gè)領(lǐng)域。隨著人工智能技術(shù)的不斷發(fā)展,深度學(xué)習(xí)在情感
    的頭像 發(fā)表于 11-09 16:34 ?498次閱讀

    自然對(duì)話語音數(shù)據(jù):人機(jī)交互的新紀(jì)元與挑戰(zhàn)

    自然對(duì)話語音數(shù)據(jù)是指自然語言進(jìn)行交流的語音數(shù)據(jù),它代表著人機(jī)交互技術(shù)的巨大進(jìn)步。隨著人工智能和語音識(shí)別技術(shù)的飛速發(fā)展,我們正逐漸邁入一個(gè)可
    的頭像 發(fā)表于 11-08 17:01 ?347次閱讀

    離線語音識(shí)別和控制的工作原理及應(yīng)用

    引言離線語音識(shí)別是指在沒有網(wǎng)絡(luò)連接的情況下,通過在本地設(shè)備上進(jìn)行語音信號(hào)處理和識(shí)別,實(shí)現(xiàn)語音命令的轉(zhuǎn)化和執(zhí)行。隨著智能設(shè)備的普及,離線
    的頭像 發(fā)表于 11-07 18:04 ?713次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>和控制的工作原理及應(yīng)用

    離線語音識(shí)別和控制的工作原理及應(yīng)用

    引言   離線語音識(shí)別是指在沒有網(wǎng)絡(luò)連接的情況下,通過在本地設(shè)備上進(jìn)行語音信號(hào)處理和識(shí)別,實(shí)現(xiàn)語音命令的轉(zhuǎn)化和執(zhí)行。隨著智能設(shè)備的普及,離
    發(fā)表于 11-07 18:01

    語音識(shí)別技術(shù)在智能客服領(lǐng)域的應(yīng)用與優(yōu)化

    隨著人工智能技術(shù)的不斷發(fā)展,智能客服已成為企業(yè)提升服務(wù)質(zhì)量和效率的重要手段。語音識(shí)別技術(shù)作為智能客服的核心技術(shù)之一,能夠?yàn)?b class='flag-5'>客服工作帶來諸多便
    的頭像 發(fā)表于 11-01 17:00 ?483次閱讀

    語音識(shí)別技術(shù)在智能客服領(lǐng)域的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,智能客服成為了許多行業(yè)的重要應(yīng)用。語音識(shí)別技術(shù)作為智能客服的重要組成部分,對(duì)于提高客戶滿意度和提升企業(yè)效率具有重要意義。本文將探討
    的頭像 發(fā)表于 10-25 10:37 ?548次閱讀