0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

虛擬形象賦予AI助手個性化特征,讓人機交互體驗耳目一新

如意 ? 來源:51cto ? 作者:佚名 ? 2020-09-18 14:31 ? 次閱讀

數(shù)字化時代風(fēng)口常立,身處潮起浪涌的技術(shù)圈,越能從前沿動態(tài)中感受行業(yè)動態(tài)與趨勢。在這個融合物理與虛擬的全新時代,由AI驅(qū)動的AI助手如同互聯(lián)網(wǎng)時代的PC,移動互聯(lián)網(wǎng)時代的智能手機,成為我們進入智能時代的超級入口。

在主題為“未來經(jīng)濟,數(shù)字優(yōu)先”的2020騰訊全球數(shù)字生態(tài)大會上,AI行業(yè)內(nèi)的專業(yè)人士集中討論了AI助手演進的最新成果。作為智聯(lián)網(wǎng)時代人機交互入口,AI助手在AI賦能下帶來行業(yè)解決方案,以AI語音交互能力為核心,結(jié)合知識圖譜、IP虛擬形象、全雙工等優(yōu)勢能力的打造,對傳統(tǒng)對話機器人做全方位升級,讓AI助手也能具備社會人的屬性。

簡單來說,就是AI助手能夠滿足更多個性化、場景化、情感化的需求,在“工作崗位”上幫助企業(yè)提升效率、節(jié)約成本、增強效果,而這一切,離不開AI語音助手從技術(shù)層面為AI助手“大開腦洞”。

結(jié)合騰訊智能平臺副總裁李學(xué)朝在論壇上以“騰訊云小微,打造數(shù)字員工助力行業(yè)升級”為主題的演講,讓我們走進AI技術(shù)賦能下AI助手的技術(shù)和應(yīng)用升級。

全雙工交互實現(xiàn)AI助手自然對話,打造情感化的語音交互

從技術(shù)層面來看,實現(xiàn)AI助手的對話交互難度并不大,面對一般指令如“今天的天氣怎么樣”,或者是執(zhí)行一些簡單的任務(wù),如播放音樂等,每一次問答都屬于語音交互的范疇。

但是如何讓交互變交流,打造自然流暢的對話體驗,更符合真實業(yè)務(wù)場景的需求,就需要在技術(shù)端通過技術(shù)創(chuàng)新賦予AI助手有情感的靈魂。

為此,騰訊云小微AI語音助手提供了解決方案,以全領(lǐng)域、全雙工實現(xiàn)全業(yè)務(wù)場景覆蓋,以ASR+NLP雙向拒識判斷極大降低錯誤響應(yīng)概率(誤識率 《 0.01 且 拒識率 《 0.1),以流式語義+語義VAD在低延遲下真正做到邊聽邊思考,共同組成AI助手自然對話的基礎(chǔ)。

其中全雙工交互可以做到一次喚醒實現(xiàn)多輪連續(xù)自由對話,并且可以隨時打斷,AI助手也可以準(zhǔn)確拾取相關(guān)指令并作出正確反饋。相較于“單工”和“半雙工”技術(shù),可以做到雙向?qū)崟r交流。單一場景下的全雙工交互技術(shù)比較好理解,例如播放音樂時可以連續(xù)指令“現(xiàn)在播放的這首歌是什么名字”、“幫我收藏這首歌“等等。

虛擬形象賦予AI助手個性化特征,讓人機交互體驗耳目一新

而在全領(lǐng)域人機交互中,人們的對話可能穿插著很多議題,不受場景的限制實現(xiàn)自然交互。面對任務(wù)型+問答型+閑聊的全業(yè)務(wù)場景,如在車載環(huán)境中,騰訊云小微車載語音助手能夠根據(jù)車內(nèi)收音的音區(qū)判別發(fā)出指令的用戶,同時結(jié)合背景噪音的識別、多人聊天背景音等環(huán)境音的識別分析,拾取用戶跟車機對話的指令,回答用戶所需。

與此同時,騰訊云小微AI語音助手實現(xiàn)的AI助手還整合了語音交互、自然語言理解、聲紋識別、圖像識別等AI能力,面向不同場景復(fù)雜噪聲針對性提升技術(shù)能力,不斷提高復(fù)雜噪聲環(huán)境下喚醒率、語音識別準(zhǔn)確率及意圖理解準(zhǔn)確率,為用戶提供自然、豐富的交互服務(wù)。其中以ASR+NLP雙向拒識判斷為技術(shù)特點,極大降低錯誤響應(yīng)概率,誤識率《 0.01且拒識率《 0.1。

另外在自然交流中從聽懂到準(zhǔn)確表達,還需要AI助手在流式語義處理方式取得突破,騰訊云小微AI語音助手能夠以200毫秒為單位上傳語音,讓云端大腦能夠做到邊聽邊想,同時結(jié)合場景和上下文預(yù)測用戶語義,提前思考怎么回復(fù),在低延時特性下從加快響應(yīng)的速度。

知識圖譜提升AI助手生產(chǎn)力,成為AI語音助手進步的階梯

在大會中,李學(xué)朝對AI助手的專業(yè)拋出了這樣的觀點,“人工智能不是人工智障,云小微的知識圖譜能力作為機器人的大腦,將專業(yè)知識網(wǎng)狀串聯(lián)起來,不僅直線思考,還能推理、判斷,提供更加專業(yè)的業(yè)務(wù)服務(wù)?!?/p>

其實對于AI領(lǐng)域來說,知識圖譜的重要性在現(xiàn)在、未來都不言而喻。知識圖譜對于人工智能的重要價值在于,知識是人工智能的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如狗的嗅覺。

如何讓AI助手具備認(rèn)知能力,從而有效提升生產(chǎn)力?騰訊云小微的做法值得思考,在程序設(shè)計上詳細(xì)展示了AI助手的“成長”經(jīng)歷。

一是通過知識抽取,構(gòu)建行業(yè)知識圖譜。為了讓AI助手更深刻的理解行業(yè)知識,云小微知識圖譜平臺支持從行業(yè)數(shù)據(jù)中抽取出行業(yè)知識,助力行業(yè)伙伴構(gòu)建行業(yè)專屬的知識圖譜。如在旅游行業(yè),AI導(dǎo)游福大人身為內(nèi)閣大學(xué)士,不僅能跟游客閑聊互動,還能為游客推薦個性化的游覽路線,講解景點文物,暢聊歷史趣聞軼事。在大數(shù)據(jù)的支持下,源源不斷的旅游行業(yè)知識圖譜和資源數(shù)據(jù)涌入AI導(dǎo)游福大人的通用知識庫,讓AI助手在行業(yè)服務(wù)中發(fā)揮顯著作用。

二是通過知識融合,打破行業(yè)知識孤島。為了打破各行業(yè)間的知識孤島,云小微以自有的海量通用知識為中心,通過實體鏈接、屬性融合等多種知識融合技術(shù),連接各行業(yè)的知識圖譜。如在AI助手的客服應(yīng)用落地中,騰訊云小微AI語音助手重視知識圖譜的作用,將文本模式分類拆分為知識庫檢索、服務(wù)售前、服務(wù)售后等模式,檢索為功能性檢索,售前、售后可根據(jù)問題回答策略轉(zhuǎn)向人工模式。其中分層模塊的搭建上注重知識庫的基礎(chǔ)搭建,使得模塊分工明確,流程簡單。

三是通過知識關(guān)聯(lián),整合行業(yè)資源數(shù)據(jù)。通過知識關(guān)聯(lián)將多源異構(gòu)的行業(yè)資源鏈接到知識圖譜中,形成知識大腦,賦予數(shù)字員工更豐富的能力。這一點AI助手利用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系,把行業(yè)知識、資源數(shù)據(jù)與通用圖譜進行關(guān)聯(lián),形成知識大腦,讓AI助手成為具備問答、可視化、數(shù)據(jù)治理、主動服務(wù)等能力的知識圖譜平臺。

因此在不同領(lǐng)域,AI技術(shù)將碎片化、多模態(tài)的數(shù)據(jù)經(jīng)過抽取、融合、關(guān)聯(lián)后形成知識圖譜,高效利用原始數(shù)據(jù),進而支撐數(shù)據(jù)推理、模型應(yīng)用分析,真正實現(xiàn)專業(yè)能力的提升。

虛擬形象賦予AI助手個性化特征,讓人機交互體驗耳目一新

隨著人工智能水平的不斷進步,AI早已不再是冷冰冰的科技,而是演變成為能幫助人類享受智慧生活、守護情感世界的好幫手。其中AI助手所實現(xiàn)的數(shù)字員工如虛擬導(dǎo)游、虛擬客服、虛擬老師,以豐富的 IP 形象庫+細(xì)膩的情感呈現(xiàn)讓AI助手帶來的人機交互體驗更為形象生動。

比如在AI助手形象塑造上,通過騰訊云小微AI語音助手提供的虛擬形象服務(wù),騰訊云小微AI語音助手提供了包括從語音的識別到形象輸出的全鏈條完整方案。客戶可以根據(jù)實際使用場景的需要,來選擇不同的方案落地。如果對形象有要求,騰訊云小微支持為企業(yè)打造專屬的2D3D形象;騰訊云小微還與騰訊海量的IP資源進行授權(quán)合作,企業(yè)可以結(jié)合熱門IP,打造更加有特色的數(shù)字化服務(wù),引發(fā)更多的關(guān)注及話題

如在虛擬客服的應(yīng)用中,AI助手通過AI自動預(yù)測表情、實時處理唇形,語音合成技術(shù),使得效果逼真足以媲美真人;提供50+種不同男女聲音色,個性化音色定制能力,王者榮耀妲己、李白定制語音包;采用業(yè)內(nèi)領(lǐng)先的算法,優(yōu)化不同場景中的語音音色,以及語音識別、語義理解等智能交互技術(shù),讓AI語音助手發(fā)聲更為自然。

如果對情感呈現(xiàn)有要求,通過AI助手細(xì)膩的情感化呈現(xiàn)技術(shù)方案,虛擬人的情緒可以表現(xiàn)在跟用戶互動過程中的肢體動作、面部表情以及聲音情緒等上面,讓虛擬人的表現(xiàn)更加情感化。

如在本次大會上亮相的《鏡·雙城》中的女主那笙,從動漫世界走進論壇現(xiàn)場,化身為能說會道,還能思考,推理判斷,業(yè)務(wù)能力超強的AI助手,通過表情、動作一邊說話一邊表達情緒,讓機器人的服務(wù)不再冷冰冰,而是更加立體、有溫度。

擁抱數(shù)字化未來,專業(yè)、自然、形象的AI助手擁有怎樣的“未來密碼”?

從前沿科技到行業(yè)落地有多遠(yuǎn)?在數(shù)字化浪潮中,一個專業(yè)、自然、形象的AI助手無疑會成為行業(yè)升級的可靠助力,隨著5G高帶寬與實時運算的不斷增強,AI助手的應(yīng)用場景還將進一步得到激活。

正如李學(xué)朝對未來的展望所言,“騰訊云小微會持續(xù)發(fā)力優(yōu)勢賽道,結(jié)合場景打造產(chǎn)品化能力,在出行、政務(wù)、文旅、教育等行業(yè),通過我們技術(shù)-產(chǎn)品-場景化方案,優(yōu)化企業(yè)成本結(jié)構(gòu),挖掘產(chǎn)業(yè)新價值,打造產(chǎn)業(yè)新動能?!?/p>

利用越來越自然的人機交互方式,AI助手結(jié)合IP虛擬形象和語音交互,成為文旅、在線教育、客服等領(lǐng)域的???,豐富生動的形象還可以在深度開發(fā)中實現(xiàn)性格的定制,提升服務(wù)價值。

作為全面鏈接智能的新生態(tài),AI助手利用自身強大的AI能力幫助行業(yè)為用戶提供從需求到服務(wù)被滿足的智慧鏈接。如在虛擬客服的應(yīng)用中,AI助手更加智能,更懂用戶需求,即時、流暢的應(yīng)答,極大的提升了用戶的使用體驗。同時還能通過算法的優(yōu)化為出行生活增添便利,幫助用戶在細(xì)微瑣事上完成決策,用“信息便利”減少“身體能量消耗”,讓精力用到更值得的地方。

未來,AI助手還將持續(xù)為產(chǎn)業(yè)互聯(lián)提供新動能,不斷助力企業(yè)提升服務(wù)水平,為消費者帶來更好的使用體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關(guān)注

    關(guān)注

    12

    文章

    1199

    瀏覽量

    55269
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29824

    瀏覽量

    268116
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    282

    瀏覽量

    27963
收藏 人收藏

    評論

    相關(guān)推薦

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互直是研究的核心領(lǐng)域之。隨著技術(shù)的進步,人機交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現(xiàn)在的自然語言處理和語音識別,每
    的頭像 發(fā)表于 10-27 09:58 ?218次閱讀

    AI破解個性化客服難題

    文匯集多個行業(yè)借助 AI 實現(xiàn)的個性化客服實踐
    的頭像 發(fā)表于 10-25 09:06 ?1791次閱讀
    以<b class='flag-5'>AI</b>破解<b class='flag-5'>個性化</b>客服難題

    聚徽-工控體機是如何實現(xiàn)人機交互

    工控體機實現(xiàn)人機交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?266次閱讀

    Meta發(fā)布Imagine Yourself AI模型,重塑個性化圖像生成未來

    Meta公司近日在人工智能領(lǐng)域邁出了重要步,隆重推出了其創(chuàng)新之作——“Imagine Yourself”AI模型,這突破性技術(shù)為個性化圖像生成領(lǐng)域帶來了前所未有的變革。在社交媒體與
    的頭像 發(fā)表于 08-26 10:59 ?434次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細(xì)探討基于傳感器的人機交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來
    的頭像 發(fā)表于 07-17 16:52 ?604次閱讀

    人機交互界面是什么_人機交互界面的功能

    人機交互界面(Human-Computer Interaction Interface,簡稱HCI或HMI),也被稱為人機界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?2017次閱讀

    工業(yè)平板電腦在人機交互中的應(yīng)用

    工業(yè)平板電腦在人機交互(Human-Machine Interaction,HMI)中扮演著至關(guān)重要的角色,它們通過直觀的界面和強大的計算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應(yīng)用:
    的頭像 發(fā)表于 06-18 12:00 ?242次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的部分。人機交互技術(shù),作為實現(xiàn)人與計算機之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?767次閱讀

    利用應(yīng)變傳感器陣列實現(xiàn)復(fù)雜的人體運動捕捉

    基于柔性傳感器的運動捕捉技術(shù)在個性化醫(yī)療、人機交互、虛擬現(xiàn)實(VR)/增強現(xiàn)實(AR)等諸多領(lǐng)域中展現(xiàn)出巨大的發(fā)展?jié)摿Α?/div>
    的頭像 發(fā)表于 03-17 09:11 ?1043次閱讀
    利用應(yīng)變傳感器陣列實現(xiàn)復(fù)雜的人體運動捕捉

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?2681次閱讀

    人機交互技術(shù)有哪幾種 人機交互技術(shù)的發(fā)展趨勢

    人機交互技術(shù)是指人與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術(shù)。隨著科技的進步,人機交互技術(shù)也在不斷發(fā)展創(chuàng)新。以下將介紹人機交互技術(shù)的幾種常見形式以及當(dāng)前的發(fā)展趨勢。
    的頭像 發(fā)表于 01-22 17:47 ?3310次閱讀

    榮耀發(fā)布MagicOS 8.0,首次實現(xiàn)意圖識別人機交互

    在科技圈掀起股熱潮的榮耀正式發(fā)布了其自主研發(fā)的全新操作系統(tǒng)——MagicOS 8.0,并賦予個富有魔法的中文名字:魔法OS 8.0。這款新操作系統(tǒng)憑借其獨創(chuàng)的平臺級AI使能的意圖
    的頭像 發(fā)表于 01-12 14:50 ?851次閱讀

    情感語音識別技術(shù)在人機交互中的應(yīng)用與展望

    、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機交互已經(jīng)滲透到日常生活的方方面面。情感語音識別作為人機交互中的關(guān)鍵技術(shù)之,能夠通過分析人類語音中的情感信息實現(xiàn)更加智能
    的頭像 發(fā)表于 11-22 10:40 ?714次閱讀

    情感語音識別在人機交互中的應(yīng)用與挑戰(zhàn)

    、引言 情感語音識別是近年來人工智能領(lǐng)域的研究熱點之,它能夠通過分析人類語音中的情感信息實現(xiàn)更加智能個性化人機交互。本文將探討情感
    的頭像 發(fā)表于 11-15 15:42 ?519次閱讀

    情感語音識別技術(shù)的應(yīng)用與未來發(fā)展

    、引言 隨著科技的飛速發(fā)展,情感語音識別技術(shù)已經(jīng)成為人機交互的重要發(fā)展方向。情感語音識別技術(shù)能夠通過分析人類語音中的情感信息,實現(xiàn)更加智能個性化
    的頭像 發(fā)表于 11-12 17:30 ?753次閱讀