0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里語音機(jī)器人首次實現(xiàn)與主播的實時互動 反應(yīng)速度是Siri的20倍

工程師鄧生 ? 來源:獵云網(wǎng) ? 作者:獵云網(wǎng) ? 2020-11-02 17:47 ? 次閱讀

10月30日消息,剛剛結(jié)束的李佳琦直播間里,剁手黨通過阿里語音機(jī)器人首次實現(xiàn)與主播的實時互動。直播過程中,數(shù)十萬用戶同時用語音回答李佳琦的提問,最終機(jī)器人在50毫秒內(nèi)就完成了語音識別和語音反饋全過程,反應(yīng)速度是傳統(tǒng)語音的20倍。

淘寶直播間觀眾用語音與李佳琦互動

今年雙11期間,淘寶直播間推出 “語音猜價格”功能,觀眾在直播間也能實現(xiàn)語音交互,例如動動嘴就可以響應(yīng)主播發(fā)出的猜產(chǎn)品價格任務(wù)。語音機(jī)器人成為決定這一互動過程能否順暢的關(guān)鍵。

據(jù)介紹,一場淘寶直播的觀眾數(shù)量可達(dá)百萬甚至千萬,并且用戶分布在全國各地,口音差異較大,目前主流的語音技術(shù)方案很難做到短時間內(nèi)快速響應(yīng)如此體量的用戶語音,例如類似Siri識別用戶語音的響應(yīng)時長就在1秒以上,無法滿足直播場景強(qiáng)互動的要求。

此次淘寶直播間采用了達(dá)摩院最新的移動端離線端到端語音識別技術(shù)。基于全新的網(wǎng)絡(luò)結(jié)構(gòu)和語音識別框架,即便在低配手機(jī)上,也能在50毫秒內(nèi)完成語音交互過程,速度是傳統(tǒng)語音識別的20倍;此外,該技術(shù)還解決了快語速、重口音等問題,高難度場景中的語音識別錯誤率降低近三成。

達(dá)摩院語音實驗室技術(shù)專家萬玉龍表示,“在實時性要求極高的場景,傳統(tǒng)的云端語音方案無法滿足需求,這套語音技術(shù)的創(chuàng)新在于同時實現(xiàn)了識別速度和準(zhǔn)確度的提升,語音AI模型部署在每個用戶的淘寶直播APP上,即便直播間有千萬級別的用戶,AI也不會漏聽慢判?!?/p>

過去幾年,阿里語音AI在基礎(chǔ)研究和應(yīng)用上取得了一系列突破。2019年,阿里語音AI入選《麻省理工評論》“全球十大突破性技術(shù)”,是唯一上榜的中國科技公司;今年7月IDC發(fā)布的《中國AI云服務(wù)市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,在云上語音AI市場中位居第一。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28126

    瀏覽量

    205888
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1712

    瀏覽量

    112503
  • Siri
    +關(guān)注

    關(guān)注

    4

    文章

    205

    瀏覽量

    36986
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    433

    瀏覽量

    32793
收藏 人收藏

    評論

    相關(guān)推薦

    【書籍評測活動NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個浪潮!

    復(fù)雜環(huán)境互動的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術(shù)與機(jī)器人技術(shù)結(jié)合,探索更加先進(jìn)的知識表示和記憶模塊,利用強(qiáng)化學(xué)習(xí)進(jìn)一步優(yōu)化決策過程。 具身智能的發(fā)展需要更多跨學(xué)科
    發(fā)表于 11-11 10:20

    語音識別機(jī)器人的工作原理

    語音識別機(jī)器人的工作原理主要基于一系列復(fù)雜的技術(shù)流程,包括信號采集、預(yù)處理、特征提取、聲學(xué)模型匹配、語言模型預(yù)測以及最終的解碼輸出。 一、信號采集 語音識別機(jī)器人首先通過麥克風(fēng)等音頻輸
    的頭像 發(fā)表于 10-25 09:25 ?297次閱讀

    基于導(dǎo)納控制的機(jī)器人拖動示教原理和實現(xiàn)步驟

    ? ? ? 基于導(dǎo)納控制的機(jī)器人拖動示教是一種常用的機(jī)器人控制策略,它允許機(jī)器人直接互動,實現(xiàn)
    的頭像 發(fā)表于 10-23 15:52 ?98次閱讀

    構(gòu)建語音控制機(jī)器人 - 線性模型和機(jī)器學(xué)習(xí)

    2024-07-31 |Annabel Ng 在該項目的[上一篇博客文章]中,我介紹了運行機(jī)器人電機(jī)、處理音頻信號和調(diào)節(jié)電壓所需的電路的基礎(chǔ)知識。然而,機(jī)器人還沒有完全完成!盡管機(jī)器人可以正確移動
    的頭像 發(fā)表于 10-02 16:31 ?161次閱讀
    構(gòu)建<b class='flag-5'>語音</b>控制<b class='flag-5'>機(jī)器人</b> - 線性模型和<b class='flag-5'>機(jī)器</b>學(xué)習(xí)

    開源項目!用ESP32做一個可愛的無用機(jī)器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)器人原理是一個連接到開關(guān)的電機(jī),通過邏輯門控制。當(dāng)開關(guān)被推到“開”時,機(jī)器人啟動
    發(fā)表于 09-03 09:34

    開源項目!用ESP32做一個可愛的無用機(jī)器人

    簡介 作者在完成碩士論文答辯后,利用空閑時間制作了一個他一直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)器人原理是一個連接到開關(guān)的電機(jī),通過邏輯門控制。當(dāng)開關(guān)被推到“開”時,機(jī)器人
    發(fā)表于 08-30 14:50

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    安全可靠?!?b class='flag-5'>實時性”、“安全性”是如今工業(yè)自動化行業(yè)的普遍追求,特別是對于AGV開發(fā),若AGV機(jī)器人的主控制器、雷達(dá)、攝像頭、GPS等部件的控制、通信的實時性與安全性得不到保障,導(dǎo)致的后果將是核心數(shù)據(jù)泄露
    發(fā)表于 07-09 11:38

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊開發(fā),與同行相比具有許多優(yōu)勢:語言
    發(fā)表于 07-05 08:52

    Abb工業(yè)機(jī)器人電源開關(guān)在什么位置

    了解ABB工業(yè)機(jī)器人電源開關(guān)位置對于確保機(jī)器人的安全運行和維護(hù)至關(guān)重要。在這篇文章中,我們將詳細(xì)介紹ABB工業(yè)機(jī)器人電源開關(guān)位置、操
    的頭像 發(fā)表于 06-16 16:48 ?1662次閱讀

    基于FPGA EtherCAT的六自由度機(jī)器人視覺伺服控制設(shè)計

    和增強(qiáng)系統(tǒng)處理圖像的實時性,本文提出了一種伊瑟特的六自由度機(jī)器人視覺伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特站上,提高了視覺伺服的實時性.經(jīng)測試,該平臺能夠?qū)σ曈X檢測目標(biāo)的
    發(fā)表于 05-29 16:17

    stm32f303的比較器反應(yīng)速度多少?。?/a>

    stm32f303的比較器反應(yīng)速度多少?。坑心居?b class='flag-5'>20mv的數(shù)據(jù)?手冊上說:100mv的壓差反應(yīng)延時為35ns。怎么我的應(yīng)用里用PA0輸出光上升沿就用了5ms之多呢?(為了驗證一下,我直接斷點,捕獲的波形)比較器配置為為高速模式,
    發(fā)表于 05-08 06:08

    其利天下技術(shù)·搭載無刷電機(jī)的掃地機(jī)器人的前景如何?

    地毯并增加吸力,或是繞過障礙物進(jìn)行清掃。同時,通過手機(jī)APP遠(yuǎn)程控制、語音指令等方式,用戶可以方便地操作掃地機(jī)器人,實現(xiàn)個性化的清潔需求。 3.掃地機(jī)器人面臨的技術(shù)壁壘與客戶體驗問題
    發(fā)表于 05-05 15:03

    用全志R128復(fù)刻自平衡賽車機(jī)器人,還實現(xiàn)了三種不同的操控方式

    等狀態(tài)。 實現(xiàn)APP控制 在機(jī)器人競速中,必須要在準(zhǔn)確性和速度之間找到平衡。為了更好的反饋給自平衡機(jī)器人設(shè)置不同參數(shù)下的運動狀態(tài),作者針對自平衡機(jī)
    發(fā)表于 12-20 10:22

    基于導(dǎo)納控制的機(jī)器人拖動示教原理和實現(xiàn)步驟

    基于導(dǎo)納控制的機(jī)器人拖動示教是一種常用的機(jī)器人控制策略,它允許機(jī)器人直接互動,實現(xiàn)自然、直觀
    的頭像 發(fā)表于 12-04 09:48 ?5160次閱讀
    基于導(dǎo)納控制的<b class='flag-5'>機(jī)器人</b>拖動示教原理和<b class='flag-5'>實現(xiàn)</b>步驟

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個適用于機(jī)器人的開源的元操作系統(tǒng)。它提供了操作系統(tǒng)應(yīng)有的服務(wù),包括硬件抽象,底層設(shè)備控制,常用函數(shù)的實現(xiàn),進(jìn)程間消息傳遞
    發(fā)表于 11-30 16:01