0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助 NVIDIA GPU,亞馬遜Alexa語義識別模型的識別準(zhǔn)確度提高了15%

NVIDIA英偉達企業(yè)解決方案 ? 來源:YXQ ? 2019-05-09 15:01 ? 次閱讀

近期,來自于約翰霍普金斯大學(xué)(John Hopkins University)和亞馬遜(Amazon)的研究人員們發(fā)布了一篇論文,介紹他們是如何通過訓(xùn)練一個深度學(xué)習(xí)系統(tǒng)來幫助亞馬遜Alexa語音助手識別并忽略那些并非是對她說的話,從而將其語義識別模型的識別準(zhǔn)確度提高了15%。

研究人員在他們的論文中指出,“諸如Amazon Echo和Google Home的這類家用聲控設(shè)備都面臨著一個問題,那就是當(dāng)周圍存在干擾聲源的時候,設(shè)備如何能夠照常地識別指令。”

為了讓Alexa更好地識別指令,研究人員訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),來匹配和識別“喚醒詞”(通常是“Alexa”)以及緊隨其后的指令,并忽略那些來自于其他人或媒體設(shè)備的干擾。

研究人員介紹說:“這項任務(wù)的挑戰(zhàn)在于需要從含有特定詞匯的話語片段中學(xué)習(xí)使用者的語言習(xí)慣。借助于兩種不同的神經(jīng)網(wǎng)絡(luò)架構(gòu),我們最終實現(xiàn)了這一目標(biāo)。兩個神經(jīng)網(wǎng)絡(luò)架構(gòu)都是具有注意機制的序列到序列編碼器 - 解碼器網(wǎng)絡(luò)的變體。”

借助于NVIDIA V100 GPU和OpenSeq2Seq工具,用于序列到序列模型的分布式和混合精度訓(xùn)練,使用TensorFlow建立,團隊用1,200小時來自于Amazon Echo的實時英文數(shù)據(jù)訓(xùn)練他們的算法

通過改進所開發(fā)的基線網(wǎng)絡(luò),該團隊還添加了一個額外的輸入端,能夠通過優(yōu)先處理類似于錨字的語音來增強注意機制。研究人員總結(jié)說: “在訓(xùn)練期間,注意機制會自動學(xué)習(xí)喚醒詞的哪些聲學(xué)特征,以便在隨后的演講中尋找?!?/p>

該團隊還開發(fā)了一個mask-based模型,該模型能夠更加明確地將輸入語音與錨字的聲學(xué)輪廓相匹配。

最后的測試結(jié)果顯示:第一種方法的性能更好,達到了15%的改進;第二種模型也達到了13%的改進。

根據(jù)研究人員介紹,該算法在訓(xùn)練和推理過程中都采用了NVIDIA GPU。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102711
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2618

    瀏覽量

    83131

原文標(biāo)題:借助AI研究,將亞馬遜Alexa語義識別準(zhǔn)確度提高15%

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    亞馬遜基于人工智能的Alexa發(fā)布計劃延期至明年

    11月1日外媒報道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計劃延期至明年。   亞馬遜最初于去年9月公開了新版Alexa的規(guī)劃,意在通過集成AI大
    的頭像 發(fā)表于 11-01 15:19 ?390次閱讀

    隧道門禁人臉識別系統(tǒng)是專為隧道安全管理設(shè)計的先進技術(shù)系統(tǒng)

    ,有效防止了誤識別和漏識別的情況發(fā)生。 多角度識別:支持多角度的人臉采集和識別,施工人員在不同的行走姿態(tài)和角度下靠近門禁時,系統(tǒng)都能快速準(zhǔn)確
    的頭像 發(fā)表于 10-29 14:51 ?121次閱讀
    隧道門禁人臉<b class='flag-5'>識別</b>系統(tǒng)是專為隧道安全管理設(shè)計的先進技術(shù)系統(tǒng)

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛
    的頭像 發(fā)表于 10-27 11:13 ?286次閱讀

    AI大模型在圖像識別中的優(yōu)勢

    模型借助高性能的計算硬件和優(yōu)化的算法,能夠在短時間內(nèi)完成對大量圖像數(shù)據(jù)的處理和分析,顯著提高了圖像識別的效率。 識別
    的頭像 發(fā)表于 10-23 15:01 ?311次閱讀

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計,通過輕量級的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)車牌識別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計提高了識別的實時性和準(zhǔn)確
    發(fā)表于 10-10 16:40

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型
    的頭像 發(fā)表于 08-23 15:48 ?355次閱讀

    基于高光譜數(shù)據(jù)的典型地物分類識別方法研究

    隨著成像光譜儀器的廣泛應(yīng)用,利用光譜數(shù)據(jù)進行物質(zhì)分類與識別已經(jīng)成為一項重要的研究內(nèi)容,研究不同分類算法對最終的目標(biāo)識別準(zhǔn)確度具有重要意義。
    的頭像 發(fā)表于 07-18 14:43 ?239次閱讀
    基于高光譜數(shù)據(jù)的典型地物分類<b class='flag-5'>識別</b>方法研究

    人臉識別模型訓(xùn)練是什么意思

    人臉識別模型訓(xùn)練是指通過大量的人臉數(shù)據(jù),使用機器學(xué)習(xí)或深度學(xué)習(xí)算法,訓(xùn)練出一個能夠識別和分類人臉的模型。這個模型可以應(yīng)用于各種場景,如安防監(jiān)
    的頭像 發(fā)表于 07-04 09:16 ?435次閱讀

    基于毫米波雷達的手勢識別神經(jīng)網(wǎng)絡(luò)

    (LSTM)架構(gòu)來捕獲時間和空間信息,有效地增強了手勢識別。然而,CNNLSTM模型通常需要大量的內(nèi)存使用,具有較高的計算復(fù)雜性,并且高度依賴于環(huán)境因素。為了應(yīng)對這些挑戰(zhàn),提高識別
    發(fā)表于 05-23 12:12

    水尺讀數(shù)監(jiān)測識別攝像機

    監(jiān)測通常需要人工觀測水位,并記錄讀數(shù)。這種方法不僅費時費力,而且容易出現(xiàn)誤差。而利用水尺讀數(shù)監(jiān)測識別攝像機,可以實現(xiàn)自動化監(jiān)測,大大提高了監(jiān)測的效率和準(zhǔn)確性。水尺讀
    的頭像 發(fā)表于 04-15 10:12 ?298次閱讀
    水尺讀數(shù)監(jiān)測<b class='flag-5'>識別</b>攝像機

    AI車牌監(jiān)測識別攝像機

    嫌疑車輛。AI車牌監(jiān)測識別攝像機在實際應(yīng)用中發(fā)揮著重要作用。首先,它可以自動識別車輛牌照,無需人工干預(yù),大大提高了工作效率并減少了人力成本。其次,當(dāng)有嫌疑車輛出現(xiàn)時,
    的頭像 發(fā)表于 04-02 09:55 ?394次閱讀
    AI車牌監(jiān)測<b class='flag-5'>識別</b>攝像機

    濕度傳感器的哪些特性影響測量準(zhǔn)確度

    傳感器的測量算法會根據(jù)當(dāng)前環(huán)境溫度進行修正,以提高準(zhǔn)確度。此外,溫度變化還會影響傳感器元件的性能,例如固態(tài)濕度傳感器中的材料特性與溫度相關(guān)。因此,正確校準(zhǔn)溫度是確保濕度測量準(zhǔn)確性的重要因素。 2. 濕度范圍 濕度傳感器通常
    的頭像 發(fā)表于 12-25 14:28 ?914次閱讀

    ADAS3022怎樣能提高ADC的測量準(zhǔn)確度呢?

    在調(diào)試ADAS3022這顆ADC時每次測量會有30+mV的波動,信號源電壓波動不到0.1mV,怎樣能提高ADC的測量準(zhǔn)確度呢?下圖為不同次測量的值(信號源1.1V),感覺誤差挺大:
    發(fā)表于 12-04 07:39

    NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

    本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU 以及亞馬遜云科技的 EFA 來訓(xùn)練其 最大的新一代大語言模型(LLM)。 大
    的頭像 發(fā)表于 11-29 21:15 ?500次閱讀
    <b class='flag-5'>NVIDIA</b> 為部分大型<b class='flag-5'>亞馬遜</b> Titan 基礎(chǔ)<b class='flag-5'>模型</b>提供訓(xùn)練支持

    語音識別芯片在產(chǎn)品應(yīng)用上的難點列舉

    語音識別技術(shù)已廣泛應(yīng)用于多個領(lǐng)域,但實現(xiàn)依賴于語音識別芯片,其研發(fā)和應(yīng)用面臨語音信號復(fù)雜性和差異性的挑戰(zhàn),導(dǎo)致識別準(zhǔn)確度下降。芯片能耗問題也限制了應(yīng)用領(lǐng)域的擴張。另外,隱私泄露風(fēng)險需要
    的頭像 發(fā)表于 11-13 11:09 ?379次閱讀