在 ASR 自動(dòng)語(yǔ)音識(shí)別領(lǐng)域,基于 CTC 的聲學(xué)模型不再需要對(duì)訓(xùn)練的音頻序列和文本序列進(jìn)行強(qiáng)制對(duì)齊,實(shí)際上已經(jīng)初步具備了端到端的聲學(xué)模型建模能力。但是 CTC 模型進(jìn)行聲學(xué)建模存在著兩個(gè)嚴(yán)重的瓶頸,一是缺乏語(yǔ)言模型建模能力,不能整合語(yǔ)言模型進(jìn)行聯(lián)合優(yōu)化,二是 CTC 有一個(gè)不合理的假設(shè):標(biāo)簽相互獨(dú)立,這個(gè)基本假設(shè)與語(yǔ)音識(shí)別任務(wù)之間存在著一定程度的背離,因?yàn)樵谡Z(yǔ)言系統(tǒng)中存在語(yǔ)境的上下文關(guān)系。因此針對(duì) CTC 的不足,Transducer 模型可以彌補(bǔ)這種不合理的假設(shè),解決 CTC 的問(wèn)題。
3 月 9 日,NVIDIA 企業(yè)開(kāi)發(fā)者社區(qū)經(jīng)理李奕澎將面向有 NLP 和 Speech AI 開(kāi)發(fā)需求的開(kāi)發(fā)者,在本次研討會(huì)中重點(diǎn)討論 Transducer 模型,并通過(guò)代碼來(lái)訓(xùn)練和評(píng)估 Transducer 模型。
Transducer 模型在自動(dòng)語(yǔ)音識(shí)別中的應(yīng)用 – NVIDIA NeMo 代碼解析
3 月 9 日,星期四,20:00 - 21:30
本次網(wǎng)絡(luò)研討會(huì)主要面向有 NLP 和 Speech AI 開(kāi)發(fā)需求的開(kāi)發(fā)者。通過(guò)本次網(wǎng)絡(luò)研討會(huì),您可以獲得以下信息:
李奕澎 | NVIDIA 企業(yè)開(kāi)發(fā)者社區(qū)經(jīng)理
擁有多年數(shù)據(jù)分析建模、人工智能自然語(yǔ)言處理開(kāi)發(fā)經(jīng)驗(yàn)。在自動(dòng)語(yǔ)音識(shí)別、自然語(yǔ)言處理、語(yǔ)音合成等對(duì)話式 AI 技術(shù)領(lǐng)域有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)與見(jiàn)解。曾開(kāi)發(fā)法律、金融、保險(xiǎn)文檔中基于實(shí)體抽取的智能問(wèn)答系統(tǒng),曾開(kāi)發(fā)基于 NLP 知識(shí)抽取,KG 知識(shí)圖譜的建立的科研文檔智能檢索系統(tǒng)。
識(shí)別二維碼注冊(cè)本次研討會(huì)
識(shí)別二維碼了解 NVIDIA NeMo 更多信息
點(diǎn)擊 “閱讀原文” 或掃描下方海報(bào)二維碼,即可免費(fèi)注冊(cè) GTC23,在 3 月 24 日 聽(tīng) OpenAI 聯(lián)合創(chuàng)始人與 NVIDIA 創(chuàng)始人的爐邊談話,將由 NVIDIA 專(zhuān)家主持,配中文講解和實(shí)時(shí)答疑,一起看 AI 的現(xiàn)狀和未來(lái)!
原文標(biāo)題:研討會(huì)預(yù)告 | 使用 Transducer 模型優(yōu)化語(yǔ)音識(shí)別結(jié)果
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
原文標(biāo)題:研討會(huì)預(yù)告 | 使用 Transducer 模型優(yōu)化語(yǔ)音識(shí)別結(jié)果
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
相關(guān)推薦
國(guó)產(chǎn)FPGA線上研討會(huì)
發(fā)表于 06-24 10:17
?259次閱讀
模型介紹Whisper模型是一個(gè)由OpenAI團(tuán)隊(duì)開(kāi)發(fā)的通用語(yǔ)音識(shí)別模型。它的訓(xùn)練基于大量不同的音頻數(shù)據(jù)集,是一個(gè)多任務(wù)
發(fā)表于 01-06 08:33
?2895次閱讀
AI 大模型在語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域已經(jīng)取得了令人矚目的成就。語(yǔ)音 AI(Speech AI)技術(shù)已經(jīng)廣泛應(yīng)用在數(shù)字人、實(shí)時(shí)翻譯、語(yǔ)音
發(fā)表于 12-15 15:50
?497次閱讀
大聯(lián)大友尚 ST智慧科技,玩轉(zhuǎn)IoT技術(shù)與AI生態(tài)系 在線研討會(huì) 研討會(huì)時(shí)間: 2023年12月12日 1000 點(diǎn)擊查看研討會(huì)詳情 報(bào)名快速通道 觀看視頻get更多本場(chǎng)研討會(huì)詳情 大
發(fā)表于 12-07 10:55
?448次閱讀
基于深度學(xué)習(xí)的情感語(yǔ)音識(shí)別模型的優(yōu)化策略,包括數(shù)據(jù)預(yù)處理、模型結(jié)構(gòu)優(yōu)化、損失函數(shù)改進(jìn)、訓(xùn)練策略調(diào)
發(fā)表于 11-09 16:34
?512次閱讀
10 月 28 日,汽車(chē)行業(yè)大語(yǔ)言模型研討會(huì)正式結(jié)束。 NVIDIA 解決方案架構(gòu)師陳文愷 在研討會(huì)中講解了 汽車(chē)行業(yè)如何開(kāi)發(fā)企業(yè)級(jí)大語(yǔ)言模型,以加速行業(yè)創(chuàng)新和發(fā)展 。同時(shí),NVIDI
發(fā)表于 11-03 19:10
?679次閱讀
電子設(shè)計(jì)自動(dòng)化領(lǐng)域領(lǐng)先的供應(yīng)商 Cadence,誠(chéng)邀您參加“ 2023 Cadence 中國(guó)技術(shù)巡回研討會(huì)”。 會(huì)議將集聚 Cadence 的開(kāi)發(fā)者與資深技術(shù)專(zhuān)家,與您分享最新定制/模擬設(shè)計(jì)解決方案
發(fā)表于 10-30 11:35
?405次閱讀
電子設(shè)計(jì)自動(dòng)化領(lǐng)域領(lǐng)先的供應(yīng)商 Cadence,誠(chéng)邀您參加“2023 Cadence 中國(guó)技術(shù)巡回研討會(huì)”。會(huì)議將集聚 Cadence 的開(kāi)發(fā)者與資深技術(shù)專(zhuān)家,與您分享數(shù)字設(shè)計(jì)與簽核解決方案,并與
發(fā)表于 10-30 11:35
?365次閱讀
產(chǎn)品制造,優(yōu)化制造成本?
影響PCB可制造性有哪些關(guān)鍵因素?
在PCBA生產(chǎn)加工制造過(guò)程焊接工藝可靠性保證的要素及邏輯是什么?
本次研討會(huì)將從EDA設(shè)計(jì)、方案開(kāi)發(fā)、DFM軟件分析、pcb制造、PCBA
發(fā)表于 10-27 11:48
產(chǎn)品制造,優(yōu)化制造成本?
影響PCB可制造性有哪些關(guān)鍵因素?
在PCBA生產(chǎn)加工制造過(guò)程焊接工藝可靠性保證的要素及邏輯是什么?
本次研討會(huì)將從EDA設(shè)計(jì)、方案開(kāi)發(fā)、DFM軟件分析、pcb制造、PCBA
發(fā)表于 10-27 11:44
由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì),將幫助您了解 NVIDIA 開(kāi)源大型語(yǔ)言模型(LLM)推理加速庫(kù) TensorRT-LLM ?及其功能
發(fā)表于 10-26 09:05
?288次閱讀
電子設(shè)計(jì)自動(dòng)化領(lǐng)域領(lǐng)先的供應(yīng)商 Cadence,誠(chéng)邀您參加“2023 Cadence 中國(guó)技術(shù)巡回研討會(huì)”。會(huì)議將集聚 Cadence 的開(kāi)發(fā)者與資深技術(shù)專(zhuān)家,與您分享定制/模擬設(shè)計(jì)解決方案,并與
發(fā)表于 10-25 10:40
?338次閱讀
電子設(shè)計(jì)自動(dòng)化領(lǐng)域領(lǐng)先的供應(yīng)商 Cadence,誠(chéng)邀您參加“2023 Cadence 中國(guó)技術(shù)巡回研討會(huì)”。會(huì)議將集聚 Cadence 的開(kāi)發(fā)者與資深技術(shù)專(zhuān)家,與您分享數(shù)字設(shè)計(jì)與簽核解決方案,并與
發(fā)表于 10-23 11:55
?424次閱讀
大聯(lián)大品佳集團(tuán) 智慧零售創(chuàng)意無(wú)限 - MediaTek Genio IoT 平臺(tái) 在線研討會(huì) 研討會(huì)時(shí)間: 2023年10月26日 1000 點(diǎn)擊查看研討會(huì)詳情 報(bào)名快速通道 觀看視頻get更多本場(chǎng)
發(fā)表于 10-20 01:10
?329次閱讀
模型優(yōu)化:針對(duì)模型結(jié)構(gòu)的優(yōu)化是提高語(yǔ)音識(shí)別技術(shù)的重要途徑之一。研究人員可以通過(guò)調(diào)整
發(fā)表于 10-12 18:33
?643次閱讀
評(píng)論