案例簡介
? 本案例通過NVIDIA RIVA平臺,平安科技智能服銷應用組自主研發(fā)了智能客服系統(tǒng),集成了語音識別、語音合成、語義理解三大智能引擎,以智能語音機器人替代傳統(tǒng)的真人客服,實現(xiàn)自然的語音人機交互。
? 本案例主要應用到NVIDIA RIVA平臺、NVIDIA NEMO模型訓練平臺。
客戶簡介及應用背景
平安科技是平安集團旗下的全資子公司,運用人工智能、智能認知、云計算、區(qū)塊鏈等技術,實現(xiàn)對平安集團旗下的產險、壽險、銀行、醫(yī)療、智慧城市等金融業(yè)務的賦能,是全球領先的高科技金融技術公司。
智能客服系統(tǒng)是平安科技自主研發(fā)的基于AI人工智能技術的算法平臺,為保險銀行等金融業(yè)務提供了業(yè)界領先的智能問答技術服務。智能客服系統(tǒng)每天會產生海量的語音數(shù)據(jù),平安科技通過NVIDIA NEMO + RIVA平臺實現(xiàn)了對非結構化的語音數(shù)據(jù)的結構化高效處理,并應用于語音算法模型的自動化訓練。通過RIVA平臺,打破了原先傳統(tǒng)模型各個組件單獨訓練的限制,極大地提高了算法模型訓練的速度和效率。
客戶挑戰(zhàn)
智能客服坐席系統(tǒng)通過AI人工智能技術代替原有的人工坐席,從而能夠達到降低人力成本、改善服務質量、最大化客戶資源利用率,幫助客戶快速定位需求。平安科技原有的傳統(tǒng)技術依賴于非常多的子模塊,以ASR語音識別技術為例,傳統(tǒng)模型需要分割成數(shù)據(jù)預處理,聲學模型、語言模型、文本字典、上下文相關模型等多個部分。多個子模塊不僅需要大量的人力成本去開發(fā)和維護,模塊之間的級聯(lián)誤差也會大大降低模型的識別準確率。與此同時,傳統(tǒng)模型是單個服務器部署模型,而實際的業(yè)務場景,坐席的通話數(shù)量每天都會發(fā)生變化,很難做到和業(yè)務需求量進行算法模型資源的同步,造成業(yè)務空閑時大量的GPU資源的浪費。另外,現(xiàn)有傳統(tǒng)的ASR語音識別、TTS語音合成、NLP語義理解技術都是基于各自的技術框架,并沒有形成統(tǒng)一的算法平臺。
應用方案
基于以上遇到的挑戰(zhàn),平安科技采用了NVIDIA RIVA和NVIDIA NEMO平臺來提供技術支持,很大程度地解決了上述的問題。
平安智能客服坐席系統(tǒng)引入了由NVIDIA NEMO平臺訓練的QuartzNet模型。QuartzNet是由NVIDIA提出的基于全卷積的端到端語音識別模型。端到端模型把原來傳統(tǒng)模型的各個子模塊都整合在了一起,將算法模型的訓練速度提升了5倍,算法的識別率提高了5個百分點。高效的模型訓練可以把算法模型應用到更多的業(yè)務場景中,從而帶來更大的業(yè)務價值。
此外,平安科技還利用RIVA平臺實現(xiàn)了容器化的算法部署,并且實現(xiàn)了彈性伸縮的技術。彈性伸縮技術可以根據(jù)業(yè)務的需求量動態(tài)地調整算法引擎的實例數(shù)量,關閉不必要的GPU機器資源,從而節(jié)省了大量的機器成本。
與此同時,RIVA平臺還整合了ASR、TTS、NLP三個智能算法引擎,使得整個平安科技智能客服坐席系統(tǒng)實現(xiàn)了技術底層的統(tǒng)一。RIVA平臺還和平安科技聯(lián)邦Occam平臺進行了整合,在NVIDIA推出的 BERT 推理解決方案Fast Transformer的助力下,實現(xiàn)了高精度模型自動訓練的能力,并且可以根據(jù)客戶的需求進行場景定制化,實現(xiàn)快速地算法迭代和升級。
使用效果及影響
通過NVIDIA的RIVA和NEMO平臺,平安科技智能坐席系統(tǒng)實現(xiàn)了從傳統(tǒng)模型到業(yè)界領先的端到端深度學習模型的轉換,實現(xiàn)了基于容器化彈性伸縮技術的算法引擎部署,并且整合了系統(tǒng)中三個算法引擎技術,極大地提高了算法平臺的訓練效率和模型效果,幫助業(yè)務進行降本增效,促進了智能坐席系統(tǒng)在平安金融業(yè)務中的拓展和應用。
與此同時,平安也與NVIDIA針對前沿的ASR語音識別技術進行了深度的合作,并在頂級國際會議ICME上發(fā)表了學術論文《Cross-Language Transfer Learning and Domain Adaptation for End-to-End Automatic Speech Recognition》。論文就NVIDIA NEMO平臺的QuartzNet語音識別模型,在跨領域、跨語言、跨口音地區(qū)等方面進行了大量地實驗,和深入地分析。論文闡述的遷移學習觀點和結論,進一步促進了平安科技智能坐席系統(tǒng)端到端語音識別模型的進化和演進。通過與NVIDIA的合作,平安繼續(xù)在語音頂會SLT上發(fā)表了《Multi-QuartzNet: Multi-Resolution Convolution for Speech Recognition with Multi-Layer Feature Fusion》。高水平學術論文指導平安科技客服系統(tǒng)持續(xù)更新和升級,客服系統(tǒng)實際遇到的問題反過來促進學術論文的研究,形成了學術研究和生產服務系統(tǒng)互惠互贏的雙向正循環(huán)。
“通過AI人工智能技術賦能傳統(tǒng)金融保險業(yè)務是當下和未來主流的行業(yè)趨勢,也是平安集團非常重要的戰(zhàn)略發(fā)展目標。智能客服坐席項目是平安科技的重點科技項目之一,通過智能客服可以高精度地實現(xiàn)對于客服意圖的智能匹配,更好地理解客服對產品的需求和意向。NVIDIA提供的RIVA和NEMO平臺,解決了我們在AI算法落地過程中的痛點問題,高效靈活地訓練和部署算法模型,實現(xiàn)了毫秒級的實時語音識別響應時間,97%的高精度保險業(yè)務場景意圖識別率,以及自然流暢地人聲合成語音。智能坐席系統(tǒng)只是平安科技邁向AI技術賦能業(yè)務的第一步,我們會將智能語音技術推廣到語音質檢、安全風控、用戶畫像等一系列業(yè)務場景中。通過AI技術和NVIDIA提供的技術平臺,打造出更多的人工智能算法產品,提高平安金融業(yè)務的生產效率,為平安的客戶提供更全面優(yōu)質的產品體驗?!?平安科技副總工程師王健宗博士表示。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
4862瀏覽量
102722 -
人工智能
+關注
關注
1791文章
46689瀏覽量
237177
發(fā)布評論請先 登錄
相關推薦
評論