0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 賦能中科深智實現(xiàn) NPC 與玩家的千人千面多模態(tài)互動

NVIDIA英偉達 ? 來源:未知 ? 2023-07-11 23:10 ? 次閱讀

中科深智成立于 2016 年,是一家專注于端到端生成式 AI 虛擬人技術(shù)的公司,從底層自研的大語言模型、動作和表情生成算法模型以及 3D 自動建模,到 Motionverse 虛擬人業(yè)務(wù)中臺,再到 3D 生成式 AI 產(chǎn)品和應(yīng)用層。中科深智除了為生態(tài)合作伙伴提供 AI 虛擬人 API 外,還開發(fā)了一系列 3D 生成式 AI 產(chǎn)品,包括超寫實虛擬人生成系統(tǒng) Anyhuman、元宇宙電商和虛擬人直播工具百寶箱自動播、AI 快速動畫生成系統(tǒng)自動畫、虛擬人實時交互和應(yīng)答系統(tǒng)云小七等。

傳統(tǒng) NPC 人機交互

生硬且成本高昂

在動作和表情方面,傳統(tǒng) NPC 因為無法獲取用戶的畫面信息和語音信息,也就無法做出實時的反饋,動作和語音的呈現(xiàn)皆靠預設(shè),所謂的人機交互其實非常的刻板和生硬。

在文字和語音的對話能力方面,大語言模型的出現(xiàn)賦予了 NPC 實時對話的能力。但無論是何種大語言模型的誕生,都經(jīng)歷了數(shù)據(jù)清洗、預訓練、指令微調(diào)、測試、合規(guī)、部署和應(yīng)用接口開發(fā)等環(huán)節(jié),這些環(huán)節(jié)此前是彼此分散的,而并非一體化的,這也意味著每兩個環(huán)節(jié)之間都需要進行大量的人工處理和匹配部署,這本質(zhì)上是對人力成本和時間成本的浪費,亟需一種更加省時和高效的解決方案。

NVIDIA 賦能游戲 NPC

實現(xiàn)智能化互動

中科深智的虛擬人實時交互和應(yīng)答系統(tǒng)云小七可以支持智能 NPC 的批量化生產(chǎn),提升游戲開發(fā)效率。云小七基于生成式 AI 的設(shè)計,可以通過將 NPC 賦予如形象、聲音、性格特征、背景等特定的人設(shè)來與游戲內(nèi)容進行有機融合。此外,云小七還能夠在不需要編寫復雜腳本的情況下,讓 NPC 與游戲玩家進行順暢的文字、語音、動作、表情等多模態(tài)的實時互動。這將為游戲開發(fā)商帶來更有力的支持,同時也為玩家提供更加生動、真實的游戲體驗。云小七的核心能力之一還包括中科深智自研實現(xiàn)的 CLAP 大模型算法,這種算法可以實現(xiàn)對于語音、語義以及外部環(huán)境輸入的實時反饋,從而輸出動作和表情等,使得 NPC 具有更加生動的表現(xiàn)能力。

NVIDIA Omniverse 中的 Audio2Face 可以輔助云小七實現(xiàn)音頻輸入的面部輸出,通過預訓練的深度神經(jīng)網(wǎng)絡(luò)、調(diào)整角色網(wǎng)格的 3D 頂點等方式,快速實現(xiàn)表情切換。通過利用 NVIDIA Maxine 對于音頻和視頻通信方面進行優(yōu)化,即使用戶使用普通的麥克風和攝像頭,NPC 也能監(jiān)測到他們的行為并且產(chǎn)生反饋,與玩家實現(xiàn)實時互動。

此外,云小七底層的文字對話能力來自于中科深智今年 5 月推出的自有大語言模型 GenSense 數(shù)智姜尚。數(shù)智姜尚是國內(nèi)商用大模型在輕量化領(lǐng)域內(nèi)的重要嘗試,是針對垂直領(lǐng)域和虛擬人端到端應(yīng)用而專門設(shè)計的大語言模型,可成為虛擬人的“大腦”,為其提供實時互動的能力支撐。數(shù)智姜尚采用了先進的優(yōu)化技術(shù),輕巧便利且占用資源極少,可為用戶提供流暢的使用體驗。配合 NVIDIA GPU,數(shù)智姜尚能夠以高性能運行并展現(xiàn)出色的表現(xiàn)。其次,數(shù)智姜尚的部署和定制非常簡便,可以輕松集成到現(xiàn)有的企業(yè)工作流中,為用戶提供個性化和智能化的解決方案,同時實現(xiàn)快速的模型訓練和應(yīng)用部署。

NVIDIA NeMo 在數(shù)智姜尚的訓練過程中提供了低門檻、經(jīng)濟、高效的幫助。

首先,NVIDIA NeMo 幫助解決了訓練全流程的問題,包括數(shù)據(jù)清洗、預訓練和指令微調(diào),以及測試、合規(guī)、部署和應(yīng)用接口開發(fā)等。在此之前,這需要多個架構(gòu)才能完成,因此極大的提高了自有模型的開發(fā)效率。

同時,NVIDIA NeMo 還提供了大量的、可應(yīng)用于多個不同場景的預訓練模型。選擇 NVIDIA 已經(jīng)訓練好的模型,能夠大幅縮短微調(diào)和再訓練的時間,也幫助擴充了中科深智自身大模型數(shù)智姜尚的適應(yīng)性。NeMo 本身的 ASR/TTS 也直接帶來了自然交互工具,無需借助第三方,從而加速了數(shù)智姜尚的開發(fā)和交付。

此外,通過使用 NVIDIA 提供的 NeMo Guardrails 工具,中科深智還高效解決了對話式 AI 合規(guī)性和安全性的風險。通過 NeMo Guardrails 為對話設(shè)置響應(yīng)的范圍和邊界,使數(shù)智姜尚的回答范圍僅限于適當?shù)闹黝}并僅提供必要的信息,能夠限制 AI 只與已確認安全的第三方應(yīng)用程序建立聯(lián)系。

NVIDIA 助力中科深智

加速AI 對話數(shù)字人建設(shè)

中科深智聯(lián)合創(chuàng)始人兼 CTO 宋健說:“中科深智是 NVIDIA 初創(chuàng)加速計劃的高級會員,通過該計劃,一方面中科深智與 NVIDIA 進行了深入的技術(shù)合作,另外一方面也鏈接到大量外部企業(yè)資源,可以快速有效的將產(chǎn)品和需求方進行對接。

大模型驅(qū)動的對話式 AI 和數(shù)字人的結(jié)合引發(fā)了新一輪的商業(yè)增量,也是我們的企業(yè)客戶關(guān)注的重點。對話式數(shù)字人正在不同領(lǐng)域發(fā)揮著越來越大的作用,幫助企業(yè)用戶解決客戶服務(wù)等難題,提高客戶的體驗。然而開發(fā)和運行可落地的語音人工智能服務(wù)仍然是一項復雜而艱巨的任務(wù),通常需要面臨實時性、可理解性、自然性、低資源、魯棒性等挑戰(zhàn)。在 NVIDIA 初創(chuàng)加速計劃的支持之下,我們深入了解并且成功應(yīng)用了 NVIDIA 各項最新技術(shù)和工具,包括 NVIDIA Nemo,NVIDIA Omniverse 等等,切實幫助我們加速了 AI 對話數(shù)字人的建設(shè)?!?/span>

NVIDIA 初創(chuàng)加速計劃

中科深智是 NVIDIA 初創(chuàng)加速計劃 (NVIDIA Inception) 會員企業(yè)。NVIDIA 初創(chuàng)加速計劃為免費會員制,旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計劃聯(lián)合國內(nèi)外知名的風投機構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場宣傳,融資對接,業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。

想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫意向申請表單,獲得快速聯(lián)系。

66502e82-1ffc-11ee-962d-dac502259ad0.png


原文標題:NVIDIA 賦能中科深智實現(xiàn) NPC 與玩家的千人千面多模態(tài)互動

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3723

    瀏覽量

    90711

原文標題:NVIDIA 賦能中科深智實現(xiàn) NPC 與玩家的千人千面多模態(tài)互動

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    覺機器完成數(shù)千萬元天使輪融資

    近日,模態(tài)觸覺感知傳感器公司覺機器(Xense Robotics)成功完成了數(shù)千萬元人民幣的天使輪融資。本輪融資由高瓴創(chuàng)投(GL Ventures)領(lǐng)投,交大菡源基金等投資方跟投
    的頭像 發(fā)表于 10-14 16:02 ?236次閱讀

    Meta發(fā)布模態(tài)LLAMA 3.2工智能模型

    Meta Platforms近日宣布了一項重要技術(shù)突破,成功推出了模態(tài)LLAMA 3.2工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實現(xiàn)了對圖像內(nèi)容的精準理解,標志著Met
    的頭像 發(fā)表于 09-27 11:44 ?348次閱讀

    愛普生有源晶體振蕩器SG3225EEN應(yīng)用于儲NPC、新能源

    NPC通常指的是在儲系統(tǒng)中使用的NPC(Neutral Point Clamped)三電平逆變器。NPC三電平逆變器是一種
    發(fā)表于 09-10 10:47 ?1次下載

    突發(fā)!英特爾或?qū)⒉脝T數(shù)千人,削減成本計劃曝光!

    面對競爭激烈的市場,行業(yè)巨頭也難逃“窘境”。 7月31日,據(jù)美國彭博社報道:半導體巨頭英特爾公司或?qū)有乱惠喆笠?guī)模裁員行動。這場裁員風暴預計在本周內(nèi)正式拉開帷幕,具體人數(shù)尚未明確,可能達到數(shù)千人
    的頭像 發(fā)表于 08-05 10:57 ?280次閱讀
    突發(fā)!英特爾或?qū)⒉脝T數(shù)<b class='flag-5'>千人</b>,削減成本計劃曝光!

    英特爾將裁員數(shù)千人 降本增效

    裁員、降本增效似乎總在不經(jīng)意間就來臨,為節(jié)約成本、應(yīng)對盈利下滑和市場份額下降;英特爾或?qū)⒉脝T數(shù)千人。 據(jù)彭博社31日報道,英特爾的裁員計劃最早可能會在本周宣布。目前英特爾公司大約有11萬名員工;裁員
    的頭像 發(fā)表于 07-31 18:10 ?1137次閱讀

    薩科微Slkor參與大佳源第八屆千人峰會 宋仕強總經(jīng)理出席并發(fā)表主旨演講

    主辦、薩科微Slkor半導體等多家單位協(xié)辦,以“數(shù)字經(jīng)濟新質(zhì)生產(chǎn)力”為主題的「2024電子產(chǎn)業(yè)鏈第八屆千人峰會」在深圳寶立方酒店四樓多功能廳隆重舉辦;同時舉辦的還有
    的頭像 發(fā)表于 05-24 08:12 ?345次閱讀
    薩科微Slkor參與大佳源第八屆<b class='flag-5'>千人</b>峰會  宋仕強總經(jīng)理出席并發(fā)表主旨演講

    視機架式編解碼器:引領(lǐng) AV over IP 行業(yè)新風向

    “交鑰匙”的簡化方案?視給出的答案是:在活動會場布置一套機架式編解碼器-即可實現(xiàn)一對/對一傳輸、多畫面監(jiān)看/互動以及跨互聯(lián)網(wǎng)制作/管理
    的頭像 發(fā)表于 03-23 08:07 ?927次閱讀
    <b class='flag-5'>千</b>視機架式編解碼器:引領(lǐng) AV over IP 行業(yè)新風向

    裁員潮仍在繼續(xù) 諾基亞將在印度裁員約250 谷歌將再裁員數(shù)千人

    裁員潮仍在繼續(xù) 諾基亞將在印度裁員約250 谷歌將再裁員數(shù)千人 盡管時間已經(jīng)進入到2024年但是似乎科技巨頭們的大規(guī)模裁員潮仍在繼續(xù)!已經(jīng)看到外媒有報道諾基亞將在印度裁員約250;此外巨頭谷歌將
    的頭像 發(fā)表于 02-21 11:30 ?1504次閱讀

    思科計劃裁員5%,達數(shù)千人

    2月14日,思科(Cisco)宣布最新一季財報,同時表示,作為全公司重組的一部分,計劃裁員5%,達數(shù)千人。主要原因是客戶仍處「去庫存」階段,導致思科保守看待營運展望。
    的頭像 發(fā)表于 02-19 14:43 ?853次閱讀

    拓維信息2024全國研發(fā)人才千人招聘計劃正式發(fā)布

    2月7日下午,拓維信息2024全國研發(fā)人才千人招聘計劃啟動儀式,以現(xiàn)場直播的方式在長沙盛大舉行。在中國科技創(chuàng)新由跟隨轉(zhuǎn)向并行、乃至領(lǐng)跑的關(guān)鍵當口,拓維信息作為一家長期深耕IT國產(chǎn)化的上市科技企業(yè)
    的頭像 發(fā)表于 02-19 14:02 ?340次閱讀
    拓維信息2024全國研發(fā)人才<b class='flag-5'>千人</b>招聘計劃正式發(fā)布

    機器基于開源的模態(tài)語言視覺大模型

    ByteDance Research 基于開源的模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機器操作模型,只用單機就可以訓練。
    發(fā)表于 01-19 11:43 ?354次閱讀
    機器<b class='flag-5'>人</b>基于開源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語言視覺大模型

    鴻蒙帆起】《開心消消樂》完成鴻蒙原生應(yīng)用開發(fā),創(chuàng)新多端聯(lián)動用戶體驗

    技術(shù)還為用戶打造出創(chuàng)新的分布式游戲玩法。通過與 HarmonyOS 分布式有機結(jié)合,可實現(xiàn)設(shè)備協(xié)同的分布式 PK 場景。在此場景下,用戶操作各自的 HarmonyOS 設(shè)備,使用智慧屏實時顯示對戰(zhàn)
    發(fā)表于 01-03 10:22

    【鴻蒙帆起】《鋼嵐》成為首款基于HarmonyOS NEXT開發(fā)的戰(zhàn)棋新游

    通過元服務(wù)在負一屏或桌面呈現(xiàn),為玩家帶來更便捷的游戲體驗;另一方在保證用戶安全與隱私的前提下,AI 大模型可以識別用戶意圖,實現(xiàn)服務(wù)精準投放,實現(xiàn)游戲全方位用戶觸達,促進用戶轉(zhuǎn)化。
    發(fā)表于 12-28 10:24

    大模型+模態(tài)的3種實現(xiàn)方法

    我們知道,預訓練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(tài)(包括圖像、語音、視頻模態(tài))的輸入和輸出,那么如何在預訓練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強大、更通用呢?本節(jié)將介紹“大模型+
    的頭像 發(fā)表于 12-13 13:55 ?1591次閱讀
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種<b class='flag-5'>實現(xiàn)</b>方法

    求助,關(guān)于ADuCM360與AD7903使用官網(wǎng)例程問題

    主控:千人360傳感器:ad7903程序為官網(wǎng)例程 鏈模式波形圖如下所示(其中,黃色為sccx( sckx),藍色為cnvx , cnvx , cnvx , cnvx , cnvx , cnvx
    發(fā)表于 12-05 07:29