亚洲国产精久久小蝌蚪,国产热の有码热の无码视频 ,国产剧情精品亚洲一区二区

說起 MOBA 類手游，想必大家都能想到王者榮耀。它近日又有了新動作。11 月 28 日騰訊宣布，旗下騰訊 AI Lab 與王者榮耀聯(lián)合研發(fā)的策略協(xié)作型 AI “絕悟” 推出升級版本 “絕悟 “完全體。目前，“絕悟 “背后采用的創(chuàng)新算法突破了 AI 的英雄上限，英雄池數(shù)量也從 40 個增至 100 + 個。創(chuàng)新算法能夠讓 AI 完全掌握所有英雄的所有技能，同時應對高達 10 的 15 次方的英雄組合數(shù)變化，幾乎覆蓋人類玩家能夠選出的組合。另一技術(shù)亮點則是優(yōu)化了禁選英雄（BanPick，簡稱 BP）博弈策略，能綜合自身技能與對手情況等多重因素派出最優(yōu)英雄組合。相關(guān)研究已被 AI 頂級會議 NeurIPS 2020 與頂級期刊 TNNLS 收錄，兩篇論文的一作均為騰訊的 Deheng Ye（葉德珩）。

同時，“絕悟” 完全體版本已在王者榮耀 App 限時開放。各榮耀玩家可以上線與之對戰(zhàn)，體驗時間為 11 月 14 日至 30 日，絕悟在 20 個關(guān)卡的能力不斷提升，最強的 20 級于 11 月 28 日開放，接受 5v5 組隊挑戰(zhàn)。

AI 策略：紅方 AI 鎧大局觀出色，繞后蹲草叢扭轉(zhuǎn)戰(zhàn)局積少成多，自古英雄出少年

王者榮耀中，最吸引人的稱號是：“全能高手”。想要獲得它卻很難，你需要在五個職業(yè)中（對抗路、中路、發(fā)育路、游走、打野）都擁有 4 個紫色熟練度英雄。但因為練習時間與精力限制，很少有人能精通所有英雄。而 “絕悟”技術(shù)團隊一年內(nèi)讓 AI 掌握的英雄數(shù)從 1 個增加到 100 + 個，完全解禁英雄池，此版本因此得名 “絕悟完全體”。那么 “絕悟完全體” 是怎樣做到的呢？我們知道，從零學會單個陣容易如反掌，但面對多英雄組合時就難如登天。在對戰(zhàn)中，因為地圖龐大且信息不完備，不同的 10 個英雄組合應該有不同的策略規(guī)劃、技能應用、路徑探索及團隊協(xié)作方式，這將使決策難度幾何級增加。并且，多英雄組合也帶來了 “災難性遺忘” 問題，這使得模型容易邊學邊忘，是長期困擾開發(fā)者的大難題。

為了應對上述問題，技術(shù)團隊先引入 “老師分身” 模型，讓每個 AI 老師在單個陣容上訓練至精通，再引入一個 AI 學生模仿學習所有的 AI 老師，最終讓 “絕悟” 掌握了所有英雄的所有技能，成為一代宗師。同時，團隊還制定了長期目標，就是要讓 “絕悟” 學會所有英雄的技能，且每個英雄都能達到頂尖水平。為此他們在技術(shù)上做了三項重點突破：首先團隊構(gòu)建了一個最佳神經(jīng)網(wǎng)絡模型，讓模型適配 MOBA 類任務、表達能力強、還能對英雄操作精細建模。模型綜合了大量 AI 方法的優(yōu)勢，具體而言： 1. 在時序信息上引入長短時記憶網(wǎng)絡（LSTM）優(yōu)化部分可觀測問題； 2. 在圖像信息上選擇卷積神經(jīng)網(wǎng)絡（CNN）編碼空間特征； 3. 用注意力（Attention）方法強化目標選擇； 4. 用動作過濾（Action Mask）方法提升探索效率； 5. 用分層動作設計加快訓練速度； 6. 用多頭值估計（Multi-Head Value）方法降低估計方差等。

圖 | 網(wǎng)絡架構(gòu) 其次，團隊借用圍棋的思路，采用了 CSPL（Curriculum Self-Play Learning，課程自對弈學習），能夠有效拓寬英雄池，讓 “絕悟 “掌握所有英雄技能。 CSPL 是一種讓 AI 從易到難的漸進式學習方法，具體有以下幾個步驟： 1．“老師分身” 模型：挑選多組覆蓋全部英雄池的陣容，在小模型下用強化學習訓練，得到多組 “老師分身” 模型； 2．遷移模型：蒸餾，把第一步得到的多個模型的能力遷移到同一個大模型中； 3．隨機陣容的強化訓練：在蒸餾后的大模型里，隨機挑選陣容繼續(xù)強化訓練和微調(diào)。通過多種傳統(tǒng)和新穎技術(shù)方法的結(jié)合，實現(xiàn)了在大的英雄池訓練，同時還能不斷擴展的目標。

圖 | CSPL 流程圖。任務由易到難，模型從簡單到復雜，知識逐層深入。實驗結(jié)果表明，使用 CSPL 方法擴展英雄池有明顯優(yōu)勢，能夠在非常有效地減少訓練時間，同時保持良好的效果。

圖 | 實驗結(jié)果最后，團隊還搭建了大規(guī)模訓練平臺 —— 騰訊開悟（aiarena.tencent.com）。該平臺依托項目積累的算法經(jīng)驗、脫敏數(shù)據(jù)及騰訊云的算力資源，為訓練所需的大規(guī)模運算保駕護航。目前，開悟平臺于今年 8 月對 18 所高校開放，未來希望為更多科研人員提供技術(shù)與資源支持，深化課題研究。排兵布陣，致人而不致于人

作為團隊的大腦，教練在整個比賽中都起到了非常重要的作用。無論是在 BP 環(huán)節(jié)（禁選英雄）的選擇，還是陣容的壓制上面，稍有不慎就為給對手帶來先天優(yōu)勢，造成 “致于人” 的局面。因此，“絕悟” 要取得勝利就必須找到一個能排兵布陣的 AI 教練。

目前，簡單的做法是選擇貪心策略，即選擇當前勝率最高的英雄。這針對單個英雄而言或許可以，但王者榮耀有上百個英雄，任意英雄間都有或促進或克制的關(guān)系，只按勝率選擇很容易被對手針對，更需要綜合考慮敵我雙方、已選和未選英雄的相關(guān)信息，最大化己方優(yōu)勢，最小化敵方優(yōu)勢。受到圍棋 AI 算法（Alpha Go）的啟發(fā)，團隊使用蒙特卡洛樹搜索（MCTS）和神經(jīng)網(wǎng)絡結(jié)合的自動 BP 模型來解決這一問題。 MCTS 方法包括了選擇、擴張、模擬和反向傳播四個步驟，會不斷迭代搜索，估算出可選英雄的長期價值。在這其中模擬部分最耗時，所以團隊用估值神經(jīng)網(wǎng)絡替代該環(huán)節(jié)，加快了搜索速度，這樣能夠又快又準地選出具備最大長期價值的英雄。要提到的是，圍棋等棋牌類游戲結(jié)束就能確定勝負，但 BP 結(jié)束只到確定陣容，還未對戰(zhàn)，所以勝負未分。因此團隊利用絕悟自對弈產(chǎn)生的超過 3000 萬條對局數(shù)據(jù)訓練出一個陣容勝率預測器，用來預測陣容的勝率。勝率預測器得到的陣容勝率又被用來監(jiān)督訓練估值網(wǎng)絡。

圖 | 蒙特卡洛搜索樹除了常見的單輪 BP，AI 教練還學會了王者榮耀 KPL 賽場上常見的多輪 BP 賽制，該模式下不能選重復英雄，對選人策略要求更高。為此，團隊引入多輪長周期判定機制，在 BO3/BO5 賽制中可以全局統(tǒng)籌、綜合判斷，做出最優(yōu) BP 選擇。訓練后的 BP 模型在對陣基于貪心策略的基準方法時，能達到近 70% 勝率，對陣按位置隨機陣容的勝率更接近 90%。至此，強兵加軍師的組合，使得 “絕悟” 成為了不折不扣的一代宗師。

除了上述的 RL（強化學習）算法外，團隊還開發(fā)了 SL（監(jiān)督學習）算法，針對大局觀和微操策略同時建模，讓絕悟同時擁有優(yōu)秀的長期規(guī)劃和即時操作，達到了非職業(yè)玩家的頂尖水平。

相關(guān)技術(shù)成果曾在 2018 年 12 月公開亮相對戰(zhàn)人類玩家。其實，團隊對于監(jiān)督學習的研發(fā)一直在持續(xù)進行中。今年 11 月 14 日起開放的絕悟第 1 到 19 級，就有多個關(guān)卡由監(jiān)督學習訓練而成。

從研究方法上看，監(jiān)督學習對于 AI 智能體的研發(fā)有很高的價值。 1.“更像人”：通過挖掘人類數(shù)據(jù)預測未來的監(jiān)督學習是通常是研發(fā)游戲 AI 的第一步，并在眾多視頻游戲上取得較好效果。比如在明星大亂斗等復雜電子游戲中，純監(jiān)督學習能也學到達到人類高手玩家水平的 AI 智能體。 2. 多種深度學習的結(jié)合：監(jiān)督學習能復用為強化學習的策略網(wǎng)絡，如 AlphaGo 就是監(jiān)督學習結(jié)合強化學習。 3. 節(jié)約訓練時間：同時適當?shù)夭迦氡O(jiān)督學習可以縮短強化學習探索時間，比如 DeepMind 的星際爭霸 AI AlphaStar 就用監(jiān)督學習做強化訓練的隱含狀態(tài)。

圖 | 網(wǎng)絡架構(gòu) 應用上述諸多優(yōu)點，“絕悟 “可以實現(xiàn)一系列效果：訓練快，在 16 張 GPU 卡上只需幾天，而強化學習則需幾個月；拓展能力強，能完成全英雄池訓練；使用真實玩家的脫敏數(shù)據(jù)，配合有效采樣，產(chǎn)出的 AI 行為上會更接近人類。隨著 AI 在游戲世界的發(fā)展，它們在數(shù)據(jù)的記憶和處理方面的優(yōu)勢能夠進一步體現(xiàn)出來。那么如何利用 AI 來強化自己的隊伍，或許是當下游戲教練需要思索的問題。 -End-

原文標題：登上NeurIPS 2020：騰訊AI聯(lián)合王者榮耀推出“絕悟”完全體

文章出處：【微信公眾號：DeepTech深科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

責任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡

+關(guān)注

關(guān)注
42

文章
4733

瀏覽量
100419
AI

AI

+關(guān)注

關(guān)注
87

文章
29806

瀏覽量
268106

原文標題：登上NeurIPS 2020：騰訊AI聯(lián)合王者榮耀推出“絕悟”完全體

文章出處：【微信號：deeptechchina，微信公眾號：deeptechchina】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

高通與騰訊混元達成戰(zhàn)略合作

驍龍峰會期間，高通技術(shù)公司宣布與騰訊混元合作，基于驍龍8至尊版移動平臺，共同推動了騰訊混元大模型7B和3B版本的終端側(cè)部署，展示了此合作實現(xiàn)出色的運行表現(xiàn)。這將有助于騰訊混元大模型為廣泛的業(yè)務場景

發(fā)表于 11-08 09:52 ?183次閱讀

英特爾攜手騰訊以技術(shù)創(chuàng)新，共馭智算未來新機

在近日舉辦的2024騰訊全球數(shù)字生態(tài)大會上，英特爾全方位展示了與騰訊在AI、云計算、數(shù)據(jù)庫、存儲、網(wǎng)絡、游戲等領(lǐng)域的持續(xù)創(chuàng)新，及多樣化應用落地實踐。期間，騰訊云預告即將

發(fā)表于 09-09 17:37 ?287次閱讀

英特爾攜手<b class='flag-5'>騰訊</b>以技術(shù)創(chuàng)新，共馭智算未來新機

英特爾與騰訊攜手共繪AI與云計算新藍圖

在召開的2024騰訊全球數(shù)字生態(tài)大會上，英特爾與騰訊的深度合作成果成為全場矚目的焦點。雙方不僅在AI、云計算、數(shù)據(jù)庫、存儲、網(wǎng)絡及游戲等多個領(lǐng)域展示了持續(xù)的創(chuàng)新力與多樣化的應用實踐，還共同展望了未來科技生態(tài)的無限可能。

發(fā)表于 09-06 16:31 ?854次閱讀

騰訊推出自主研發(fā)的AI引擎,工作效率提升超40倍

7月30日最新資訊顯示，在近期舉行的ChinaJoy高峰論壇上，騰訊公司高層張巍副總裁強調(diào)了AI技術(shù)在游戲開發(fā)領(lǐng)域的核心地位，指出其已成為行業(yè)研發(fā)的“標準配置”。騰訊在技術(shù)創(chuàng)新上邁出了堅實步伐，今年

發(fā)表于 07-30 17:07 ?553次閱讀

商湯絕影大模型C助力LEVC全新智慧出行體驗

大模型上車，翼真L380更是為用戶打造了創(chuàng)新的智能座艙體驗。作為中國智能座艙的領(lǐng)軍企業(yè)，商湯絕影與LEVC翼真汽車強強聯(lián)手，助力AI大模型上車翼真L380，提供「AI閑聊」、「美圖壁紙」和「童話繪本」等行業(yè)領(lǐng)先的

發(fā)表于 06-26 15:00 ?1302次閱讀

耐能推出最新的邊緣AI服務器及內(nèi)置耐能AI芯片的PC設備

- 耐能的邊緣 AI 服務器 KNEO 330 為中小企業(yè)帶來 30-40% 的成本節(jié)省，同兼顧隱私和安全性。- 耐能的邊緣 GPT AI 芯片 KL830 可完全應用于 AI PC、

發(fā)表于 06-05 10:21 ?546次閱讀

深蘭AI數(shù)字伙伴項目入選“AI Partner·2024 AI應用標桿案例”

近期，36氪揭曉了“AI Partner·2024 AI應用標桿案例”，深蘭AI數(shù)字伙伴項目從200多個報名項目中脫穎而出，當選標桿案例。一起入選的還有騰訊、vivo、360、商湯等公

發(fā)表于 05-23 10:34 ?396次閱讀

深蘭<b class='flag-5'>AI</b>數(shù)字伙伴項目入選“<b class='flag-5'>AI</b> Partner·2024 <b class='flag-5'>AI</b>應用標桿案例”

飛利浦影音推出首款AI會議降噪耳機飛利浦“8號”

飛利浦影音近日重磅推出其首款AI會議降噪耳機——“8號”。這款產(chǎn)品的誕生，是飛利浦影音與小鹿聲文App深入合作的結(jié)晶，同時得到了“騰訊混元”語言大模型提供的強大AI技術(shù)支持。

發(fā)表于 05-13 11:29 ?804次閱讀

惠普推出多款商用AI PC新品

惠普近日發(fā)布了一系列商用AIPC新品及創(chuàng)新AI服務，以滿足不同企業(yè)的需求。新品陣容中，EliteBook系列高端AI商務本專為大型企業(yè)用戶量身打造，而針對中小型企業(yè)，惠普推出了戰(zhàn)系列AI

發(fā)表于 05-11 09:21 ?412次閱讀

商湯絕影攜手經(jīng)緯恒潤推出智能感知后視鏡

近日，商湯絕影攜手經(jīng)緯恒潤，在北京車展上共同展示了一款智能感知后視鏡。這款后視鏡將絕影行業(yè)領(lǐng)先的感知算法與經(jīng)緯恒潤的卓越硬件能力完美融合，為用戶帶來了前所未有的科技體驗。

發(fā)表于 05-07 14:36 ?506次閱讀

阿里大模型“通義聽悟”升級

阿里旗下的強大模型產(chǎn)品“通義聽悟”近日迎來了一系列功能升級，其中包括備受矚目的音視頻問答助手“小悟”的正式上線。這一新功能憑借出色的多語言Query處理能力、長篇章文本理解能力以及指令演化框架優(yōu)化

發(fā)表于 03-21 11:30 ?967次閱讀

阿里大模型產(chǎn)品發(fā)布多項新功能，音視頻問答助手“小悟”上線

通義聽悟基于通義千問大模型，集成10余項人工智能功能，涉及轉(zhuǎn)化、翻譯、角色分割、全篇摘要、章節(jié)瀏覽、發(fā)言總結(jié)以及PPT提取等。同時，通義聽悟提供標注重點與隨手筆記功能。

發(fā)表于 03-19 15:51 ?479次閱讀

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

近日，業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國AI創(chuàng)業(yè)公司Morph AI達成重要合作。雙方宣布共同推出一款革新性的all-in

發(fā)表于 03-05 10:44 ?811次閱讀

AI賦能金融軟通動力車忠良受邀出席騰訊金融云新智能生態(tài)伙伴沙龍

11月23日，騰訊云召開了以“大模型時代，AI 賦能金融”為主題的新智能技術(shù)峰會。來自騰訊云、清華大學、中國銀聯(lián)、融360、太平人壽等AI前沿專家齊聚一堂，共同探討圍繞

發(fā)表于 11-28 19:10 ?1501次閱讀

騰訊：已儲備足夠英偉達芯片！

劉熾平表示，騰訊已經(jīng)儲備足夠的英偉達芯片，可以繼續(xù)開發(fā)名為“混元”的人工智能模型，“至少再持續(xù)幾代”。因此，新的芯片限制短期內(nèi)不會影響騰訊AI能力的發(fā)展。

發(fā)表于 11-22 17:00 ?604次閱讀

搜索歷史

騰訊AI推出“絕悟”完全體

評論

高通與騰訊混元達成戰(zhàn)略合作

英特爾攜手騰訊以技術(shù)創(chuàng)新，共馭智算未來新機

英特爾與騰訊攜手共繪AI與云計算新藍圖

騰訊推出自主研發(fā)的AI引擎,工作效率提升超40倍

商湯絕影大模型C助力LEVC全新智慧出行體驗

耐能推出最新的邊緣AI服務器及內(nèi)置耐能AI芯片的PC設備

深蘭AI數(shù)字伙伴項目入選“AI Partner·2024 AI應用標桿案例”

飛利浦影音推出首款AI會議降噪耳機飛利浦“8號”

惠普推出多款商用AI PC新品

商湯絕影攜手經(jīng)緯恒潤推出智能感知后視鏡

阿里大模型“通義聽悟”升級

阿里大模型產(chǎn)品發(fā)布多項新功能，音視頻問答助手“小悟”上線

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

AI賦能金融軟通動力車忠良受邀出席騰訊金融云新智能生態(tài)伙伴沙龍

騰訊：已儲備足夠英偉達芯片！