0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于AI的兵棋類模擬開發(fā)項目

AI智勝未來 ? 來源:中國指揮與控制學(xué)會 ? 2023-12-18 09:20 ? 次閱讀

摘要:本文介紹了一項旨在為兵棋類模擬開發(fā)基于AI的強大人工對手的項目。本文提供了兩種方法。第一種方法主要基于對制定可靠戰(zhàn)術(shù)所必需的復(fù)雜知識進行漸進式主動學(xué)習(xí)方法,但這需要對該領(lǐng)域知識有深入了解的高水平教練。

第二種方法是嘗試將整個軍隊各層級的決策制定過程建模為某種形式的復(fù)雜的知識密集型問題解決過程。后續(xù)工作將研究綜合運用上述方法的可能性,以及其他方法,例如基于案例的推理等。

目的

本項目的目的是在計算機兵棋嘗試一系列AI方法,這些兵棋以一定的歷史真實感模擬了前幾個世紀的軍事戰(zhàn)術(shù)。我們的主要動機是檢驗并改進這些AI技術(shù)。而在此過程中,一些兵棋也可以獲得高質(zhì)量的人工對手。

戰(zhàn)略兵棋與國際象棋

到目前為止,我們的研究將重點放在非常成熟的模擬拿破侖時期重要戰(zhàn)斗的商業(yè)兵棋上。這款兵棋有非常強大的對陣員社區(qū),因此當我們的系統(tǒng)準備就緒時,我們可以邀請一些外部專家對其進行測試。此外,在研究的第一階段,為檢驗一些想法,特別是SOAR的使用,我們還使用了另一款由UPMC學(xué)員設(shè)計的相對簡單的兵棋,該兵棋在許多方面與拿破侖兵棋相似,但側(cè)重于中世紀戰(zhàn)術(shù)。

我們不打算詳細討論這兩款兵棋的規(guī)則,而是通過強調(diào)它們與經(jīng)典國際象棋的差異性來說明兵棋的基本理念。和國際象棋一樣,每個對陣員在沖突中推演一方。戰(zhàn)場用棋盤表示。對陣員根據(jù)一系列規(guī)則在棋盤上移動棋子,輪流進行推演。與國際象棋相比,沒處差異都可被視作復(fù)雜性的增加。

我們使用的兵棋棋盤由六角格覆蓋而非正方形。這使得機動模式更加復(fù)雜(每個位置有六個鄰居)。更重要地,國際象棋棋盤上只有64個方格,而我們使用的兵棋中包含數(shù)千個六角格。

每個六角格除了位置外,還由一系列參數(shù)定義,例如地形類型(森林、平原。。。)、海拔高度等,這些參數(shù)反過來會影響單位的機動或戰(zhàn)斗能力。

每個單位都有若干特點,這會影響其機動、戰(zhàn)斗能力以及質(zhì)量、疲勞和組織等。其中一些特征(例如單位配置),可被視作影響單位能力(機動或戰(zhàn)斗等)的單位參數(shù)。

單位按級別組織(例如、軍、軍團、師、旅等)。根據(jù)軍隊凝聚力要求,屬于同一級別的單位互相戰(zhàn)斗。每個回合分為若干階段,每個階段分配不同活動類型,例如機動、遠程射擊等。

戰(zhàn)斗本身的建模相對復(fù)雜:包括遠程射擊(步兵使用滑膛槍或者火炮從遠處射擊)和近戰(zhàn)(徒手格斗)。戰(zhàn)斗解決方法需要考慮許多參數(shù),包括各方的規(guī)模、素質(zhì)、狀態(tài)和疲勞度等。它還包含隨機因素,因此結(jié)果幾乎永遠無法保證。

在特定時間內(nèi)得分最高的一方獲演勝。攻占(或成功防守)重要位置,以及使敵方單位失去戰(zhàn)斗力,即可獲得分數(shù)。

從計算視角來開,我兵棋與國際象棋更顯著的差異在于,各回合每個單位都可以活動。這與國際象棋截然不同,在國際象棋中各方選擇一枚獨特的棋子移動。這最終導(dǎo)致兵棋的復(fù)雜性大大增加。

如果有p個單位,每個單位可能采取m種行動,則國際象棋來的分支因素是p.m,而兵棋是mp。除了爆炸性的復(fù)雜性,這種不同的設(shè)置方式具有以下優(yōu)勢:讓模擬更接近歷史,或者更接近于人類代理的模擬。軍隊單位確實在戰(zhàn)場上以相似方式機動,因此如果擔(dān)心歷史合理性,那么順序行動(如國際象棋)是不可能的。

因此,我們可以設(shè)想通過盲搜方法將國際象棋下到一定水平,當該方法對于兵棋而言是難以想象的,因為在m=20,p=100的情況下,即使得出下一回合的所有可能狀態(tài)都是不可能的。因此與國際象棋相比,對于大多數(shù)真正的人工智能問題來說,一切都取決于系統(tǒng)學(xué)習(xí)的或者為系統(tǒng)提供的知識的質(zhì)量。

主動學(xué)習(xí)方法

我們嘗試的第一種方法是對背景知識要求最低的方法。我們的想法是從模擬小規(guī)模對抗實現(xiàn)簡單目標開始,以便個體單位學(xué)習(xí)一些基本知識,然后循序漸進,通過模擬更復(fù)雜的態(tài)勢學(xué)習(xí)更加復(fù)雜的知識。我們的第一種學(xué)習(xí)方法是基于基因的規(guī)則庫學(xué)習(xí)。

我們嘗試了不同設(shè)置,一些僅使用基本的感知信息(除了單位目標,還有周圍環(huán)境的信息,包括敵方單位的存在),一些則以基因代碼方式體現(xiàn)了一些中間概念,比如觀察到的當?shù)乇Ρ龋ㄖ苯芋w現(xiàn)威脅概念)。在這些初始階段完成之后,可通過讓單位在更大的編隊內(nèi)在復(fù)雜性不斷增加的“指導(dǎo)性想定中”發(fā)揮作用來獲取新的規(guī)則集。

這一方法令人非常振奮,因為它最有可能產(chǎn)生意想不到的結(jié)果(因為它很少因為我們的經(jīng)驗--針對特定態(tài)勢采取哪種戰(zhàn)略更合適,產(chǎn)生偏見)。出其不意可能是我們系統(tǒng)顯示的某種形式的戰(zhàn)略創(chuàng)造力的結(jié)果,也可能意味著推演規(guī)則不切實際,或者我們的方法與其它人工或人為方法相比,更能發(fā)現(xiàn)這些規(guī)則中的漏洞。

這種漸進式分類系統(tǒng)學(xué)習(xí)方法,可能會增大知識庫最終趨同的可能性。當然在現(xiàn)階段就斷言它們會趨同還為時過早。設(shè)計合適的訓(xùn)練方案,逐步增加復(fù)雜性讓系統(tǒng)從學(xué)習(xí)基本概念和戰(zhàn)術(shù)開始,然后逐漸學(xué)習(xí)更高級的戰(zhàn)略存在一定的困難。實驗初步表明,這一階段本身就需要深入了解一些兵棋知識。

因此,盡管該學(xué)習(xí)方法在最初看起來似乎對背景知識的要求不高(在許多方面的確如此),但是看起來,“知識密集型”方法在建模和知識開發(fā)階段吸取的所有經(jīng)驗教訓(xùn),都能讓主動學(xué)習(xí)方法獲益匪淺。

知識密集型方法

此外,我們通過在SOAR框架內(nèi)引出相關(guān)知識來應(yīng)用知識密集型方法。多年來的實踐證明,SOAR是一種在動態(tài)環(huán)境內(nèi)體現(xiàn)并使用復(fù)雜知識的可靠框架。繼應(yīng)用于一些軍事模擬和規(guī)劃中之后,該框架已經(jīng)成功應(yīng)用于大量計算機推演中。

該方法的難點是如何為知識庫設(shè)定良好的角色以及如何選擇相關(guān)中間概念。同時,充分利用SOAR內(nèi)的分塊學(xué)習(xí)能力尤為重要,因為最初的直覺,當前的系統(tǒng)因其學(xué)習(xí)能力受限。

我們可以將各單位視作不同代理。事實上兵棋讓對陣員像指揮官一樣(在當前態(tài)勢范圍內(nèi))決定各單位(如步兵營、騎兵中隊等)的行動。但是,各單位指揮官只有在上級指揮官(師、軍團、集團軍級別)制定的全球戰(zhàn)略背景下解決行動問題才有意義。

因此信息流是雙向的:一方面它是上行的(下級指揮官報告觀察到的情況,報告行動的成功/失?。6硪环矫嫠质窍滦械?,戰(zhàn)略被選擇,命令被下達解讀并盡可能執(zhí)行(有時需一定調(diào)整)。

觀察發(fā)現(xiàn)這種分層信息流與SOAR中目標和操作符的組織方式很相似。也就是說,當前的設(shè)計方案是,將整個軍隊當作一個復(fù)雜的問題解決代理,其大部分層級結(jié)構(gòu)可通過SOAR操作符的等級體現(xiàn)。

由于這種選擇,我們決定在在同一單位類型之間共享知識庫庫,也就是只能按單位類型進行學(xué)習(xí),個體單位無法學(xué)習(xí)。當然,單位組織層次中的每一級都可獨立于上一級或下一級進行學(xué)習(xí)。同時,兵棋還有一個專門指導(dǎo)模式,在這種模式下如果當前知識庫內(nèi)容不充分或者有待提高,用戶可以向程序提供行動方案建議。

后續(xù)研究

在后續(xù)研究中,我們希望在兵棋中采用一些懶惰學(xué)習(xí)形式。就對背景知識的要求而言,該方法可能介于主動學(xué)習(xí)和知識密集型方法之間?;诎咐耐评硇枰恍┡c案例表征、案例庫組織、案例檢索相似度度量以及戰(zhàn)略調(diào)整選擇相關(guān)的知識。因此與基于基因的學(xué)習(xí)方法相比,這種方法需要更多的知識,但又低于知識密集型方法。

該方法的優(yōu)勢在于可以提出利用過去獲得成功的一整套行動方,解決潛在的態(tài)勢問題。不同組織層級需要不同的案例庫,案例相似性計算要考慮的一個重要元素是單位目標之間的相似性,因為態(tài)勢(地理和環(huán)境)之間的相似性還不足以激發(fā)案例的檢索。

除了實驗更多方法,后續(xù)研究會將最有希望的方法整合到一體化系統(tǒng)中,以便利用最適合當前態(tài)勢的技術(shù)。因為我們應(yīng)用的所有技術(shù)都依賴一些學(xué)習(xí)要素,因此有必要通過一些形式的實驗,讓系統(tǒng)與自己高速對抗,從而達到某種基本性能水平。

對于主動學(xué)習(xí)方法,可以讓系統(tǒng)與知識密集型方法對抗(即使剛開始是其知識庫很簡單)。我們的想法是,主動學(xué)習(xí)方法將以隨機對陣員的身份開始(在學(xué)習(xí)到任何知識之前),這樣在與自己的對抗中就不會有太大進步。此外,利用知識密集型方法獲取知識,有助于為漸進式主動學(xué)習(xí)方法設(shè)計更好的指導(dǎo)方案。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266232

原文標題:如何利用AI方法為兵棋制定戰(zhàn)略

文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

    NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件免費提供,不要求使用者具備
    的頭像 發(fā)表于 09-06 14:45 ?251次閱讀

    AI模擬

    一、介紹 基于鴻蒙Next模擬一個ai對話過程 二、場景需求 客戶服務(wù)、數(shù)據(jù)分析、個性化推薦、圖像和視頻處理、智能家居、交通管理、教育行業(yè)、制造等等。 三、業(yè)務(wù)步驟 第一步:輸入框提出問題,發(fā)送
    發(fā)表于 08-22 17:28

    英偉達Cosmos AI項目曝光:構(gòu)建先進視頻模型

    近日,英偉達內(nèi)部一項名為Cosmos的AI項目浮出水面,引起了業(yè)界的廣泛關(guān)注。該項目尚處于保密階段,未向公眾正式發(fā)布,但其雄心勃勃的目標已初露端倪。Cosmos旨在構(gòu)建一個集光傳輸、物理和智能
    的頭像 發(fā)表于 08-07 16:51 ?374次閱讀

    開發(fā)AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 14:41:54

    谷歌推出旗下AI智能體管理項目Project Oscar

    在近日于印度班加羅爾盛大舉行的2024 I/O Connect開發(fā)者活動上,谷歌公司隆重推出了Project Oscar項目,這一創(chuàng)新舉措標志著開源軟件項目管理領(lǐng)域迎來了AI智能體的全
    的頭像 發(fā)表于 07-19 16:07 ?439次閱讀

    揭秘NVIDIA AI Workbench 如何助力應(yīng)用開發(fā)

    者能夠根據(jù)其具體需求調(diào)整 AI 模型。 此類工作在過去可能需要復(fù)雜的設(shè)置,而新工具使這項工作變得空前簡單。 NVIDIA AI Workbench 可協(xié)助 AI 開發(fā)者構(gòu)建自己的 RA
    發(fā)表于 07-10 18:51 ?513次閱讀
    揭秘NVIDIA <b class='flag-5'>AI</b> Workbench 如何助力應(yīng)用<b class='flag-5'>開發(fā)</b>

    ai開發(fā)需要什么配置

    AI開發(fā)是一個復(fù)雜的過程,涉及到多個方面的配置。 硬件配置 AI開發(fā)需要高性能的硬件支持,主要包括以下幾個方面: 1.1 CPU AI
    的頭像 發(fā)表于 07-02 09:54 ?595次閱讀

    深蘭AI數(shù)字伙伴項目入選“AI Partner·2024 AI應(yīng)用標桿案例”

    近期,36氪揭曉了“AI Partner·2024 AI應(yīng)用標桿案例”,深蘭AI數(shù)字伙伴項目從200多個報名項目中脫穎而出,當選標桿案例。一
    的頭像 發(fā)表于 05-23 10:34 ?320次閱讀
    深蘭<b class='flag-5'>AI</b>數(shù)字伙伴<b class='flag-5'>項目</b>入選“<b class='flag-5'>AI</b> Partner·2024 <b class='flag-5'>AI</b>應(yīng)用標桿案例”

    開發(fā)者手機 AI - 目標識別 demo

    功能簡介 該應(yīng)用是在Openharmony 4.0系統(tǒng)上開發(fā)的一個目標識別的AI應(yīng)用,旨在從上到下打通Openharmony AI子系統(tǒng),展示Openharmony系統(tǒng)的AI能力,并為
    發(fā)表于 04-11 16:14

    模擬后端是什么意思

    模擬后端,在軟件開發(fā)和測試領(lǐng)域,通常是指使用工具或技術(shù)來模擬實際后端服務(wù)的行為。這樣做的主要目的是在項目開發(fā)過程中,當后端服務(wù)還未就緒或暫時
    的頭像 發(fā)表于 03-15 15:58 ?489次閱讀

    Sudachi模擬項目啟動,Yuzu開發(fā)者將涉足多平臺任天堂Switch開發(fā)

    作為iOS逆向工程師及應(yīng)用開發(fā)者,Jarrod Norwell(網(wǎng)名為@antique_codes)曾成功將任天堂3DS模擬器Citra、Switch模擬器Yuzu移植到了iPhone和iPad上。
    的頭像 發(fā)表于 03-08 15:13 ?3490次閱讀

    新聞快訊 | 瑞薩推出基于云的開發(fā)環(huán)境,以加速車用AI軟件的開發(fā)與評估

    AI工程師在云端實現(xiàn)車載軟件的設(shè)計、模擬和調(diào)試。 借助這一開發(fā)環(huán)境,工程師能夠即刻利用微軟(Microsoft)Azure(Azure Compute, IaaS services
    的頭像 發(fā)表于 12-15 16:10 ?362次閱讀
    新聞快訊 | 瑞薩推出基于云的<b class='flag-5'>開發(fā)</b>環(huán)境,以加速車用<b class='flag-5'>AI</b>軟件的<b class='flag-5'>開發(fā)</b>與評估

    數(shù)字孿生技術(shù)在棋推演中的應(yīng)用有哪些

    智慧華盛恒輝數(shù)字孿生技術(shù)在棋推演中的應(yīng)用主要包括以下方面: 建立數(shù)字孿生模型:在棋推演開始前,需要建立起數(shù)字孿生模型,這個模型可以是針對整個棋推演的模型,也可以是針對某個具體作戰(zhàn)單位或作戰(zhàn)行動
    的頭像 發(fā)表于 11-01 11:53 ?266次閱讀

    Microchip與IHWK正在合作開發(fā)模擬計算平臺

    合作開發(fā)模擬計算平臺,以加速神經(jīng)技術(shù)設(shè)備的邊緣 AI/ML 推理。 IHWK正在為神經(jīng)技術(shù)設(shè)備和現(xiàn)場可編程神經(jīng)形態(tài)設(shè)備開發(fā)神經(jīng)形態(tài)計算平臺。Microchip Technology子公
    的頭像 發(fā)表于 10-12 16:04 ?871次閱讀

    基于英特爾開發(fā)套件的AI字幕生成器設(shè)計

    量化的 Base Whisper 模型通過 OpenVINO 工具套件進行 AI 推理部署。由于聲音處理應(yīng)用的廣泛性,開發(fā)者可以基于本項目繼續(xù)進行 AI 應(yīng)用的頂層
    的頭像 發(fā)表于 09-27 16:59 ?778次閱讀
    基于英特爾<b class='flag-5'>開發(fā)</b>套件的<b class='flag-5'>AI</b>字幕生成器設(shè)計