作者:魯御新、李宗一
人工智能具有巨大的潛力。美國(guó)家人工智能安全委員會(huì)提出:“與人類相比,機(jī)器有著更加快速高效的觀察、決定和行動(dòng)能力,這在任何一個(gè)領(lǐng)域都能提供改變世界的競(jìng)爭(zhēng)優(yōu)勢(shì)”。關(guān)于將人工智能技術(shù)應(yīng)用到兵棋推演領(lǐng)域的優(yōu)點(diǎn),美智庫(kù)相關(guān)研究認(rèn)為,“人工智能系統(tǒng)不僅實(shí)現(xiàn)了兵棋推演中許多流程的自動(dòng)化,提高了效率,它們還使人和機(jī)器能夠以新穎的方式協(xié)同工作”。人工智能的崛起為兵棋推演帶來(lái)了前所未有的機(jī)遇,也將使兵棋推演發(fā)生顛覆性的變化。
人工智能在兵棋推演中的應(yīng)用案例
目前,人工智能技術(shù)已經(jīng)在部分方向上實(shí)現(xiàn)了成熟的應(yīng)用,但將人工智能應(yīng)用于兵棋推演這一垂直領(lǐng)域仍是一片藍(lán)海,相關(guān)研究大部分處在理論層面,同時(shí)也有小部分的實(shí)踐探索。
蘭德公司利用人工智能、仿真模擬技術(shù)支撐戰(zhàn)略戰(zhàn)役級(jí)兵棋推演。本次推演旨在探究以美國(guó)為主的北約如何在歐洲方向上應(yīng)對(duì)來(lái)自俄羅斯等主要戰(zhàn)略對(duì)手的威脅,聚焦作為北約成員國(guó)的波羅的海諸國(guó),假設(shè)該地區(qū)在近未來(lái)(10年或更長(zhǎng)時(shí)間后)出現(xiàn)威脅升級(jí)或沖突,并在這樣的背景下,通過(guò)人工智能、模擬仿真等技術(shù)進(jìn)行定量分析,測(cè)試北約相關(guān)作戰(zhàn)概念。其推演結(jié)論是:基于概率推理方法的人工智能技術(shù),可在決策制定過(guò)程中向?qū)﹃噯T提供預(yù)估行動(dòng)方案的成功率,有利于對(duì)陣員做出正確的決策。
美國(guó)聯(lián)合軍事職業(yè)教育計(jì)劃使用人工智能增強(qiáng)戰(zhàn)略級(jí)兵棋推演實(shí)驗(yàn)。本次推演旨在驗(yàn)證將人工智能模型應(yīng)用于戰(zhàn)略級(jí)兵棋推演的可行性,探究應(yīng)用人工智能進(jìn)行推演與傳統(tǒng)人工推演相比具有何種優(yōu)勢(shì),探索將人工智能應(yīng)用于戰(zhàn)略兵棋推演對(duì)職業(yè)軍事教育具有怎樣的影響。本次推演基于一個(gè)城鎮(zhèn)供電系統(tǒng)遭受網(wǎng)絡(luò)攻擊而中斷的突發(fā)性事件,通過(guò)限制決策時(shí)間的方式,模擬現(xiàn)實(shí)中處置突發(fā)情況短暫的時(shí)間窗口。其推演結(jié)論是:第一,人工智能模型能夠與人類密切協(xié)作,在兵棋推演中輔助人類決策;第二,人工智能模型具備快速進(jìn)行決策推薦、全面分析場(chǎng)景要素、良好適應(yīng)動(dòng)態(tài)問(wèn)題的優(yōu)勢(shì);第三,人工智能模型可以讓決策者更好地適應(yīng)復(fù)雜的網(wǎng)絡(luò)環(huán)境,從而在面對(duì)危機(jī)之前做好準(zhǔn)備。
蘭德公司基于人工智能平臺(tái)開(kāi)展戰(zhàn)術(shù)兵棋推演實(shí)驗(yàn)。2020年9月,蘭德公司的研究人員推演了一場(chǎng)藍(lán)軍(美國(guó))和紅軍(俄羅斯)連級(jí)作戰(zhàn)單元,利用由遙控/無(wú)自主能力戰(zhàn)斗車輛,以及具有人工智能與機(jī)器學(xué)習(xí)能力的AI使能戰(zhàn)斗車輛參與的戰(zhàn)術(shù)行動(dòng)。推演嘗試了在桌面戰(zhàn)術(shù)兵棋推演中運(yùn)用具體的、有代表性的人工智能和機(jī)器學(xué)習(xí)技術(shù),并通過(guò)一系列的推演、分析和測(cè)試來(lái)全面研究人工智能和機(jī)器學(xué)習(xí)技術(shù),初步洞察人工智能和機(jī)器學(xué)習(xí)技術(shù)運(yùn)用于作戰(zhàn)車輛的潛能和局限性。推演設(shè)置了基準(zhǔn)場(chǎng)景及人工智能和機(jī)器學(xué)習(xí)場(chǎng)景,兩個(gè)場(chǎng)景的區(qū)別在于車輛的指揮與控制方式。其推演結(jié)論是:第一,與自主機(jī)器人戰(zhàn)車和有人車輛相比,遙控機(jī)器人戰(zhàn)車存在容易被利用的明顯劣勢(shì);第二,人工智能和機(jī)器學(xué)習(xí)能力可以集成到戰(zhàn)術(shù)級(jí)地面作戰(zhàn)兵棋推演;第三,這種操作員和工程師聯(lián)合參與的兵棋推演,有利于需求方和采購(gòu)方充分明確開(kāi)發(fā)人工智能和機(jī)器學(xué)習(xí)系統(tǒng)的需求和工程指標(biāo)。
人工智能應(yīng)用于兵棋推演的優(yōu)勢(shì)特點(diǎn)
為何要在兵棋推演中應(yīng)用人工智能技術(shù)?將人工智能應(yīng)用于兵棋推演會(huì)呈現(xiàn)出什么樣的優(yōu)勢(shì)?為回答這些問(wèn)題,國(guó)外各科研部門(mén)、高校、智庫(kù)進(jìn)行了廣泛、深入的研究與實(shí)踐。
人工智能可以輔助創(chuàng)設(shè)更加擬真的推演情景。在設(shè)計(jì)兵棋推演情景時(shí),設(shè)計(jì)人員通常需要添加增強(qiáng)情景擬真度的元素,但通過(guò)人工或預(yù)設(shè)算法進(jìn)行添加耗時(shí)費(fèi)力,且在復(fù)現(xiàn)復(fù)雜情景時(shí)效果欠佳。將人工智能技術(shù)應(yīng)用于兵棋推演情景設(shè)計(jì),能夠?qū)崿F(xiàn)更為優(yōu)良的擬真度。一是利用人工智能針對(duì)指定的情景快速生成內(nèi)容。目前ChatGPT(一種自然語(yǔ)言處理人工智能模型)、Stable Diffusion(一種人工智能繪畫(huà)模型)等一系列人工智能模型的出現(xiàn),證明了人工智能生成內(nèi)容的技術(shù)已較為成熟,人工智能生成內(nèi)容的風(fēng)格高度類似人類創(chuàng)作,因此可以依托人工智能深化、補(bǔ)充兵棋推演相關(guān)情景,進(jìn)一步強(qiáng)化參與者的沉浸感,使參與者能夠做出更貼合現(xiàn)實(shí)的決策。二是依托人工智能實(shí)現(xiàn)情景的自動(dòng)化運(yùn)行。推演情景中,部分無(wú)須人工控制的實(shí)體可交由人工智能自主運(yùn)行,保證推演高效、連貫的同時(shí),還能實(shí)現(xiàn)更為豐富的變化,進(jìn)一步還原真實(shí)作戰(zhàn)環(huán)境的復(fù)雜程度。
人工智能可以賦能人類對(duì)陣員的計(jì)算和決策。人工智能技術(shù)為處理模糊和不確定性問(wèn)題提供了全新可能性,這使得計(jì)算機(jī)強(qiáng)大的算力可以更有機(jī)地融入兵棋推演中,大幅提升推演效率,節(jié)約對(duì)陣員的時(shí)間和精力,從而讓對(duì)陣員能夠推演更多的內(nèi)容,或?qū)⒆⒁饬性陉P(guān)鍵問(wèn)題上。一方面,人工智能依托計(jì)算機(jī)技術(shù),在兵棋推演中可以進(jìn)行毫秒級(jí)的分析,輔助對(duì)陣員決策;另一方面,人工智能能夠直接識(shí)別計(jì)算機(jī)的語(yǔ)言,能夠不依賴專業(yè)技術(shù)人員,讓對(duì)陣員做到與計(jì)算機(jī)直接交互,從而提高推演整體的運(yùn)行效率。
人工智能能夠提供更高質(zhì)量的決策建議。人工智能的內(nèi)在邏輯和算法基礎(chǔ)有助于生成更高質(zhì)量的策略,在兵棋推演中,人工智能在某些方面能夠媲美一名經(jīng)驗(yàn)豐富的顧問(wèn),為人類對(duì)陣員提供高質(zhì)高效的決策建議。一是大量訓(xùn)練數(shù)據(jù)為人工智能決策提供了大樣本量。相較于一般經(jīng)驗(yàn)水平的人類對(duì)陣員,人工智能在進(jìn)行決策時(shí)具備顯著的樣本量?jī)?yōu)勢(shì),這一優(yōu)勢(shì)為人工智能生成的策略帶來(lái)了更高的可推廣性,往往能更好地反映真實(shí)的作戰(zhàn)情況。二是算法機(jī)理賦予了人工智能先天優(yōu)勢(shì)。現(xiàn)階段運(yùn)用到兵棋推演的人工智能算法中,普遍運(yùn)用到了蒙特卡洛樹(shù)搜索方法(MCTS),算法的循環(huán)包含4個(gè)步驟,即選擇-擴(kuò)展-模擬-回溯,其中“選擇”“擴(kuò)展”的步驟提供了多方案交叉比較、擇優(yōu)選用的機(jī)制,“模擬”的步驟提供了單方案反復(fù)模擬、精細(xì)打磨的機(jī)制,兩種機(jī)制相輔相成,不但提高了決策的質(zhì)量,更能夠及時(shí)發(fā)現(xiàn)可能的風(fēng)險(xiǎn)。
蒙特卡洛樹(shù)搜索方法
人工智能能夠考慮到更全面的要素和細(xì)節(jié)。人工智能可以依托計(jì)算機(jī)多線程、高速率處理問(wèn)題的優(yōu)勢(shì),在兵棋推演中比人類考慮到更全面的信息,帶來(lái)更廣闊的視角或產(chǎn)生令人驚奇的結(jié)論。一方面,人的注意力是有限的,心理學(xué)家丹尼爾·卡尼曼曾提出“資源限制理論”,認(rèn)為人類的注意力是一種有限的認(rèn)知資源,同時(shí)進(jìn)行的任務(wù)所需要的認(rèn)知資源之和不能超過(guò)人的認(rèn)知資源總量,而人工智能基于計(jì)算機(jī)技術(shù),其短時(shí)間內(nèi)處理大量信息的能力遠(yuǎn)高于人類,在兵棋推演中應(yīng)用人工智能可以在短時(shí)間內(nèi)獲得全局性、系統(tǒng)性的視角,對(duì)陣員決策時(shí)能夠更加充分地考慮風(fēng)險(xiǎn)、后果和成本,從而制定更高質(zhì)量的決策。另一方面,人工智能因?yàn)榧夹g(shù)特點(diǎn)往往能夠發(fā)現(xiàn)人類意想不到的策略,人工智能使用的算法蒙特卡洛樹(shù)搜索方法在數(shù)學(xué)原理上鼓勵(lì)對(duì)每一個(gè)分支進(jìn)行充分模擬,以盡可能確保不遺漏任何可行的策略,因此可以“帶領(lǐng)”對(duì)陣員跳出人的思維定勢(shì)。
人工智能能夠構(gòu)建更深層次的人機(jī)協(xié)作模式。兵棋推演離不開(kāi)人的參與,而人工智能在人類和計(jì)算機(jī)之間建立了合作的橋梁。關(guān)于如何依托人工智能技術(shù)構(gòu)建人機(jī)協(xié)作模式,從而將人類處理模糊、不確定信息的優(yōu)勢(shì)和計(jì)算機(jī)的強(qiáng)大算力進(jìn)行有機(jī)結(jié)合,相關(guān)研究基本可歸納為兩大方向。一是“人在回路中”方向上。前美國(guó)防部副部長(zhǎng)鮑勃·沃克提出了一種名為“半人馬”的人機(jī)協(xié)作模型,旨在建立一種人機(jī)高度耦合的協(xié)作關(guān)系,但關(guān)鍵的決策仍然由人類完成,美國(guó)關(guān)于構(gòu)建兵棋推演中的人機(jī)協(xié)作模式研究實(shí)踐大都深受這一模型的影響。二是“人在回路外”方向上。相關(guān)人機(jī)協(xié)同模式或是側(cè)重于訓(xùn)練人工智能對(duì)陣員,用來(lái)磨練人類對(duì)陣員的決策技能,或是應(yīng)用人工智能自動(dòng)制定一些簡(jiǎn)單、低風(fēng)險(xiǎn)的決策,從而提高整體推演效率,例如2020年5月,DARPA啟動(dòng)了名為“建設(shè)性機(jī)器學(xué)習(xí)對(duì)抗對(duì)手策略(COMBAT)”項(xiàng)目,旨在建立由人工智能對(duì)陣員組成的紅方小組,在兵棋推演中與藍(lán)方進(jìn)行對(duì)抗。
人工智能應(yīng)用于兵棋推演的矛盾和局限
盡管將人工智能技術(shù)應(yīng)用于兵棋推演好處多多,然而相關(guān)研究實(shí)踐證明,人工智能并非兵棋推演的“萬(wàn)能靈藥”,二者的結(jié)合應(yīng)用仍然存在一定的局限。
人工智能的黑箱效應(yīng)與推演結(jié)果可驗(yàn)證之間存在矛盾。充分理解人工智能做出決策的機(jī)理,需要相當(dāng)高的專業(yè)門(mén)檻,這帶來(lái)了嚴(yán)重的黑箱效應(yīng)。人工智能介入到兵棋推演的過(guò)程之中,非專業(yè)人員既難以理解人工智能的決策邏輯,又難以核查訓(xùn)練數(shù)據(jù)的全面性,嚴(yán)重影響了結(jié)論的可信度。
人工智能技術(shù)的高成本與兵棋推演通用性要求之間存在矛盾。人工智能目前作為一項(xiàng)高新技術(shù),仍具有較高的應(yīng)用成本。從兵棋系統(tǒng)開(kāi)發(fā)的慣例來(lái)看,高成本的系統(tǒng)往往需要具備一定的通用性。然而目前的人工智能技術(shù)在通用性上表現(xiàn)欠佳,主要因?yàn)槿斯ぶ悄苣P偷陌l(fā)揮依賴于訓(xùn)練數(shù)據(jù),而訓(xùn)練數(shù)據(jù)又不可能做到包羅萬(wàn)象,這就導(dǎo)致一旦推演規(guī)則的變化超出了訓(xùn)練數(shù)據(jù)集的覆蓋范圍,人工智能模型就必須重新訓(xùn)練才能夠適用。成本高、通用性差的兵棋系統(tǒng)需要占用大量的預(yù)算,又難以通過(guò)適配多個(gè)項(xiàng)目來(lái)分?jǐn)偝杀?,不利于推廣使用。
應(yīng)用人工智能過(guò)度追求高擬真、大系統(tǒng),與控制推演復(fù)雜度之間存在矛盾。人工智能為兵棋設(shè)計(jì)提供了一種高質(zhì)高效的途徑,不但情景元素可以更豐富,兵棋系統(tǒng)也可以涵蓋更多的戰(zhàn)爭(zhēng)要素。但一方面,人工智能自動(dòng)生成大量情景元素會(huì)令對(duì)陣員接收到過(guò)多的信息,這不但會(huì)導(dǎo)致兵棋的上手難度飆升,而且推演時(shí)對(duì)陣員的注意力難以集中在關(guān)鍵問(wèn)題上;另一方面,人工智能的強(qiáng)大能力會(huì)“誘導(dǎo)”兵棋設(shè)計(jì)人員嘗試設(shè)計(jì)更大、更包羅萬(wàn)象的兵棋推演系統(tǒng),但更復(fù)雜的系統(tǒng)不僅具有更高的開(kāi)發(fā)難度,后續(xù)運(yùn)維、迭代的成本也將更為高昂。
應(yīng)用人工智能為對(duì)陣員過(guò)度減負(fù),與兵棋推演體現(xiàn)“人的因素”之間存在矛盾。人工智能提供的決策輔助能夠節(jié)約對(duì)陣員的時(shí)間和精力,從而推演更多問(wèn)題或聚焦于關(guān)鍵問(wèn)題,然而,不恰當(dāng)?shù)脑O(shè)計(jì)會(huì)導(dǎo)致人工智能參與決策程度過(guò)高。美兵棋推演大師彼得·波拉在其著作《兵棋推演藝術(shù)》中提出,“只有當(dāng)對(duì)陣員做出決定并必須處理后果時(shí),兵棋推演的效果才能達(dá)到最好”。若缺乏限制機(jī)制,對(duì)陣員做決策時(shí)可能會(huì)過(guò)于依賴人工智能的輔助,導(dǎo)致對(duì)陣員將“做出決定并處理后果”的權(quán)柄轉(zhuǎn)移給機(jī)器,這樣一來(lái),難以達(dá)到兵棋推演訓(xùn)練決策者的目的,也將不能很好地模擬現(xiàn)實(shí)中的決策壓力,影響推演有效性。
審核編輯:黃飛
評(píng)論
查看更多