作者:Winnie
戰(zhàn)爭(zhēng)與和平一直是塑造人類歷史的重要元素。最近的一項(xiàng)研究聚焦于用LLMs模擬國(guó)際沖突,特別是第一次世界大戰(zhàn)、第二次世界大戰(zhàn)以及中國(guó)古代的戰(zhàn)國(guó)時(shí)期。通過(guò)這些歷史事件的詳細(xì)模擬,研究團(tuán)隊(duì)探索了國(guó)際關(guān)系動(dòng)態(tài)和觸發(fā)戰(zhàn)爭(zhēng)的關(guān)鍵因素。具體來(lái)說(shuō),這項(xiàng)研究關(guān)注于三個(gè)主要問(wèn)題:首先是探索基于LLM的MAS在模擬戰(zhàn)略規(guī)劃和決策制定過(guò)程中的有效性;其次是識(shí)別那些在歷史上觸發(fā)戰(zhàn)爭(zhēng)的關(guān)鍵因素;最后是評(píng)估歷史事件的不可避免性,特別是那些導(dǎo)致戰(zhàn)爭(zhēng)或和平的條件。
讓我們一起來(lái)看看LLM在國(guó)際沖突中是怎么表現(xiàn)的吧!
國(guó)家代理
在這篇研究中,一個(gè)關(guān)鍵組成部分是國(guó)家代理人。這些代理人在模擬國(guó)際沖突中扮演至關(guān)重要的角色。每個(gè)國(guó)家代理都由其對(duì)應(yīng)的國(guó)家檔案定義。在每一輪中,代理根據(jù)行動(dòng)空間中可用的行動(dòng),通過(guò)精心構(gòu)建的提示來(lái)對(duì)當(dāng)前情況做出反應(yīng)。引導(dǎo)提示將代理引導(dǎo)通過(guò)復(fù)雜的國(guó)際關(guān)系情況,確保他們的行動(dòng)和決策經(jīng)過(guò)深思熟慮。它通過(guò)分析聯(lián)盟和敵對(duì)關(guān)系、權(quán)衡利益和導(dǎo)航?jīng)Q策步驟等來(lái)引導(dǎo)代理。
國(guó)家代理檔案
國(guó)家代理檔案基于六個(gè)基本維度:領(lǐng)導(dǎo)力、軍事能力、資源、歷史背景、關(guān)鍵政策和民眾士氣。每個(gè)維度都為我們理解這些代理人在模擬中的行為和決策提供了多維度的視角。
以下是一個(gè)英國(guó)代理檔案的例子。
國(guó)家代理行動(dòng)空間
國(guó)家代理的行動(dòng)空間被分為七個(gè)不同的類別:
Wait for action:這允許代理人采取被動(dòng)態(tài)度,觀察其他參與者的行為及背景的變化。
General mobilization:使國(guó)家能夠?yàn)闈撛跊_突做好準(zhǔn)備。
Declare war:這是國(guó)家對(duì)另一國(guó)家采取敵對(duì)行動(dòng)的正式聲明。
Military alliance:是多個(gè)國(guó)家之間提供相互支持的正式協(xié)議。
Non-intervention treaty:是國(guó)家間承諾不干預(yù)對(duì)方內(nèi)政的外交協(xié)議。
Peace agreement:旨在結(jié)束沖突,建立未來(lái)關(guān)系的框架。
Send message:是代理人進(jìn)行非正式溝通的方式。
行動(dòng)的屬性被細(xì)致地定義,包括公開(kāi)性、輸入類型和是否需要回應(yīng)。公開(kāi)性決定了行動(dòng)的可見(jiàn)度和公眾意識(shí)水平,分為公開(kāi)和私人兩種。輸入類型指定了行動(dòng)啟動(dòng)所需的信息或資源,而是否需要回應(yīng)則指明了行動(dòng)是否需要其他實(shí)體的反饋。
WarAgent多智能體系統(tǒng)(MAS)
WarAgent圍繞四個(gè)基本構(gòu)建塊展開(kāi):國(guó)家代理、秘書(shū)代理、委員會(huì)和Stick:
國(guó)家代理:每個(gè)國(guó)家代理由對(duì)應(yīng)的國(guó)家檔案定義,并根據(jù)行動(dòng)空間中可用的行動(dòng)做出反應(yīng)。引導(dǎo)提示幫助代理導(dǎo)航復(fù)雜的國(guó)際關(guān)系環(huán)境,并確保其行動(dòng)和決策經(jīng)過(guò)深思熟慮。
秘書(shū)代理:作為L(zhǎng)LMs的補(bǔ)充,秘書(shū)代理負(fù)責(zé)驗(yàn)證國(guó)家代理的行動(dòng)適當(dāng)性和基本邏輯一致性。這個(gè)角色不僅確保行動(dòng)符合已定義的參數(shù),還負(fù)責(zé)驗(yàn)證行動(dòng)的邏輯連貫性。
委員會(huì):委員會(huì)管理國(guó)際關(guān)系,作為動(dòng)態(tài)記錄平臺(tái),收集并顯示模擬中的關(guān)系動(dòng)態(tài)。它幫助代理根據(jù)最新信息做出決策。
Stick:作為內(nèi)部記錄系統(tǒng),棒跟蹤關(guān)鍵指標(biāo),如動(dòng)員情況、內(nèi)部穩(wěn)定性和戰(zhàn)備預(yù)測(cè),以確保國(guó)家代理的行動(dòng)與預(yù)定義的協(xié)議和標(biāo)準(zhǔn)保持一致。
如下圖所示,委員會(huì)類可以跟蹤和管理不同國(guó)家之間四種類型的國(guó)際關(guān)系。如戰(zhàn)爭(zhēng)宣言(W)表示國(guó)家之間的沖突或戰(zhàn)爭(zhēng),用符號(hào)“×”表示。軍事聯(lián)盟(M)表示國(guó)家之間的正式軍事合作伙伴關(guān)系,用符號(hào)“&”表示。Stick側(cè)重于跟蹤對(duì)國(guó)家的決策過(guò)程至關(guān)重要的關(guān)鍵指標(biāo),包括動(dòng)員、內(nèi)部穩(wěn)定性和戰(zhàn)備預(yù)測(cè)。
每個(gè)國(guó)家代理與其秘書(shū)代理之間存在指定的互動(dòng)。秘書(shū)代理評(píng)估國(guó)家代理提出的行動(dòng)計(jì)劃,確保其符合格式、內(nèi)容和邏輯一致性。國(guó)家代理之間的互動(dòng)由歷史背景下的觸發(fā)事件引發(fā)。代理們共同對(duì)觸發(fā)事件作出反應(yīng),并通過(guò)各種行動(dòng)和溝通互動(dòng)進(jìn)行交流。
在MAS中,每個(gè)代理的初始行動(dòng)都是由觸發(fā)事件引發(fā)的。在歷史背景下,觸發(fā)事件指的是引發(fā)各國(guó)之間一系列反應(yīng)的事件,最終導(dǎo)致重大歷史事件的發(fā)展。在模擬中,觸發(fā)事件作為所有代理響應(yīng)的初始情景。例如,在第一次世界大戰(zhàn)的情況下,奧地利-匈牙利的弗朗茨·費(fèi)迪南大公被暗殺被廣泛認(rèn)為是觸發(fā)事件。類似地,在第二次世界大戰(zhàn)中,觸發(fā)事件通常被認(rèn)為是德意志帝國(guó)入侵波蘭。在戰(zhàn)國(guó)時(shí)期的背景下,金國(guó)在韓國(guó)、趙國(guó)和魏國(guó)之間的分裂通常被視為觸發(fā)事件。
實(shí)驗(yàn)設(shè)置
本實(shí)驗(yàn)旨在驗(yàn)證LLM在模擬復(fù)雜歷史事件方面的有效性。實(shí)驗(yàn)選用了OpenAI開(kāi)發(fā)的GPT-4作為后端模型,討論以下問(wèn)題。
模擬效果(RQ1):在歷史上準(zhǔn)確的條件下展示模擬結(jié)果,旨在證明WarAgent系統(tǒng)在提供可信模擬方面的能力。采用人工評(píng)估和多次運(yùn)行計(jì)算準(zhǔn)確性得分的方法來(lái)驗(yàn)證結(jié)果。
戰(zhàn)爭(zhēng)的導(dǎo)火索(RQ2):通過(guò)探索性“假設(shè)”情景,重點(diǎn)是評(píng)估歷史背景下觸發(fā)事件的重要性,特別是在第一次世界大戰(zhàn)的情況下。
戰(zhàn)爭(zhēng)不可避免性(RQ3):考察不同的初始條件下各種場(chǎng)景,通過(guò)改變決策過(guò)程或國(guó)家條件來(lái)構(gòu)建替代歷史敘事,并分析其對(duì)歷史軌跡的影響。
評(píng)估
人工評(píng)估: 檢查國(guó)家代理執(zhí)行的行動(dòng)是否與其國(guó)家配置文件一致,評(píng)估行動(dòng)是否符合國(guó)家利益,以及代理在不同回合中的一致性。
Board連通性評(píng)估: 根據(jù)Wikipedia描述和總結(jié),嚴(yán)格評(píng)估模擬場(chǎng)景與實(shí)際歷史事件的忠實(shí)度,特別是軍事聯(lián)盟的形成、宣戰(zhàn)和全面動(dòng)員的實(shí)施。
聯(lián)盟準(zhǔn)確度分?jǐn)?shù): 使用“兩個(gè)分區(qū)的互信息分?jǐn)?shù)”來(lái)評(píng)估模擬聯(lián)盟與歷史聯(lián)盟的一致性,采用Python中SciPy的標(biāo)準(zhǔn)實(shí)現(xiàn)。宣戰(zhàn)/全面動(dòng)員準(zhǔn)確度分?jǐn)?shù):使用Jaccard集相似性指數(shù)來(lái)評(píng)估這兩個(gè)領(lǐng)域的模擬準(zhǔn)確度。
實(shí)驗(yàn)分析
人類評(píng)估
實(shí)驗(yàn)從以下三個(gè)方面對(duì)模擬結(jié)果進(jìn)行了觀察:軍事聯(lián)盟、宣戰(zhàn)和不干涉條約。
軍事聯(lián)盟: 在所有模擬中,英國(guó)與法國(guó)、德意志帝國(guó)與奧匈帝國(guó)、塞爾維亞與俄羅斯之間均形成了一致的聯(lián)盟。模擬結(jié)果顯示,由于德意志帝國(guó)的擴(kuò)張政策,英國(guó)和法國(guó)視其為潛在對(duì)手。德意志帝國(guó)與奧匈帝國(guó)的聯(lián)盟則基于語(yǔ)言和民族共性及外交孤立法國(guó)的共同目標(biāo)。塞爾維亞和俄羅斯的聯(lián)盟基于共同的民族背景和戰(zhàn)略利益。
宣戰(zhàn): 在所有模擬中,奧匈帝國(guó)不斷地向塞爾維亞和俄羅斯宣戰(zhàn),德意志帝國(guó)也對(duì)俄羅斯宣戰(zhàn)。法國(guó)和英國(guó)對(duì)德意志帝國(guó)的宣戰(zhàn)在大部分模擬中也發(fā)生了。這些宣戰(zhàn)行為反映了當(dāng)時(shí)的聯(lián)盟結(jié)構(gòu)和歷史敵意。
不干涉條約: 在每次模擬中,美國(guó)總是參與至少一項(xiàng)不干涉條約。美國(guó)的外交策略傾向于避免沖突,通過(guò)不干涉條約保持距離。奧斯曼帝國(guó)也在大多數(shù)模擬中采取了類似的策略。
實(shí)驗(yàn)中還觀察到了兩種特殊情況:一是沒(méi)有聯(lián)盟支持的消息,二是背叛聯(lián)盟。這些情況表明國(guó)家代理在不斷變化的政治背景下作出了戰(zhàn)略性的決策。
這些發(fā)現(xiàn)表明,模擬在復(fù)制歷史情景方面是有效的,特別是在將刺殺事件視為觸發(fā)事件的情況下。模擬行動(dòng)展現(xiàn)了高度的合理性,忠實(shí)于實(shí)際歷史背景,從而證明了基于LLM的MAS在模擬復(fù)雜歷史事件方面的有效性。
準(zhǔn)確性分析
聯(lián)盟準(zhǔn)確性: 在七次模擬中,英國(guó)和法國(guó)、俄羅斯和塞爾維亞、奧匈帝國(guó)和德意志帝國(guó)、俄羅斯和法國(guó)、奧斯曼帝國(guó)和德意志帝國(guó)等歷史上的聯(lián)盟在模擬中得到了再現(xiàn)。
宣戰(zhàn)準(zhǔn)確性: 在模擬中,列日戰(zhàn)役之前的宣戰(zhàn)行為如奧地利對(duì)塞爾維亞、俄羅斯對(duì)奧匈帝國(guó)、德意志帝國(guó)對(duì)塞爾維亞、俄羅斯對(duì)德意志帝國(guó)、法國(guó)對(duì)德意志帝國(guó)的宣戰(zhàn)均被重現(xiàn)。
動(dòng)員狀態(tài)準(zhǔn)確性: 除了美國(guó)之外,所有國(guó)家在這一時(shí)期都進(jìn)入了動(dòng)員狀態(tài),與歷史情況相符。
錯(cuò)誤分析
聯(lián)盟形成錯(cuò)誤:在七次模擬中,英國(guó)和法國(guó)與德意志帝國(guó)-奧匈帝國(guó)聯(lián)盟結(jié)成意外聯(lián)盟的情況出現(xiàn)了一次,這與歷史上的情況不符。
宣戰(zhàn)錯(cuò)誤:英國(guó)和法國(guó)是否向奧匈帝國(guó)或德意志帝國(guó)宣戰(zhàn)的選擇,有時(shí)與歷史上的情況不一致。歷史上,這些國(guó)家最初與德意志帝國(guó)發(fā)生沖突,但在某些模擬中,它們錯(cuò)誤地被描繪為與奧匈帝國(guó)對(duì)抗。
動(dòng)員錯(cuò)誤:美國(guó)的軍事動(dòng)員描繪有誤。歷史上,美國(guó)在1917年較晚加入一戰(zhàn),但在部分模擬中,美國(guó)與英國(guó)結(jié)成聯(lián)盟并早期進(jìn)行動(dòng)員。
總結(jié)
WarAgent模擬系統(tǒng)已經(jīng)證明了其作為理解國(guó)際沖突動(dòng)態(tài)的工具的可靠性。它展示了基于LLM的多智能體AI系統(tǒng)的能力,可以原型化和分析復(fù)雜的人類行為。通過(guò)比較不同的Casus Belli設(shè)置,實(shí)驗(yàn)揭示了即使是最小或null的觸發(fā)因素也可能演變成類似于冷戰(zhàn)的情況。這強(qiáng)調(diào)了在一定情況下通向戰(zhàn)爭(zhēng)的路徑往往是不可避免的性質(zhì)。實(shí)驗(yàn)進(jìn)一步支持了這一觀點(diǎn),通過(guò)對(duì)國(guó)家設(shè)置的反事實(shí)改變,暗示國(guó)家政策的偏差是改變這些看似注定的結(jié)果的必要手段。
這些發(fā)現(xiàn)突顯了沖突在特定情況下的決定性本質(zhì),但也指出了通過(guò)修改國(guó)家政策或關(guān)系的戰(zhàn)略性調(diào)整的潛力,以改變這些看似注定的結(jié)果。我們也認(rèn)識(shí)到了當(dāng)前框架在充分捕捉國(guó)際關(guān)系復(fù)雜性方面存在局限,因此為未來(lái)研究提供了方向。
審核編輯:黃飛
-
OpenAI
+關(guān)注
關(guān)注
9文章
1139瀏覽量
6705 -
LLM
+關(guān)注
關(guān)注
0文章
299瀏覽量
400
原文標(biāo)題:LLM來(lái)模擬世界大戰(zhàn),會(huì)發(fā)生什么?
文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論