資料介紹
麻將作為典型的非完備信息博弈游戲主要通過(guò)傳統(tǒng) Expectimax搜索算法實(shí)現(xiàn),其剪枝策略與估值函數(shù)基于人工先驗(yàn)知識(shí)設(shè)計(jì),存在假設(shè)不合理等問(wèn)題。提出一種結(jié)合 Expectimax搜索與 Double DQN強(qiáng)化學(xué)習(xí)算法的非完備信息博弈算法。在 Expectimax搜索樹(shù)擴(kuò)展過(guò)程中,采用 Double DQN輸出的估值設(shè)計(jì)估值函數(shù)并在限定搜索層數(shù)內(nèi)獲得分支估值,同時(shí)設(shè)計(jì)剪枝策略對(duì)打牌動(dòng)作進(jìn)行排序與部分?jǐn)U展實(shí)現(xiàn)搜索樹(shù)剪枝。在 Double DQN模型訓(xùn)練過(guò)程中,將麻將信息編碼為特征數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)獲得估值,使用巸 xpectimax搜索算法得到最優(yōu)動(dòng)作以改進(jìn)探索策略。實(shí)驗(yàn)結(jié)果表明,與 Expectimax搜索算法、 Double DQN算法等監(jiān)督學(xué)習(xí)算法相比,該算法在麻將游戲上勝率與得分更高,具有更優(yōu)異的博弈性能。
- 基于函數(shù)逼近協(xié)同更新的DQN算法 3次下載
- 無(wú)線傳感器網(wǎng)絡(luò)的非均勻拓?fù)淇刂?b class="flag-6" style="color: red">算法 13次下載
- 基于DDPG算法的智能車匯流模型 7次下載
- 基于改進(jìn)和聲搜索算法的深度置信網(wǎng)絡(luò)模型 5次下載
- 一種帶權(quán)重的改進(jìn)跳點(diǎn)搜索路徑規(guī)劃算法 13次下載
- 基于滑動(dòng)窗口的寬度優(yōu)先搜索算法 4次下載
- 結(jié)合深度與演化算法的群競(jìng)爭(zhēng)合作優(yōu)化算法 20次下載
- 一種基于博弈論的移動(dòng)邊緣計(jì)算功率分配算法 22次下載
- 以進(jìn)化算法為搜索策略實(shí)現(xiàn)神經(jīng)架構(gòu)搜索的方法 15次下載
- 如何使用優(yōu)化算法和powell算法提高醫(yī)學(xué)圖像配準(zhǔn)精度 4次下載
- 基于概率信息不完備的群決策模型介紹 3次下載
- 基于演化博弈論的無(wú)線傳感網(wǎng)監(jiān)測(cè)節(jié)點(diǎn)分群算法 0次下載
- 結(jié)合壓縮感知與非局部信息的圖像超分辨率重建 1次下載
- 信號(hào)短暫缺失下的非完備GPS定位算法研究
- 基于禁忌搜索的啟發(fā)式求解背包問(wèn)題算法
- Rust如何實(shí)現(xiàn)A*算法 918次閱讀
- Dijkstra算法和A*算法 1680次閱讀
- 一種完全由LLM + 啟發(fā)式搜索算法結(jié)合的TOT算法 1659次閱讀
- 介紹當(dāng)前比較常見(jiàn)的幾種近鄰搜索算法 2556次閱讀
- 關(guān)于AI遺傳算法的詳解 8.4w次閱讀
- 如何用Python實(shí)現(xiàn)一個(gè)大數(shù)據(jù)搜索引擎 3062次閱讀
- 區(qū)塊鏈共識(shí)算法全面詳解 1.5w次閱讀
- DIMM被分為single-rank和double-rank 1.7w次閱讀
- 基于膚色與人臉運(yùn)動(dòng)相結(jié)合的自動(dòng)表情,對(duì)其識(shí)別算法進(jìn)行了研究 4219次閱讀
- Matlab關(guān)于Apriori算法設(shè)計(jì) 5151次閱讀
- 最常見(jiàn)10大算法類型 2.3w次閱讀
- 垂直搜索引擎是什么_垂直搜索引擎有哪些 7943次閱讀
- 您的完備移動(dòng)電源解決方案 1597次閱讀
- 基于非測(cè)距的DV-Hop定位算法改進(jìn) 3221次閱讀
- 一種改進(jìn)的無(wú)線傳感器網(wǎng)絡(luò)非測(cè)距定位算法 1300次閱讀
下載排行
本周
- 1AN-1267: 使用ADSP-CM408F ADC控制器的電機(jī)控制反饋采樣時(shí)序
- 1.41MB | 3次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN-282: 采樣數(shù)據(jù)系統(tǒng)基本原理[中文版]
- 1.52MB | 次下載 | 免費(fèi)
- 5AN-1390:手動(dòng)選擇頻段以縮短PLL鎖定時(shí)間
- 310.58KB | 次下載 | 免費(fèi)
- 6AN-1321:電流檢測(cè)應(yīng)用中的共模瞬態(tài)
- 246.83KB | 次下載 | 免費(fèi)
- 7AN-620:將AD1836和AD1953用于帶DSP的4輸入/9輸出模擬系統(tǒng)
- 66.76KB | 次下載 | 免費(fèi)
- 8EE-170:估算ADSP-TS201S TigerSHARC處理器的功耗
- 372.77KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 5美的電磁爐維修手冊(cè)大全
- 1.56 MB | 24次下載 | 5 積分
- 6如何正確測(cè)試電源的紋波
- 0.36 MB | 18次下載 | 免費(fèi)
- 7感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
- 8萬(wàn)用表UT58A原理圖
- 0.09 MB | 9次下載 | 5 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論
查看更多