當前位置:首頁 > 新聞中心 > 科研動態

科研動態

自動化所開源星際爭霸2基準AI

  • 發表日期:2021-04-12 【 【打印】【關閉】
  •   決策智能是國家新一代人工智能的重要發展方向,也是實現國家創新發展戰略的重要基石。在決策智能的探索道路上,人機對抗已成為國際公認的重要途徑之一。由中科院自動化所智能系統與工程研究中心發布的人機對抗智能門戶網站致力于匯聚人機對抗平臺環境,共享人機對抗技術成果,發布人機對抗領域最新消息,從而推動人機對抗智能技術生態建設與發展。

      近日,自動化所針對星際爭霸2游戲開發的一款開源性樣例基準AI在人機對抗智能門戶網站正式上線星際爭霸2是一款即時戰略類游戲,由于兼具大狀態空間、大動作空間、實時性、不完美信息博弈等特點,因此無論對于人類玩家還是AI算法來說都是很大的挑戰,被學術界廣泛用于人工智能算法的訓練平臺和評估標準。

    星際爭霸2開源基準AI運行截圖 

      本次發布的開源基準AI以狀態、動作空間抽象技術和深度強化學習算法Dueling DQN為基礎實現。該開源基準AI提供了完整的樣例代碼、詳細的環境配置指南、命令行使用指南、代碼逐段分析文檔、訓練測試圖表及預訓練模型。該開源基準AI以實現用戶下載后快速讀懂代碼、進行便捷修改并在合理的時間內利用普通配置的計算機訓練出效果為目標定位,并不追求極限跑分。因此,團隊對AI進行了以下必要限制:

      1. 限制了只進行 TvT(人族對戰人族)對戰模式。

      2. 限制了有限的幾種兵種和建筑。

      3. 抽象了狀態空間、動作空間。

      4. 去掉了戰爭迷霧的設定。

      5. 限制只在一張尺寸較正常比賽用圖小一些的地圖(Simple64)上對戰。

      6. 限制每局游戲的時長,超時按平局計算。

      在實驗效果方面,團隊利用該AI(基于DuelingDQN的學習型AI)與內置的專門用于輔助訓練的隨機AI進行對抗訓練,該AI經過3000局的對抗訓練贏率穩定在100%附近。

      人機對抗智能門戶網站:http://turingai.ia.ac.cn

      開源地址:http://turingai.ia.ac.cn/ai_center/show?mid=4 

    彩神-入口