暴雪想把《星際爭霸 2》變成 AI 實驗室

「圍棋上帝」AlphaGo 在戰勝柯潔之後便宣佈退役，成為圍棋界難以逾越的一座高峰。而其締造者 DeepMind 公司早就為人工智能準備瞭下一個目標：《星際爭霸 2》（StarCraft）。

《星際爭霸 2》是由暴雪娛樂（Blizzard Entertainment）在 2010 年推出的即時戰略遊戲，遊戲劇情主要講述瞭在遙遠未來，一場圍繞銀河系中心的種族之戰。由於遊戲極其考驗玩傢對資源的運營策略，因此也被視為 AI 研究的突破點之一。

（《星際爭霸 2》遊戲畫面，圖片來源：YouTube）

DeepMind 科學傢奧利奧爾 · 溫雅爾斯（Oriol Vinyals）就曾是頂級的《星際爭霸》玩傢之一，他曾提出這樣一個觀點：

玩《星際爭霸》的 AI 需要有效地利用記憶力，能夠進行長期戰略規劃，並根據新的信息不斷做出調整。如果我們開發的 AI 系統能掌握如此復雜多變的技能，那麼最終這些技術也將被用於服務現實世界。

因此，早在 2016 年 11 月份，DeepMind 就宣佈與暴雪娛樂合作，將針對《星際爭霸 2》展開一系列的研究實驗。而到瞭 2017 年 8 月 9 日，暴雪與 DeepMind 公開瞭這個項目的初步研究成果，將開放《星際爭霸 2》作為 AI 研究環境。這個人工智能環境包將包括：

在遊戲中為開發者和研究員加入瞭人工智能 API，並且首次支持 Linux 環境

新增一個匿名遊戲回放數據庫，並且在未來的幾周裡，遊戲回放數據將從 65000 份增加到 50 萬份

加入 DeepMind 開源工具集 PySC2，讓研究員可以輕松地調用暴雪底層的功能 API

新增一系列的 RL 迷你遊戲，從而讓研究員能夠測試 AI 在特定任務下的性能

……

（《星際爭霸 2》中訓練 AI 的小遊戲，圖片來源：DeepMind）

實際上，《星際爭霸》遊戲裡一直都有不同難度的 AI 存在，隻不過這些 AI 是通過訪問遊戲後臺、采集全局數據來與玩傢作鬥爭，玩傢和 AI 一開始就不在同一條起跑線上。而 DeepMind 的最終目的，是訓練一個能在同等條件下與人類進行競爭的 AI，這才是該項目最具挑戰性的地方。

一些人類習以為常的動作，要讓 AI 來做就得經過不斷地訓練。在接受 The Verge 采訪時，DeepMind 科學傢奧利奧爾舉過這麼一個例子：

在遊戲中有一個名為「戰爭迷霧」的機制，黑霧籠罩瞭整個地圖，玩傢需要經過不斷地探索才能找出敵人。因此，對於 AI 來說，它必須記住「我曾在這裡見過某個單位，但現在這個單位不見瞭，所以我要回去偵查一下，看看附近有沒有敵人的基地」。

對於人類選手來說，這是一個常識。但對於人工智能來說，這是一個值得學習的挑戰。這是《星際爭霸》與國際象棋最不同的地方，玩國際象棋的時候，雙方的環境一目瞭然，但在《星際爭霸》裡，玩傢無論何時都要瞭解自己周邊的環境。

（AI 眼中的《星際爭霸 2》，圖片來源：DeepMind）

目前，人工智能對《星際爭霸》的探索還處在非常早期的階段，不僅需要訓練各種「常識」，而且在面臨突發情況時的應變能力也有所不足（AlphaGo 就曾經下棋下到崩潰）。這也就難怪 24 歲的頂級《星際爭霸 2》電競選手 Byun Hyun Woo 敢大放厥詞瞭：

至少在我的有生之年，我不認為 AI 能夠打敗職業玩傢。

AlphaGo 隻用瞭一年就超越瞭柯潔，人工智能問鼎《星際爭霸 2》世界冠軍，要幾年？

題圖來源：YouTube