Google・DeepMindの新たなAIがFPS『Quake III Arena』にて人間以上のチームワークを発揮。シンギュラリティへの序章となるか

とあるAIに関する成果発表がソーシャルメディアを中心に注目を浴びている。2018年7月3日（現地時間）、米Google傘下のDeepMind TechnologiesがFPS『Quake III Arena』を使用した人工知能の強化学習開発の成果を発表したのだ。

Yu Naganeo
2018-07-07 15:00
ニュース

対応機種・タグDig News
Read Time15 mins

とあるAIに関する成果発表がソーシャルメディアを中心に注目を浴びている。2018年7月3日（現地時間）、米Google傘下のDeepMind Technologies（以下、DeepMind）がFPS『Quake III Arena』を使用した人工知能（以下、AI）の強化学習開発の成果を発表したのだ。

Our latest work allows agents to reach human-level on Quake III Arena Capture the Flag through new multi-agent RL techniques: populations of agents learning their own internal reward signal and operating at multiple timescales https://t.co/phXmGFoIkK pic.twitter.com/P3KW908ljq

— Google DeepMind (@GoogleDeepMind) July 3, 2018

人間（を超える）レベルでFPSをプレイ

AIと人間をゲーム内で対戦させることで、AI技術、社会的認知の向上を狙うDeepMindの活動は以前にもご紹介した。『StarCraft』による訓練のかたわら、新規プロジェクトとして、チーム構成と対戦相手の多様性を学習することを目指す強化学習（Reinforcement Learning）をスタートさせていた。その成果報告として、同AIが『Quake III Arena』のキャプチャー・ザ・フラッグ（以下、CTF）というモードで、人間との協力プレイにおいて、AIが人間レベルの成績を達成したという。

FPSである『Quake III Arena』はリアルタイムでゲームが進行する。目先の状況はもちろん、視野外を判断するには難しい一人称視点の作品だ。CTFではそれぞれのプレイヤーが旗を奪取、またそれらの阻止を狙い、ダイナミックに移動しなければならない。非常に複雑な操作と瞬発力が必要とされるモードである。

強化学習開発は以下のような流れとなる。

まずこの実験では、数千もの強化学習エージェントが並行して学習行動を取る「Population-Based Deep Reinforcement Learning （学術報告書）」という手法が採用されている。エージェント同士の2対2の対戦プレイで、互いに交流・協力しながらプレイ方法を習得。単体ではなく、大量のエージェントに同時並行で学習させることで多様性が生まれ、学習効果を高められるという狙いだ。

そして実験を進めていく中で、エージェントは独自に物事を解釈し行動パターンを増やしていく。ゲームのルールを理解したあとは、何に価値を置いて行動すべきなのか、どういう行動を取れば勝利しやすいのか、「フラッグを確保する」「敵を見つけた」といった独自の内部報酬を生成し始める。この学習方法によりCTFルールを習得していったエージェントは、For The Win（以下、FTW）エージェントと呼ばれている。

だがこうしたFTW同士の学習だけでは行動パターンが人間に比べ非常に少なく、スキルが思うように向上しなかった。その後Deepmindは、40人の実際の人間を含むトーナメント戦で、エージェントをチームメイトや対戦相手としてランダムにマッチングさせた。そうした対人間戦による強化学習にて、FTWエージェントは上位プレイヤーよりも速くスキルを伸ばすことができたという。

横軸はトレーニングゲームのプレイ回数を示す。最上部の曲線がFTW（Fight for Win）スキームを用いたエージェントの結果だ。プレイを繰り返すたびに向上し、最終的に人間を超えているのが分かる。

強化学習プログラムの背景となるDeepMindの理念は、OpenAIが『Dota 2』用にBOTを作り出し、チームプレイを教える手法に近い（参考記事）。DeepMindの焦点は「チーム構成と対戦相手の多様性」の2つにある。

FTWエージェントは、複数人同時に訓練をした結果、エージェント同士で協力し合うようになり、グループ内の人間を上回る結果を出し始めたという。さらに『Dota 2』でのAIと同様、拠点に引きこもるベースキャンピングといった戦略を取り始めたのだ。なおDeepMindはこのFTWエージェントを用いた実験において、プレイごとにマップを書き換えることで、新たな戦略をAIが独自に学ばなければならないようプログラムに手を加えている。

FTWエージェントはランダムに変化するマップを解析し、敵と味方の動きを把握する必要がある。上図は、FTWのアーキテクチャの概念図だ。高速、低速のタイムスケールでリカレントニューラルネットワーク（RNN※）を結合、そして共有メモリモジュールを含み、ゲームポイントから内部報酬への変換を学習させている。つまり、RNNが出力した画像から抽出した情報と、そのラウンドでのゲーム情報に強化学習を適応させ、次の戦略、行動をAIが独自に決定しているのだ（※RNNについてはこちらを参照）。

DeepMindは公式ブログでの報告を、「今回発表した論文はCTFを用いた実験にフォーカスしているが、この研究成果は普遍的である。私達が公開した手法を用いて他の人々が、さらに複雑な環境で何かを構築することを期待している。そして将来的には、現在の強化学習とFTWエージェントの集団訓練方法を改善していきたい」との言葉で締めている。

人間の知性を解明すること

これはDeepMindの公式サイトにある企業理念だ。DeepMindの共同設立者であり最高経営責任者（以下、CEO）であるデミス・ハサビス（Demis Hassabis）氏は、汎用人工知能（Artificial General Intelligence：AGI）を実現させるプロセスは、「数十年にわたる宇宙開発と人類の大きな一歩が踏み出されたアポロ計画のようなものだ」と述べている。それはAIに人間の言語を理解させることや、人間の指示に従わせるといったレベルのものではない。ハサビス氏が開発しようとしているのは、脳神経科学と機械科学との考察をベースとした、どのような状況に置かれても人間と同じ思考能力、判断能力を下せるAIであるという。

こうしたDeepMindの姿勢に対して、「知性をもつAIが人類の絶滅を早める可能性があるかもしれない」と警告したのは、スウェーデン生まれオックスフォード大学哲学教授であるニック・ボストロム（Nick Bostrom）氏。彼のベストセラーである『Superintelligence : Paths, Dangers, Strategies』では「私はGoogleの囲碁AI『Alpha Go』（関連記事）のようなAIを軽視しているわけではないが、それが必ずしも人類にとって大きな飛躍をもたらすものではない。」と主張している。

能力と資本をもつ大勢が、AIが人間を超える所謂「シンギュラリティ」に向かい躍起になっているこの時代。AI研究分野においてそれは非常に重要なことであるが、そうした運動に警鐘を鳴らす人たちも少なからずいるのも事実だ。今回のDeepMindによる成果発表を見れば、AI学習はもはやルールを記述する必要がなくなったことを示している。AIの学習能力はその姿を変えつつある。これらの事実がシンギュラリティへの序曲となるか。人類にとってより良い未来を暗示することになるのか。時代が進めば、徐々にその答えがわかってくるだろう。

Yu Naganeo

野生のグラフィックデザイナー。ゲームをプレイすることを「ゲームを食べる」と言う。

記事本文: 61

Google・DeepMindの新たなAIがFPS『Quake III Arena』にて人間以上のチームワークを発揮。シンギュラリティへの序章となるか

人間（を超える）レベルでFPSをプレイ

人間の知性を解明すること

Yu Naganeo

『マインクラフト』に新モブ「銅ゴーレム」実装へ。なんとチェストを自動整理してくれる拠点のおとも

『ペルソナ5: The Phantom X』の“ぶつかりおじさん”、「現実にいる」と知った海外ユーザーがざわめく。フィクションの極悪人かと思いきや

『ウマ娘』、欧米で「カワイイのに超高難易度ゲーム」として広まる。“見慣れない育成システム”がそびえ立つ

「Nintendo Switch 2」ゲオでの3次抽選、7月3日から開始へ。条件ゆるめ、店舗受け取り制

『エルデンリングナイトレイン』最新アプデで「武器種別」が常に見えるように。特大武器と大斧、もう間違えない

『モンスターハンターワイルズ』、不具合の“お詫び”として「重鎧玉＆ギルドポイント」配布開始。珍しめ対応

Nintendo Switch 2『ドンキーコングバナンザ』は、『スーパーマリオオデッセイ』と同じチームが開発。任天堂が認める

『Escape from Tarkov』、「ハードコアワイプ」ではフリーマーケットが利用不可に。弾薬のクラフト制限などしっかりハードコアな詳細お披露目

『エルデンリングナイトレイン』、明日に強化版ボス「知性の蟲」実装へ。合体もする、翅と鋏の仲良しグノスター

『アイドルマスターシンデレラガールズスターライトステージ（デレステ）』運用体制変更で“終了の足音”近づく。PC版は8月サービス終了へ

『マインクラフト』に新モブ「銅ゴーレム」実装へ。なんとチェストを自動整理してくれる拠点のおとも

『ペルソナ5: The Phantom X』の“ぶつかりおじさん”、「現実にいる」と知った海外ユーザーがざわめく。フィクションの極悪人かと思いきや

「Nintendo Switch 2」ゲオでの3次抽選、7月3日から開始へ。条件ゆるめ、店舗受け取り制

Nintendo Switch 2用グリップを作った周辺機器メーカー、グリップが外れやすいと指摘され「変な使い方したからでは」との旨のコメントし批判殺到。マッハ反省と改善宣言

『ウマ娘』、欧米で「カワイイのに超高難易度ゲーム」として広まる。“見慣れない育成システム”がそびえ立つ

『エルデンリングナイトレイン』にて“封牢特化ブースト”遺物が脚光浴びる。石剣の鍵持ち込みスタートダッシュ

『エルデンリングナイトレイン』守護者が今かなり強い。『デススト2』は思ったより強引に進める。寄り道楽しい。『Elin』でとにかく金策。今週のゲーミング

『デス・ストランディング2』のゲームエンジンDECIMAは、“UE5より優れている”とのユーザー主張にベテラン開発者がツッコむ。そもそも比べようがない

『モンスターハンターワイルズ』新アプデで「ハンマー」に相殺追撃新アクション実装でさらに強化へ。太刀強化、チャージアックス・双剣調整などパッチノートで公開

「圧倒的に好評」魔法少女育成RPG『魔女の泉R』大型無料アプデ「追従者の終焉」8月配信へ。本編の後日談を追加

「Nintendo Switch 2」ふるいちでの3次抽選開始。だれでも応募可

「Nintendo Switch 2」ふるいちでの4次抽選開始。だれでも応募可

「Nintendo Switch 2」の抽選販売、ゲオとエディオンで受付開始。どちらも応募条件ゆるめ

『マインクラフト』に新モブ「銅ゴーレム」実装へ。なんとチェストを自動整理してくれる拠点のおとも

『エルデンリングナイトレイン』にて「雨の中で無理やりレベル上げ」戦法が脚光浴びる。やせ我慢ゴリ押し攻略法

「Nintendo Switch 2」発売日の“2か月前から並んだ”人、無事入店。もちろん一番乗り

『エルデンリングナイトレイン』、「調律の魔物」被害者が続出中。予告なしで襲来もする、えげつない外道

「Nintendo Switch 2を買ったおかげで命が救われた」とのユーザー報告が注目集める。Switch 2ほぼ関係ないけどいい話

『エルデンリングナイトレイン』、実は“ジャスト回避”が存在する。意外と知らない攻略知識6選

音楽あふれる異世界都市ゲーム『The New Flesh』Steamで無料配信開始。評判めちゃくちゃ良い

「母親に見つからずゲームを遊ぶ」夜ふかしホラー『Time for Bed』Steamにて7月11日配信へ。すごい怖いお母さんに見つかったらアウト

『Battlefield（バトルフィールド）』新作の開発費、「2年前時点で“約500億円以上”も費やされた」との報道。気合入りすぎて難航模様

期待されたポータルFPS『Splitgate 2』Steam同接急落。“FPSを再び偉大に”と野心掲げてローンチも、プレイヤー数維持できず

クトゥルフ神話ホテル経営恋愛シミュ『ヨグ=ソトースの庭』日本語対応へ。大人気“冒涜的経営＆恋愛シミュレーション”がとうとう公式の日本語訳で遊べる

キノコ娘育成ゲーム『Mushroom Musume』「ほぼ100％好評」の熱い反響。かわいい見た目にダークな展開も秘めた重厚ストーリー子育て