不完全情報ゲームに挑むAI

2024年2月20日 04:32

リュディアです。完全情報ゲームと不完全情報ゲームという言葉を聞いたことがありますか？

簡単に書くと完全情報ゲームは対戦相手に自分の手の内やゲームの状況がすべて公開されているものです。例えば将棋、囲碁、チェスが完全情報ゲームです。将棋で考えてみましょう。最初に両者が将棋の駒を並べます。このとき双方で同じ並べ方をしており、相手に自分のすべての手の内やゲームの状況が公開されているのと同じですね。ゲームの進行中も駒の動きはすべて公開されていますし、相手からとり手元にある駒（もち駒）もすべて公開されています。囲碁、チェスも同じです。数学的に厳密な定義もできるのですが、ここでは雰囲気だけ知っておいてください。

完全情報ゲームではないゲームが不完全情報ゲームです。例えば麻雀やポーカーのようなカードゲームが有名です。麻雀では自分の手の内を最後まで対戦者に見せないですね。自分が捨てた牌（捨て牌）の情報だけが対戦者に公開されています。他のプレーヤーの捨て牌を見て、そのプレーヤーが何を考えているのか予測しながら自分の牌を揃えていくのが麻雀の醍醐味です。

完全情報ゲームの囲碁において2017年に Deep Mind社の AlphaGo が当時世界棋士レート1位の柯潔に勝ち越したニュースは覚えていますか？

これをもって Deep Mind 社はAlphaGoを人間との対局から引退させると発表しました。その後、Deep Mind社が AlphaGo Zeroを発表しました。名前に Zero と書かれているのは囲碁のルールだけを既知とし2台の AlphaGo Zero が対局を繰り返し強くなった、つまり過去の人間の棋譜を使った学習はしていないことによります。この自己学習済の AlphaGo Zero は過去のどの AlphaGo よりも強い、という結果を得て Deep Mind は囲碁へのAIの適用をやめました。さらにそのあと、囲碁に特化しない汎用バージョンの AlphaZeroで将棋、チェス、囲碁のすべてにおいて圧倒的に強いという結論をえて発表をやめたようです。つまり完全情報ゲームにおいては人間がAIに勝つことは難しい時代に入ったと言えます。

では不完全情報ゲームについてはどうでしょうか？これも挑戦が始まっており特に麻雀とポーカーについては研究が行われています。

ポーカーもいろいろなルールがあるので、この記事の内容だけを見て AI が人間に勝ったという話にはならないですが、不完全情報ゲームにおいても人間の優位性が小さくなってきていると考えてよいでしょうね。結局、AI の研究というのはアルゴリズムもありますが、いわゆる計算パワーが重要であるということなのかもしれません。多少、無理なアルゴリズムでも最近は計算機のパワーで押し切るようなイメージがあります。今後も不完全情報ゲームに関するAIの動向は気にしておく必要がありそうです。

では、ごきげんよう。

この記事が気に入ったらサポートをしてみませんか？