将棋AIで学ぶディープラーニング

2018年5月19日 01:39

（このノートは、あとで別マガジンにまとめたいと思っている）

先日、書店の技術書コーナーに行ったら、「まさに！」という本が目に留まった。

いきなり話題が逸れるのだけれど、僕はものごとを「深く」考えることが苦手だ。
網羅的に、浅く。（困ったことに、短期記憶の容量も自分が満足できるレベルには程遠い）

だから、将棋の手筋を考えることが異様に苦手だ。

でも、うまく考えられるようにも、なりたい。
情報工学を専攻していたので、「探索」という技術分野のさわりは教わった。
けれど枝刈り、アルファ・ベータ法、Ａ＊など高度な話題になるにつれ「これはダメだ、僕の手には負えない」と脱落してしまった。

これまた横道だけれど、探索を理解できないことはコンプレックスとして引きずっていて、だから折に触れて学び直したいという欲求が鎌首をもたげる。
枝刈りに触れずに、こんな記事を書いたりもした。

ディープマインド社と Alpha Go

さらに横道に逸れる。

先般、ディープマインドというグーグルの関連会社が Alpha Go という囲碁プログラムをつくった。
AI（Artificial Intelligence; 人工知能、機械知性）分野で一躍有名になったディープラーニングを用いて鍛えられた、知る人ぞ知るアプリケーションだ。

これは凄まじい性能で、プロ棋士をあっさり破ってしまった。この先10数年は無理と囁かれていたのに、だ。（なぜ無理だと言われていたか。それはチェスや将棋のように駒の強さに差がないため局面の有利・不利を点数化しにくいこと、そして盤面が広いので探索空間が爆発するからだ）

Alpha Go の設計については、上記の記事がディープマインドの論文を適宜引用しつつ、喩えも交えてしっかり教えてくれる。

ディープマインド社は Alpha Go の後、人間の棋譜を使わず学習する AlphaGo Zero をつくり（これは Alpha Go よりも圧倒的に強くなった）、これを応用して Alpha Chess と Alpha Shogi を作った、らしい。

そしてアルファ将棋は、数あるオンラインの将棋プログラムと比較して、１００戦９８勝だったか、やはり「異様に」強いのだそうだ。

ディープラーニングと、将棋！

そして、ようやく、ここにたどり着いた。

自分で作れるみたいだ。

仕事の都合で２年ほどディープラーニング編集のフロントエンドを作っていて、そのときに自学自習で基礎も学んだので、たぶんイケる。
理解できるし、作れる。

そう感じて、だから、はじめる。

この記事が気に入ったらサポートをしてみませんか？