将棋AIで学ぶディープラーニング
(このノートは、あとで別マガジンにまとめたいと思っている)
先日、書店の技術書コーナーに行ったら、「まさに!」という本が目に留まった。
いきなり話題が逸れるのだけれど、僕はものごとを「深く」考えることが苦手だ。
網羅的に、浅く。(困ったことに、短期記憶の容量も自分が満足できるレベルには程遠い)
だから、将棋の手筋を考えることが異様に苦手だ。
でも、うまく考えられるようにも、なりたい。
情報工学を専攻していたので、「探索」という技術分野のさわりは教わった。
けれど枝刈り、アルファ・ベータ法、A*など高度な話題になるにつれ「これはダメだ、僕の手には負えない」と脱落してしまった。
これまた横道だけれど、探索を理解できないことはコンプレックスとして引きずっていて、だから折に触れて学び直したいという欲求が鎌首をもたげる。
枝刈りに触れずに、こんな記事を書いたりもした。
ディープマインド社と Alpha Go
さらに横道に逸れる。
先般、ディープマインドというグーグルの関連会社が Alpha Go という囲碁プログラムをつくった。
AI(Artificial Intelligence; 人工知能、機械知性)分野で一躍有名になったディープラーニングを用いて鍛えられた、知る人ぞ知るアプリケーションだ。
これは凄まじい性能で、プロ棋士をあっさり破ってしまった。この先10数年は無理と囁かれていたのに、だ。(なぜ無理だと言われていたか。それはチェスや将棋のように駒の強さに差がないため局面の有利・不利を点数化しにくいこと、そして盤面が広いので探索空間が爆発するからだ)
Alpha Go の設計については、上記の記事がディープマインドの論文を適宜引用しつつ、喩えも交えてしっかり教えてくれる。
ディープマインド社は Alpha Go の後、人間の棋譜を使わず学習する AlphaGo Zero をつくり(これは Alpha Go よりも圧倒的に強くなった)、これを応用して Alpha Chess と Alpha Shogi を作った、らしい。
そしてアルファ将棋は、数あるオンラインの将棋プログラムと比較して、100戦98勝だったか、やはり「異様に」強いのだそうだ。
ディープラーニングと、将棋!
将棋AIで学ぶディープラーニング
そして、ようやく、ここにたどり着いた。
自分で作れるみたいだ。
仕事の都合で2年ほどディープラーニング編集のフロントエンドを作っていて、そのときに自学自習で基礎も学んだので、たぶんイケる。
理解できるし、作れる。
そう感じて、だから、はじめる。
この記事が気に入ったらサポートをしてみませんか?