ほんのわずかな不確実さのもたらす決定的な差

月岡蓮風

2022年2月17日 11:41

いま流行りの AI 技術の基礎を学習している（CS50 AI コース@HarvardX）。

『Q 学習（ https://ja.wikipedia.org/wiki/Q学習）』と呼ばれる仕組みをつかって、”Nim” という石取りゲームの類を解いている（英文 wiki ではマッチ棒の取り合いになっている）。

https://en.wikipedia.org/wiki/Nim

この Nim は “misere (= misery)” なゲームだそうだ。

成程、10000 回も Q 学習で教師なし学習させてやれば、後手が 100 % 勝つ AI が育つ。

つまり 10000 回も試行して訓練すれば、コンピューターには十分な学習で、完全に打ち筋を読み切って後手必勝となる。

でも、此処にわずかな確率、たとえば 5% でもランダムな手を選択する不確実性を組み込んでやる（ε-Greedy 法のε= 0.05 と設定してやる）。

そうすると、結果の勝敗にドラスティックな変化が現れるのだ！！

以下に、教師なし学習訓練回数 10000 回、そして、実際の勝負の試行が 10000 回のケースの結果勝敗率を 10 種羅列する。ただし、5% の確率でランダムな手を打つオプション付きで（≒ 5% の確率において打ち手でミスをし得る）。ちなみに先手も後手も、同じ Q 学習をした AI だ（AI vs AI）。
テスト・ケースを 10 回くりかえした結果は以下のとおりだ。
Nim はランダム性がない場合、完璧な後手必勝ゲームだったはずなのに、先手のほうの勝率が上回るケースが散見される（10 ケース中 3 ケースで、勝率自体は 8 割前後）。
今回は時間の都合から 10 ケースしか検討していないが、これが 100 ケース、1000 ケースとなれば、自ずと一定の値に収斂するだろう。

Winning rate for AI 01 = 17.919999999999998 %
Winning rate for AI 02 = 82.08 %

Winning rate for AI 01 = 84.86 %
Winning rate for AI 02 = 15.14 %

Winning rate for AI 01 = 13.950000000000001 %
Winning rate for AI 02 = 86.05000000000001 %

Winning rate for AI 01 = 19.31 %
Winning rate for AI 02 = 80.69 %

Winning rate for AI 01 = 17.41 %
Winning rate for AI 02 = 82.59 %

Winning rate for AI 01 = 16.939999999999998 %
Winning rate for AI 02 = 83.06 %

Winning rate for AI 01 = 83.1 %
Winning rate for AI 02 = 16.900000000000002 %

Winning rate for AI 01 = 85.69 %
Winning rate for AI 02 = 14.31 %

Winning rate for AI 01 = 10.61 %
Winning rate for AI 02 = 89.39 %

Winning rate for AI 01 = 20.06 %
Winning rate for AI 02 = 79.94 %

これは極度に単純化されたモデル（形式化）によるシミュレーション実験に過ぎない。

でも、どうも私たちが人生を通じて行っている『ゲーム（交渉や取引の積み重ね）』は、構造問題として不平等な結果をもたらすように無自覚に built-in されているのでは？

その構造欠陥に気付けたならば、さあ、これからどうすべきか。

格差や差別が不当であるならば、どういうアクションを取って、『わたしたち』の構造欠陥を補うべきか。そんなことを考えたほうがいい時代が来ている気がする。

まさに『勝負は時の運』、たかが運次第の結果の蓄積に過ぎない——塵も積もれば山となる——。

その程度のことに、人生のほとんどを左右されて良いのだろうか？

それが『多様性のある社会』なのだろうか？

そんなことを夢想した。

追記：（親友の助言を承けて）

『貴方が実力だと勘違いしている才覚の差と結果としての莫大な富は、ほとんどすべて初期の運次第で決まっています』と謂ったときに、ピーター・ティールやポール・グレアムに代表されるごく一部の人々は権威主義という名の選民主義を選びつづけられるのか？

わたしたちはなんで、こんなに格差の拡大した世の中を生きなければならないんだろうね、その論拠はあるのだろうか？というお話でした——。

この記事が気に入ったらサポートをしてみませんか？