見出し画像

【日記】息子超え4-精神的に有意ではない-

■ すいせんすいじゃく

 息子が3月から挑んできた「すいせんすいじゃく」という謎のトランプゲームについての攻略法を探る「息子超え」シリーズ、4月の投稿から5ヶ月が経過した今でもひそかに父の挑戦は続いている。

 これまでの格闘の歴史については以下のマガジンにまとめたので、時間に余裕がある方はご覧になって欲しい。主に今年の3~4月の内容のようだ。

■ サンプル数の増加

 以前の記事で紹介した戦績は、3月から4月の61戦の成績だったが、それから時間が経過し、少し頻度は減ったものも着々と回数を重ねており、先日息子が4歳となったこともあり、これを機にアップデートすることにした。

画像1


 9月22日までの結果をアップデートしたものがこちらである。棒グラフの時系列で青くなっている取り組み(14ペア以上の獲得)が父が勝利した回である。ご覧の通り、中心付近の60戦以降、父の勝率が劇的に上がっていることが分かるだろう。戦績も父の36勝85敗と、3割の大台に乗り、首位打者のタイトルが狙えそうなポジションに来ている。前回が2割5分だったことからすれば大幅な打率改善となっている。

スライド1


■ 平均獲得ペア数

 次に1試合当たりの平均獲得ペア数を見てみよう。このすいせんすいじゃくというゲームは54枚、27ペアを取り合うゲームのため、14ペアを取った方が勝ちである。

 結果を見てみると、父が11.9ペア、息子が15.1ペアとなり、僅差ではあるが息子の方が多い結果となっている。

スライド2


 ちなみに前回4月に比較した結果も偶然父が11.9ペア、息子が15.1ペアとなっており、その差は全く縮まって…いや、そんなはずはない。

スライド7


■ 「サンプルサイズが大きすぎると良くない」問題

 最近統計の界隈で「サンプルサイズが大きすぎると良くない」という問題が話題になった。発端は以下のnoteだと思うが、要するに「統計的に有意な差があるかどうかの指標となるp値はサンプル数の影響を受けるため、少ないサンプル数では差が無いと判断された問題でもサンプル数が大きくなれば有意と判断されることがある」という問題に対してどう解釈するか、という問題のようだ。

 可愛い見た目でゴリゴリのベイズ統計などを解説してくれているバーチャルYouTuberのアリシアさんもこの問題について触れており、「統計的に有意であることと実務的に有意であることは別の問題」と捉えている。

■ 精神的に有意ではない

 p値は5%という数字が基準として用いられるようで、今回の平均値の差の検定ではp値が6.93x10^-13という数字が出ている。解釈としては、

父と息子の獲得ペア数に差が無いと仮定した場合に、
この結果のような平均値の差が観測される確率は0.0000000000693%である

という解釈になるようだ。ふぅーーーん。つまり差があるというわけね。

 ただこの検定は「平均値に差があるかどうか」という一点のみを判定するもので、どちらが強いかについての判定は行われていない。たとえ平均値で父のペア数が低くても、父の方が強いという仮説が統計的に棄却されたわけではない。「父と息子の平均獲得ペア数に有意な差がある」とだけ判定された結果なのだ。どちらが強いという判定はまだ行われていない。

 現に前回から勝率が上がっているではないか。前回が61戦で勝率25%、今回が121戦で勝率30%なのだ。この調子でいけば360戦前後で勝率が5割を超えて父が息子よりも強いという事が証明されるではないか。そんな統計的に有意だとか何とか知ったこっちゃない。説得力の無い数字を並べて難癖をつけられても俺は騙されんぞ。諦めなければ試合は終了しないのだ。

画像5


 父の挑戦はまだまだ続く。

この記事が気に入ったらサポートをしてみませんか?