見出し画像

Bリーグ2018-19シーズンの予測をやっていました:レギュラーシーズン振り返り編

ここ数年,Twitterでライフワーク的に毎週月曜(できるときは試合があった水曜日の翌日にも)にBリーグの予測を公開してきました.予測したからには答えあわせが必要であろう,ということで,振り返りです.

#予想して振り返らない記事が多いですよね

どんな方法で予測していたの?

予測方法はJリーグの記事(下記リンク)とほぼ同じなのですが,self-containedな記事にするため同じ内容を示します.(あと,時系列的にはBリーグのほうを先に工作して公開していました)

予測方法は,非常に大まかに言うと,

1. 各チームに強さを表すパラメータ(レーティングと呼んでいます)が1個だけあるとする.

2. 対戦チームのレーティング差が,試合での得点割合を説明するようにがんばってパラメータを調節する.これを毎週行う.

 * 数学の言葉で言うと「ロジスティック回帰モデル」を利用しています.

 *「得点割合」は,(ホームチームの得点)/ホームチームの得点 + アウェイチームの得点)です.

3. 過去の対戦での試合直前のレーティング差と勝ち分け負けの関係を,統計的に見つける←これが確率を予測するモデルになる.

2.では,今シーズン行われた全ての試合結果に基づいてレーティングを算出します.

3. では,2016-17シーズン,2017-18シーズンの全試合について集計したものを利用します.B1とB2ではデータを分けています.

予測結果とその評価

予測は6節以降を対象としました.各チーム10試合を消化した後です.評価指標は以下の3つとしました.

・予測精度(accuracy):予測が正しかった(=レーティング値が高いチームが勝った)割合.0から1の間の値で,1に近いほど良い.

・対数損失(log loss):予測の正誤に対して重みをつけた評価.0以上の値で,0に近いほど良い.1はでたらめな評価と同等.

・較正(calibration):有利と評価されたチームについて,「予測勝率の和」/「実際の勝利数」.0以上の値で,1より大きいと上位を過大評価(上位はもっと弱いはずだ!),1より小さいと上位を過小評価(上位はもっと強いはずだ!).

予測結果を示します.まずは節別の動向.B1,B2の順に示します.

横軸は節,縦軸は精度と対数損失です.青実線と赤点線はそれぞれ節毎,通算の値を示しています.較正はこの図では示していません.

B1ではシーズン経過につれて精度,対数損失ともに改善傾向にあります.特に最終36節は18試合中17試合が予測が正解,外れた1試合も1点差という結果でした.最終的な予測精度は約72%で,過去2シーズン同様の手法で予測した結果とほぼ同等です.

B2はそこまで極端ではありませんでした(シーズン終盤での上位チームの取りこぼしがB1より多い).仮説ではありますがポストシーズンに関わるチーム数の違いや選手の技術の安定度・再現性などが原因として考えられます.

次に,予測勝率と実勝率の関係を示します.

横軸は予測勝率,縦軸は順に実勝率(割合)と頻度(回数)をそれぞれ示しています.横軸は0.1刻みでその予測勝率だった試合の実際の結果を示しています.

どちらも理想的な結果(黒点線)に近い結果ですが,B1は較正が1より小さく上位を過小評価傾向,B2は逆に上位を過大評価傾向にあります.ただ,どちらも言えるのは,「提案手法で6割勝ちそうだなという試合はやっぱり6割くらいの勝率である」ということです.

今シーズンも淡々と予測を続けてレギュラーシーズン完走しました.チャンピオンシップの予測もツイッターで公開しておりますので,ご興味のある方はぜひ.ポストシーズン終了後,答え合わせも公開の予定です!


この記事が参加している募集

Bリーグ

この記事が気に入ったらサポートをしてみませんか?