見出し画像

PJS Day6に向けてゆるい統計で予測してみる……?

MET進出の可能性をざっくり計算してみました。チームの獲得ポイントだけしか観ていないので、統計としてそこまでパワーがありません。手法や数値が間違っている可能性もあります。もっと冴えたやり方のアイデアがありましたら、ぜひご教授ください。

サンプル数重視で、Day 1 - 5通して統計を取っています。Phase2からの参戦組はあるだけのデータしか使っていません。

別のウィンドウで開く

Googleスプレッドシート
(↑は生のデータです。どこをどういう風に参照しているかが一応わかりますが、散らかしているのでわかりにくいです。この記事のために用意したものなので、更新はしません。獲得pt基準でのTOP3率や、ドン勝率、マップごとのポイントなどあります)

見たまんまの情報

『チーム名』、『総合pt』、『平均pt』があります。
『総合pt』はDay 5までの獲得ポイントです。
『平均pt』はDay 5までの獲得ポイントを、参加ラウンドで割った数値です。「Day5までの世界を繰り返すなら、各チームの獲得ポイントはこの数値に収まる」以上の意味はありません。Day 5までのチームの実力の指標です。

標準偏差

そのチームの各ラウンドの獲得ポイント(Season 3の今までの全ラウンド)が平均ポイントに対して、【どの程度ムラがあるか】という指標です。

「標準偏差が低い」チームには安定して平均に近いポイントを取ります。
「標準偏差が高い」チームは、安定性を欠くためコケる可能性があります。逆に、爆発する可能性もあります。
「高い平均ポイント」と「低い標準偏差」を両立しているチームは、「PUBGにおいて最強」です。

ボーダー***pt(**%)

【MET進出に必要なポイント】を10pt刻みで仮に設定しています。
右側(**%)は【そのボーダーになる可能性】を示しています。

ゲームが大きく荒れない限り、ボーダーは200~210ptに収まると私は見込んでいます。もちろん、表にはありませんが180ptや170ptといった、より低いボーダーになる可能性も一応ですがあります。

ここの計算方法は思いつきでやったので間違っている可能性もあります。もっともよくわからなくて自分でもモニョった部分です。ボーダー230pt超える可能性がちょっと高すぎるんじゃないかという気がしています。

算出方法は『トップのチームがボーダー以上のポイントを取る確率』『2番手のチームがボーダー以上のポイントを取る確率』『DGW以外のチームがトップにいる確率』を掛け合わせています。モニョ~~~~。

必要平均pt

【仮のボーダーに対して必要な平均ポイント】です。そのまんまです。高いほどキツいです。他のチームにボーダーを引き上げられるときつくなり、自分でボーダーを引き上げられるなら楽になるといった感じです。

達成可能性

そのチームが【仮のボーダーに到達できる確率】です。
標準正規分布表というものに基づいて、4ラウンドが終わったあとに求められている以上のポイントの獲得ができている確率を算出しました。

ボーダー190ptなら30%ほどの確率で2チームとも達成する可能性があります。可能性ってなんなんだ。

酷ですが、現時点で貯金の差が大きすぎるため、上位5チーム以外がボーダーを突破できる確率は『ほぼ0』です。
Phase2から参戦したSGが、低ボーダーの乱戦になった場合ちょっとだけMASに行ける可能性を持っているのは面白い事実です。ただ、SGはサンプル数が少ないせいで上振れが大きく響いているだけとも言えてしまいます。

結局この統計から読み取れた情報と反省

ざわざこの統計を取らなくても大半の人が肌感でわかることだと思いますが、上位の5チームにしかMET Asia Seriesに進出できる妥当な可能性が存在していません。

しかし、チームのポイント獲得期待値ってほぼ平均ポイントやん……?
標準偏差を導入したことで見えたことはありますが……。
ボーダーが低くなればなるほど、つまり乱戦になればなるほどCGXやRJといった標準偏差の小さい(ムラの少ない)チームの勝率が上が上昇します。
逆に、ボーダーが上がる、2位以下で突き抜けたチームが出てくるほどムラっけのあるチームの方が勝率が高くなるようです。ホンマか?
しかもこの差は膨大な試行回数を重ねて初めて顕著になるような微妙な差でしかありません。Day 6は1回しかないわけです。結局のところDGWがほぼ確定で、他はハート次第なんですよねー。

もうちょっといろいろなデータの取り扱い方を学ばないといけませんね。正直ErangelとMiramarでどれだけポイント取れてるか、みたいな単純なデータの方がストーリーは作りやすいです。自分は何のために統計を取るのか、っていう根本が抜け落ちた手遊びになってしまいました。反省。

獲得ポイントだけを見ての統計は今後取らないと思います。ラウンド中に獲得できるポイントには限りがあって高くなればなるほど伸ばすのが難しいし、そこらへんを占有率とあわせて計算すればもうちょっとなんとかなるかもしれないというアイデアが今浮かんでいますが。結局のところ、プレイヤーごとの生存時間の期待値や、生存時間あたりの獲得ポイントの期待値とかを出した方がデータを見せる上ではたぶん面白いでしょう。あとPythonの勉強始めました。

こちらでいただいたお金は純粋に記事を書く原動力となります。