NBA統計学 / あるいはNBA物理学 -1

架空の2人選手が、それぞれ5試合に出場したとします。その平均成績は次のようなものでした。

なるほど、2人は全く同じ平均得点、シュート成功率です。それでは、2人のオフェンス安定感/信頼度は同じなのでしょうか?

安定感がある/信頼度が高いとはおそらく「平均得点10点の選手がいつも10点取ってくれること」ではないでしょうか。平均得点10点なのに5試合連続0点だとか、そういった場合は安定感がない/信頼度は低いと言えそうです。「いやいや、平均点が同じなんだから安定感も同じでしょう」と感じるでしょうか?

実は、2人の試合ごとの成績は次のようなものでした。

いかがでしょうか。試合ごとで考えると2人はまっっっったく違っています。得点数を見てください。選手Aは8-12点の幅で収まっているのに対し、選手Bは0-30点もふり幅があります。シュート成功率はどうでしょうか。選手Aだいたい40-60%の範囲ですが、選手Bは0-75%の範囲で乱降下急上昇しています。それでもこの二人は、平均で考えると全く同じ値です(黒枠)。実は平均値は、対象の姿を正しく表しているとは限らないのです。

# 平均値によって真の姿がとらえられない問題は、例えば社会科学の領域でよく見られる。平均年収とか、平均所得とか、平均貯金額とか。余白も多くないし僕はその道の専門ではないので割愛。

さてそれでは結局、2人のうちより「安定感」があるのはどちらだと言えるでしょうか?直観的にはおそらくAでしょう。当然です。選手Bは得点のふり幅が大きすぎます。まさに「調子に波がある」感じです。「爆発力がある」と言ってしまえばそれまでですが、調子の波があまりに大きい選手は信頼できる得点源とは言えません。魅力的ではあるかもしれません。

# 「平均25点だけど18-38点を行き来する」みたいな選手は、不安定ではあるけれどオフェンス力はあるしめちゃくちゃ頼りになるといえそうなので「安定感がない=悪いこと」とは限らない。ここで議論したいのは、平均得点がどれくらい信頼できるか/直観とあっているか、ということ。

直観的には選手Aの方が安定感がある。でも平均値では安定感は表現できない。こういった場合に活躍するのが「中央値」という指標です。

中央値とは、ザックリいうと「大きい順に並べてちょうど真ん中の数値」です。どういうことか、先の例で見てみましょう。

選手Aの得点数は、試合順に 10, 12, 10, 8, 10 でした。これを大きい順に並び替えると 12, 10, 10, 10, 8 です。全部で5個数字があるので、真ん中というと大きい頬から3番目(小さい方から3番目)の数字ですね。つまり選手Aの得点の中央値は10点です。

選手Bはどうでしょうか。得点数を大きい順に並べると 30, 16, 4, 0, 0 です。中央値は左右から数えて3番目、つまり4点です。

平均得点は同じ2人でも、中央値では6点もの開きがあることが分かりました。そして選手Bは平均値と中央値の差が6点もあるのに対し、選手Aは平均値と中央値が同じ値です。言い換えると「選手Aの得点力(平均得点)は信頼できる」ということになるのではないでしょうか。安定感/信頼度を考えるためには、平均値と中央値のひらきに注目してみると良いのかもしれません。

# 統計学の世界ではむしろ、平均値よりも中央値、あるいはここでは話していない最頻値の方が注目度が高かったりします。平均値は「外れ値」の影響を受けやすいからです。先の例でいうと、選手Bは1試合だけあった30点という「外れ値」によって平均得点が引き上げられてしまっている。

# 先にちょっと触れた平均年収とかの話もそうで、平均とは必ずしも対象の全体の姿を、本来の姿を現したものじゃあないとされる。とんでもないお金持ちが一人でもいたら、全体の平均年収も吊り上がってしまう。なので例えば「貧困率」なんかは、平均ではなく中央値を基に求められている。詳しくは "貧困統計ホームページ" などを参照。平均値、中央値、そして最頻値という3つについての分かりやすい話はこれなどに書いてある。

残念ながら(?)公式サイトでは、というか僕の知る限りどのサイトにも選手の得点の中央値は載っていません。自分で計算することもできないでもないですが、いかんせん中央値を知るためにはその選手の全試合の得点データが必要なので、大変です。データ解析自体はそんなに大変じゃなくても、全試合分のデータを注目したい人数分とってくるのに手間がかかります。なんか全選手全試合の詳細なデータを一括ダウンロードできる仕様になってくんないかなあ…

という、@mid_note の愚痴で今回はおしまいにします。

# NBAのデータをサイエンティフィックに見つめる話はまた今度書く予定です。書くの楽しいから。

この記事が気に入ったらサポートをしてみませんか?