見出し画像

楽しい?NBA Stats いじり

普段NBAに関する数字を使ってあれこれTweetしていますが、データを通したNBAの楽しみ方について丁寧に書いたことがなかったので、今回やってみます。「入門編」とか「手引き」とかそんな大仰なものではないですが、数字を使ってバスケを分析し何かを発見するまでの過程を示していきます。まあ、スタッツの楽しみ方、NBAの楽しみ方は人それぞれだし、これはあくまでmidnote流の楽しみ方です。

以下、データは全てNBA.com/Statsから引っ張ったもの、解析は統計ソフト "R" でやっています。

12/27(現地)の試合終了時点の得点ランキングTop5の選手は誰でしょうか?NBA.com/Stats などのサイトに行くと、平均得点が高い順に並んでたりするのですぐに分かります。ついでに比較対象として、RoseとRandle(12/28時点)のデータ載っけていきます。それがこれです。はい。

なるほどー。そういう感じか―。

ですがこういう風に、数字でポンと出されたんではあんまりピンとこない、ということもあります。そういう時はデータをグラフにしてみましょう。

平均得点(PTS)を「棒グラフ」にしてみます。棒グラフとは、ある一つの情報(データ)を棒の長さで表したものです。

グラフに直すことで、直観的に分かり易くなりました。全446選手中得点ランク86位のRandleと並べてこれなので、上位5人は相当なスコアラーですよね。

ですがしかし、同じ高得点だとしでも、シュートを20本撃って30点とったのと、30本撃って30点とったのとでは意味合いが全然違います。得点数とシュート試投数の関係が知りたいですね。

それでは、7人の平均シュート試投数(FGA)も同様のグラフにしてみましょう。こちら。

………。誰がどれくらいシュートを撃っているのか、このグラフからそれは分かります、ですがこれでは結局、得点数との関係は分かりません。

こういう時は「散布図」を使います。散布図とは、二つの情報を併せて示すことのできるグラフです。平均得点(PTS)とシュート試投数(FTA)を散布図にしてみましょう。こちら。

横方向に2枚目のFGA棒グラフを寝かせ、縦方向にPTS棒グラフを立たせたような、そんなイメージです。横方向がFGAの数を示し、縦方向がPTSの大小を表します。右に行くほどFGAが多く、上に行くほどPTSが多い、ということです。シュートをたくさん撃つ選手(右側に位置する選手)ほど得点が高い(上側に位置する)ことが分かりますね。当たり前?そうです当たり前です。こういったグラフを作る意義の一つは「当たり前から外れた選手を見つけること」なんです。Hardenがそれっぽいですね。同じぐらいの平均得点であるDeRozan, Davis, Cousinsと比べてFGAが3本くらい少ないですね。ふむ…。

先程のグラフに、7人の傾向を説明する青い線を描きいれてみました[*]。そこからボンヤリ広がっている薄いゾーンは「この範囲に収まるデータ点(今回は選手)は青い線で示した関係で説明できるよ~」と言うことです。統計学の用語で「信頼区間」と言います(ちなみに今回の場合は信頼区間95%、大雑把に言うと「95%の確率でこの範囲に収まるよ」ということです)。Hardenだけが傾向から明らかに外れていますね(Roseはちょっと怪しいけども)。

数字の羅列だけからは、こういった「特殊な選手」を見つけることは難しいです。グラフとして視覚化したことで、Hardenの特殊性が見えました。これがグラフによるStats視覚化の醍醐味だったりします。少なくとも、僕にとっては。

ところで、散布図を使うことで二つの情報を一度に示すことができましたが、こういったグラフを「2次元グラフ」と言ったりします。一度に扱える情報の数が「次元」の数です。なので今回はFGAとPTSの2次元です。最初に示した2つの棒グラフは、FGAとPTS1つずつしか情報を表せないので「1次元グラフ」ということになります。

さて。グラフによってHardenは得点のわりにシュートが少ないことが分かりました。その原因、というか要因について考えてみましょう。

………(¡Thinking Time!)………

まず思いついた仮説はこれです。

予想➀ Hardenは他の6選手と比べてシュート成功率(FG%)が高い

「成功率が高いなら少ないシュートでたくさん点を取れるだろう」というわけです。さてそれではこれが正しいのか、FG%とPTSの散布図で確認してみましょう。

あら~。Hardenは7人中下から2番目のFG%みたいですね。予想➀が外れました。それじゃあHardenの特殊性ってどこにあるんでしょうか…。

………(¡Thinking Time!)………

予想➁ Hardenは他の6選手と比べてフリースロー試投数が多い

FG%は高くないFGAが少ないけれどPTSが多い、ということは、シュート以外の得点、フリースロー得点が多いはずだ!という予想です。さてそれではどうなんでしょうか。FTA-PTSの散布図を書いてみましょう。

ほう。HardenはWestbrookに次いでFTAが多いですね。これは予想➁イケるんじゃないか。

…しかしちょっと待って下さい。縦方向がPTSですよね。思い出してください。HardenはDeRozan, Davis, Cousinsと比べてFGAが3本くらい少ないんですよ。それなのにHardenとCousins, Davisは、FTAはほとんど同じです。得点数はFTは1本決めても1点しか入らないので、これではそのシュート試投数の少なさと得点数のいびつな関係を説明できないような気がします。

試しにFGA+FTA/2とPTSの関係を見てみましょう。ここでFTAを2でわったのは、シューティング・ファールでFTをもらったとすると、逆算するとFT2本あたり1本のシュートを撃っていることになるからです。さあ!どうだ!


あー、これでもやっぱり、Hardenは全体の傾向からは外れるみたいですね。そうか…。

あら~。

ということで、FTAによってもHardenのFGAの少なさを説明するには至りませんでした。とするとつまり…。

………(¡Thinking Time!)………

予想③ Hardenは他の6選手と比べて3Pシュートによる得点が多い

1回のシュートで3点入ることを考えると、なかなか妥当な線を行ってそうですよね。行ってそうですよね?

それでは7選手の、3Pシュートの平均試投数(3PA)を棒グラフで見てみましょう。

おおおお~。やっぱりHardenはずば抜けて3PAが多いですね…。予想③の可能性が高いなこれは…。

3Pシュートは2Pシュートの1.5倍の得点ができますよね。当然ながら。なので試しに、3PAを1.5倍してみましょう。大雑把に言うと「3PAを2PAに変換した」ことになります。もしこれでHardenの「得点に対してFGAが少ない」が消えるならば、傾向の原因は原因(要因)は3PAの多さにあったと言えそうです。それでは2Pシュート基準のFGA(2P based FGA)とPTSの関係を見てみましょう。

おおおおおおおおお、良いんじゃないのこれ。Hardenがちゃんと全体の傾向に乗りました。「3PAを2PAに変換したところ、Hardenの特殊性が消えた」ので、逆算により「Hardenの特殊性は3PAの多さにあった」と言えそうですね。やったー。予想➀の結果、Hardenは意外と(?)FG%が低い、というのも、この3PAの多さに依る部分があるかもしれませんね。

さあこれで、Hardenのスコアリングの仕組みが解き明かされました。しかしグラフからは、更なる疑問が湧いてきます。

例えばRose。上のグラフでは、ボンヤリ区間の境界線に位置しています。Roseの場合、得点数のわりにFGAが多い、という可能性があります。これはなぜでしょうか。

例えばDavis。上のグラフでは、Hardenが範囲内に収まった代わりに彼が範囲外へ出ています。3PAを加味するとむしろ特殊になってしまうということです。これはどういうことでしょうか。

などなど、数字、そしてグラフから見えてくる不思議はキリがないです。ゴールが見えない。だからこそおもしろいです。

ということで、数字/グラフを使ってNBAを楽しむ/分析する流れを示してみました。

………もう疲れたので唐突に終わります。代わりにこれどうぞ。

それではまた次回。

[*] 統計ソフトウェア "R" に実装されている線形フィッティング関数 "lm" を使用

この記事が気に入ったらサポートをしてみませんか?