見出し画像

バスケのデータ分析オンライン講座第1回 ~スポーツアナリティクスの概要~

こんにちは。
以前、アメリカのバスケのデータ分析オンライン講座に申込みをしましたが、全8回の受講が終わったので、内容の振り返りや感想などを書いていこうと思います。

この記事は第1回の講座に関する内容になりますが、その前に講師の経歴を簡単に紹介します。

全8回のコースの講師はBen Alamarという方でした(LinkedIn)。
ESPNのDirector of Sports Analyticsや、Cleveland Cavaliers・Oklahoma City ThunderといったNBAチームのデータ分析部門などで勤められており、"Sports Analytics: A Guide for Coaches, Managers, and Other Decision Makersという本も執筆されています。
現場での取り組みなど、一般論から一歩踏み込んだ内容のお話が多く、全体的にとても学びになりました。

個人的にはコース説明でDean Oliver氏も講師として紹介されていて、彼の話も聞きたかったので、その点は少し残念でした。

ここからは第1回の講座に関する内容についてです。

スポーツアナリティクスの概要

最初はスポーツアナリティクスについての一般論の話でした。
大きく下記3つの観点から説明を受けたので、それぞれについて内容を書いていきます。

  • スポーツアナリティクスのメインゴール

  • スポーツアナリティクスの構成要素

  • スポーツアナリティクスの対象


スポーツアナリティクスのメインゴール

スポーツアナリティクスのゴールは主に下記の2つがあるとしています。

  • 時間の節約
    情報(数字だけでなくフィルムなども含む)の収集や分析にかかる時間を減らすことで、これらの仕組みを作ることでGMやコーチといった意思決定者に迅速かつ簡単に情報を提供することが一つのゴールであるとしています。

  • より良い情報の提供
    Advanced Metricsや将来の予測といった、これまででは見られなかった情報を提供するということで、具体例として大学の成績からNBAでどの程度活躍するか予測するなどを挙げています。


スポーツアナリティクスの構成要素

構成要素は主に下記の4つを挙げています

  • データマネジメント(Data Management)
    チームで保持している各種データを適切に集約して管理することを指しており、これによってデータへのアクセスや結びつけが容易となって良い意思決定に繋がると述べています。
    (チームの中にもトレーナーやコーチやスカウトなど、多種多様なスタッフがいて、彼らが個々でデータを持っていると他の人が参照できないのが問題になるとも述べています)

  • 予測的分析(Predictive Analysis)
    ある選手がスーパースターになるか標準的なレベルの選手になるかなどフィルムを見るだけでは気づけないような、データによる深い分析や洞察・予測を行うことを表しています。

  • 情報システム(Information System)
    各種データや分析・予測の結果に関して適切な情報共有システムを作ることを表しており、例えばGMがスマートフォンで獲得候補の選手のサラリー予測やチームへの貢献度の予測、それらを踏まえたサラリーの適正度合いなどを簡単に見られるようにすることなどが挙げられます。
    (※Basketball referenceは一つの優れた具体例であるとも述べています)

  • リーダーシップ
    こちらは少し毛色が異なり、上記の3つを推進するために必要な要素であり、分析で競争力をつけるにはリーダーのコミットやサポート・理解が不可欠であると述べています。

ここまでの話はビジネスでのデータ分析でも同様に必要なことで、どの領域でもデータ分析の基本的なところは変わらないんだなと感じました。
ちなみに、講師はOKCとCLEに勤めていましたが、OKCのGMであるサムプレスティとの仕事のほうがデータ分析での価値をより提供できたと述べていました。サムプレスティのGMとしての経歴を考えると、データも積極的に活用していそうで個人的に納得感があります笑


スポーツアナリティクスの対象

スポーツアナリティクスの対象としては下記の3つを挙げています

  • 自チーム
    主に自チームの選手のコンディション管理やPlayer Developmentが対象となります

  • 対戦相手
    相手に対して有利になるために、相手の長所短所やマッチアップなど色々な観点の分析を行います

  • 今後の潜在的な追加要素(Potential Additions)
    FAやドラフトや契約などの分析を指します


2008年OKCのドラフトの話

ここまで一般論の話が続いていたので、具体例についての話になりました。
その例は2008年のOKCのドラフトの話で、前年にKDをドラフトし、当年はウェストブルックをドラフトしたタイミングになります。
ここでは、講師が述べた当時の裏側とデータ分析の関わりを箇条書きで時系列に記載していきます

  • 前年にKDをドラフトしており、今後2~3年で戦えるチームを作るために必要な選手をピックしたい

  • スカウトはセンターのドラフトにフォーカスしており、特にブルック・ロペスを検討していた

  • プレスティはそのように考えておらず、データ分析をしてくれと依頼があった

  • 分析の結果、PGをピックするべきとの結論になった *1

  • それを踏まえてウェストブルックが良さそうとなったが、彼は大学でSGとしてプレイしており、NBAでPGとしてプレイできるかが不明瞭だった

    • ポジションごとの予測モデルはすでにあったが、SG→PGへのコンバートに関してはサンプル不足で使えなかった

    • スカウトのレポートだとハンドリングが怪しく、かつドラフト順位としては12~15位との予測で、4位指名するにはリスクがあった

  • そのため、ウェストブルックをピックするのが妥当かを判断するために、どういったデータが見るべきかを考える必要があった

  • その結果、正しいパスをできる能力を見たいということになり、その具体的な見方として、ウェストブルックからのパスを受けた選手のFG%が、他の選手の場合より高ければ正しいパスをできていると捉えることにした

    • もちろん、そのようなデータはその時点では存在しないので、映像を見て自分たちで集計を行った

    • ウェストブルックだけではなく、他のNBA選手の大学自体のデータも集めた(比較対象として)

  • その結果、ウェストブルックは上記の能力を備えているのでドラフトするという決断に至った

  • このような分析をしたことで、意思決定の際の不確実性を減らす(≠なくす)ことができた

一口にバスケのデータ分析と言っても、そこには様々な背景や制約やデータ以外の情報などがあり、それらを上手くやりくりして少しでも妥当な意思決定をしようという意思が伝わってきて、とても面白かったです。
ちなみにデータ収集はドラフトの5週間前から開始して、当時のインターンの子にも手伝ってもらったそうです。相当大変だったろうなと思います。

*1 また、センターよりPGをピックするべきとした分析ですが、まずKDがどのような選手になるかの予測を行い、その選手像に対してPGとセンターのどちらをペアにするかを分析したそうです
(具体的なやり方の話は残念ながら聞けませんでした)

不確実な状況での意思決定

続いて、不確実な状況での意思決定ということで、ドラフトに関する実際の例でディスカッションが行われました。
具体的には、ドラフト候補の選手についてGM・アシスタントGM・Analyticsのそれぞれでスターになる確率とバスト(期待外れ)になる確率を算出して表にまとめたものを踏まえて(下記)、最終的にどの選手をピックするべきかを議論しました。
※持っているドラフト順位では、25%がスターになり、15%がバストになるとしています。
※数値は比較に影響のない範囲で改変しています

参加者からも様々な意見があり、例えばBは三者の評価を総合的に見てバストになる確率が低いから選ぶべきだったり、CはAnalyticsでバストになる確率が一番低く、その中ではスターになる確率が高い(GM陣が適切な判断できるか分からない)などなど、面白い議論になっていました。
(A~Eの選手がそれぞれ誰だったのかも公表されましたが、それは参加者特権ということで秘めさせていただければとm(_ _)m)

そして、ここでの議論で様々な意見が出ましたが、そもそもが不確実な状況での意思決定であり、そのような状況で妥当な選択肢を選ぶのは難しいからこそ、データを中心として意思決定をしていく必要があると述べています(Data Centered Approach to Decision Making)。

具体的には、まず最初にベースとなる分析や予測のモデルを作成し、その上で実際の結果とずれていたら、なぜずれていたかの仮説を立てます。
(例えば、作ったモデルが特定のタイプの選手に偏った評価をしていないかなど)
そして、その仮説の中で妥当そうなものがあればモデルに盛り込んで検証をしたり、盛り込めない要素でもそういった仮説があるとの認識を持っていく必要があるとのことでした。

個人の見解ですが、データ分析の強みとして、分析や予測を行う際のモデルが定量的かつ検証可能な状態で残されていることがあると思います。
人の判断にも優れた面がありますが、なぜそのような判断に至ったのかが不明瞭だったり、ロジックはあるけど定性的な判断になっていることが多々あり、そうすると検証が行いづらくなってしまいます。
データ分析はその意味で、どんどん改善していくことが可能なアプローチであると言えるでしょう。

Data Centered Approachと似た概念としてData Drivenがありますが、講師の認識としては、後者はオンラインサービスなど多くのデータを抱えていて、しかもABテストなどで実験もできるのでData Drivenで良いが、スポーツアナリティクスではそういったことができないので、あくまでData Centeredにしてデータ以外の観点も盛り込んでいく必要があるとしています。
確かに、例えばドラフトは年で最大60人しかデータ数が確保できず、しかも彼らの評価ができるのも数年後と時間がかかる類のものなので、これを踏まえてピックする選手をデータのみで判断するのは相当難しいなと感じます


その他

好きな指標はあるかという質問への回答が興味深かったです。
お気に入りの指標はチームにいた時に開発した指標で、ある選手が自チームにとってどの程度価値がありそうか & リーグ全体にとってどの程度価値がありそうかを算出した指標だそうです。
これを使うことで、トレードの時にリーグ全体での価値に対して自チームでの価値が高い選手を見つけて効果的にトレードを進められるとのことでした。
必要があればチーム独自の指標を開発する点だったり、現場での課題感に紐づいた指標になっていたりという点がとても興味深かったです。


第1回の講義内容のまとめは以上になります。
第2回の講義内容はこちらです。

この講義に関する記事は下記マガジンでもまとめているのでぜひご覧ください

もしよければTwitterのフォローなどよろしくお願いいたします。


サポートしていただけるとありがたいですが、 SNS等で広めていただけるともっとありがたいです。 一緒にバスケを盛り上げていきましょう!