見出し画像

【論文紹介】フォーメーションを自動で検知する【ブンデスリーガ】

1.はじめに

ポジションレスな可変フォーメーションが主流となる昨今のサッカー界ですが、その変化を自動で検知する手法を提案している「Large-Scale Analysis of Soccer Matches using Spatiotemporal Tracking Data」という論文を紹介したいと思います。この論文の2nd AuthorであるPatrick LuceyさんはSTATSのデータサイエンス部のディレクターで、世界のスポーツアナリティクスを引っ張っている1人でもあります。ちなみに以前紹介した論文「パス成功率って、そのままでいいの?」の著者にも入っていました。

2.データセット

今回扱うデータは試合中の選手の位置情報であるトラッキングデータです。評価実験では、Prozoneから収集されるドイツ ブンデスリーガ 1シーズン 全試合を用いています。また、学習を行う際には1チームの1試合の前半もしくは後半を1つのサンプルとします。

3.提案手法

トラッキングデータからフォーメーションを自動検知するアルゴリズムをこの論文では提案しています。キーポイントは役割分布の導入で、各時刻フレームにおいて各選手をフォーメーションの任意の役割(ポジション)に割り当てるという方法をとっています。この役割分布はペップのいう「自分のいる場所によって役割が決定する」ような現代サッカーの構造を、うまく数式によってモデル化していると言うことができるでしょう。

トラッキングデータは2次元のデータ(x,y)であるので、役割分布には2次元ガウス分布を用いており、モデル更新は直感的に「役割分布同士の重なりがなくなるよう」以下の図のように行われます。左から右に向かって更新が進んでおり、徐々に各役割分布を示すサークル同士の重なりが少なくなっていることが見てとれます。

(目的関数はKLダイバージェンス、更新ステップはK-Meansに似たEMアルゴリズムを採用しており、各選手はハンガリアン法により役割を付与される。また、各サンプルから得られる役割分布はWasserstein距離を元にした凝集型クラスタリングで、フォーメーションの各パターンに割り当てられる。)

4.実験結果と考察

まず、各クラスタに割り当てられた役割分布の平均位置を以下の図に示しています。攻撃方向は左から右に向かっていて、Cluster 1は4-2-3-1、Custer 2は4-4-2、Cluster 3は3-4-1-2、Cluster 4は4-1-4-1を表現していることがわかります。また、フォーメーションの認識精度もエキスパートがつけたラベルと比較して高い値(=75.33%)でした。

次に役割分布の導入の貢献を示している図が以下のFig. 8になっています。左(a)が各役割分布が割り当てられた位置、右(b)が各選手が割り当てられた役割を示す色付きの位置を示しています。4-4-2のフォーメーションのチームだと思いますが、例えば両SBはサイドハーフの役割を担うこともあることがみてとれます。(右(b)図で、LSBは緑と水色の、RSBはピンクと黄緑の役割に割り当てられている)逆にCBはほとんど役割が動かない(オレンジと赤)など、直感とあったモデル化ができているといえます。

この論文の手法を実装し、オープンソースのトラッキングデータを使った実験のまとめを次回は書きますので、ご期待ください〜

#アナリティクス #データ分析 #サッカー #スポーツ #ブンデスリーガ #論文紹介

この記事が気に入ったらサポートをしてみませんか?