見出し画像

【論文紹介】イベントデータから守備力をマップ化する【プレミアリーグ】

1. はじめに

チームの特徴をデータから導く上で、現在はシーズン全体・1試合の統計的なスタッツ(ゴール数、走行距離、ポゼッション率)を用いることが多いと思います。しかしながら、現状の評価方法ではサッカーというスポーツが持つ時空間的な情報を捉え切れているとは言えません。そこで、本論文ではロケーションの情報を持つイベントデータをモデリングし、チームの攻守における特徴を空間的にマップ化する手法を提案します。この手法を使うことで、以下のようなヒートマップに似た分析結果を得ることができます。上段が守備力(ボール奪取力)、下段が攻撃力(ボール保持力)で、青いところがその値が大きく、逆に赤いところは小さいという可視化方法になっています。

論文中ではバーンリー、シティ、サンダーランドの3チームの攻守全てにおいて分析・考察結果が記述されていました。(2014/15シーズン)

バーンリー
19位でシーズンを終えたバーンリーは、総得点がリーグ平均より20点少ない28と攻撃に難を抱えていました。下段の攻撃力マップの赤い領域が広いことからボール保持に欠点があり、特に敵陣侵入後にボールを失う可能性が高くなっていたことが分かります。上段の守備力マップからはミドルゾーン中央とアタッキングゾーンの左側に青い領域があることが見てとれます。ここにはジョーンズとイングスという能力の高い選手が位置しており、彼らのところがボール奪取することの多かったエリアということも裏付けることができます。

シティ
優勝したチェルシーを超える得点を叩き出した13/14シーズンのシティは他のチームにはない攻撃力マップを示しました。その特徴はアタッキングゾーンでのボール保持力で、アグエロの得意なエリアである左ペナ角(濃い青)が突出していました。しかしながら、自陣ペナ付近に薄く赤い領域があるように、ビルドアップでのボールロストが多いことが分かります。対戦相手のアナリストはこれを見て「シティにはハイプレッシング!」と戦略を立案することができます。実際に、ストークはこのシティ相手にハイプレッシングで勝利をおさめたようです。

サンダーランド
リーグ平均より200本多い400本ものシュートを打たれたサンダーランドは上段の守備力マップから自陣での守備に弱点があったことが分かります。しかしながら一旦ボールを奪えば、他のチームと同様のボール保持力を見せてもいます(下段の攻撃力マップが全体的に白いことから)。

マップの活用方法
上図のようなマップを使うことで、チームのアナリストは次の対戦相手の攻守における特徴を場所とともに把握することができます。攻撃力マップからはボール保持 / ロストの場所的な傾向を、守備力マップからはどこでプレッシング / リトリートしているのか確認可能です。論文に示している可視化結果はシーズン全体のものになっていますが、過去数試合のみの情報が欲しい場合にも対応しています。

2. データセット

Prozone社から提供された2012/13~2014/15シーズン プレミアリーグの場所付きイベントデータ(パスの成功 / 失敗等)です。

3. 提案手法

各クラブの攻守における特徴をマップ化するために、本論文では一般化線形モデル(GLM)のランダム項を2次元ガウス過程で拡張した、式(1)で表現されるGeneralized Linear Spatial Regression(GLSR)モデルを使用します。

・目的変数 Y_i(s_i) : 各イベント(タックル、パス、ボールタッチ等)でボール保持チームが変わったか否かを示す2値変数
・説明変数 s_i : イベントが発生した位置情報 (x, y)
・説明変数 X_i^{Atk} : イベントiでのボール保持チームを示すベクトル
・説明変数 X_i^{Def} : イベントiでのボール非保持チームを示すベクトル
・回帰係数 β^{Atk} : ボール保持力
・回帰係数 β^{Def} : ボール奪取力
・ガウス過程 Z(s_i) : 攻守の特徴をマップ化するためのモデル

ガウス過程については、2019年3月出版予定の『ガウス過程と機械学習』のβ版を参照ください。(ソースコードもあって、理解しやすいと思います)

4. 実験結果(ポチェッティーノ効果)

まずはじめにプレミア全クラブの2012/13~2014/15シーズンの攻守における特徴(回帰係数 β^{Atk} = 縦軸、β^{Def} = 横軸)を以下の図に示します。ビッククラブの特徴がシーズンごとにあまり変化していないことと比べて、残留を目指すクラブには変化が見られます。ストーク・シティの変化が最も顕著で、左下(ボールをあまり持てない)から右上(ポゼッションを軸とする)にその立ち位置を変えていることがわかります。これは、マーク・ヒューズのチーム変革を反映しており、提案手法は攻守の特徴を正確に捉えられていると言えます。

また、チームのプレイモデルは指揮する監督の哲学によっても変化します。その影響を提案手法がうまく吸収している例として、13/14サウサンプトンと14/15トッテナムが挙げられていました。これはハイプレッシングを志向するポチェッティーノが指揮していたクラブで、彼の効果を示していると言えます。その両クラブの2シーズンの守備マップが以下になっており、ポチェッティーノが率いたシーズン(顔が載っている図)はどちらもマップ全体でボール奪取力が高いという結果になりました。このようにして、提案手法は監督の志向するプレーモデルを理解する助けにもなります。

5. 考察

この論文の貢献はスタッツデータ(統計値)からは見てとることのできない空間的な攻守の特徴をマップ化することでした。選手位置のヒートマップや左・中央・右の攻撃回数などの分析結果はよく見ると思いますが、ボール奪取 / 保持をモデリングしマップ化している提案手法の価値は大いにあると考えています。また、1. はじめに「マップの活用方法」のようにこのツールをアナリストがどう使っていくか言及していたところが、この論文いいなぁ〜と思いました。分析してハイ終わり!ではないので。サッカーの分析ツールを作る上で、その目的(チームを強くする!選手の理解をサポートする!)を見失わないようにしたいです。

#アナリティクス #データ分析 #サッカー #スポーツ #論文紹介

この記事が気に入ったらサポートをしてみませんか?