見出し画像

[和訳]データ分析がいかにサッカーの移籍市場で役立つか(いるだけでスペースを生む男メッシ)

こんにちは。ツイッターでこんなつぶやきを見ました。

出しました。

変なところがあったら指摘いただけるとありがたいです。少し長いですが目次を見て興味のあるところだけでもお付き合いください。

元記事が↓コレ

"How data analysis helps football clubs make better signings":
「データ分析がいかにサッカーチームの契約に役立つか」

目次

− データ分析の新たな次元
− サッカーの進化:データゲームとして
    - 1.イベントデータとともに始まった「サッカー分析」時代
    - 2.データ収集力の勝利:ゴール期待値
− データ分析は移籍市場を変える
− より良い評価のために
  − ゴースティング:「あの選手なら何をしただろう」を予測
− まとめ

以下訳文

データ分析の新たな次元

「ネクストレベルツール」はチームを勝利に導ける選手を特定する。

そんなツールの完成は不可能だと言われていました。流動的かつカオスすぎるサッカーの試合では不可能だと、選手の動きも複雑過ぎてトラッキングをすることはできないと。しかし、バスケをはじめとするスポーツ界が統計を取り入れてから数十年、サッカーの世界もデータゲームを始めようとしています。

サッカーの進化:データゲームとして

長年の間待たれていたスポーツのデータ革命の中心となっているのは、
サッカー分析会社StatsBombの共同創業者でCEOであるTed Knutson。

彼は以下のように語ります。

かつてサッカーのデータ分析は複雑で流動的すぎると言われていました。
しかし、近年はこんなことはあまり言われなくなりました。

スポーツ界で数字を扱うこと自体は珍しくありません。長年にわたって解説者はあらゆることを数字で表すように努力しています。連勝数から一試合での最大クロス数にいたるまで様々です。

しかしここ10年ほどで、より科学的な分析手法が現れました。それは試合結果だけでなく、才能発掘(スカウト)のアプローチも変えるのです。

1.「サッカー分析」時代の幕開け:イベントデータ

「サッカー分析時代」はイベントデータとともに始まりました。イベントデータとはボールに関する記録だけをとったデータです。(訳者注:パス、シュートなどボールに対するアクションが起きたときのみ記録する)2006年に、ロンドンを拠点とするオプタ・スポーツがあらゆるパス、シュート、タックル、ドリブルの起きた時間と場所を記録していました。今日、オプタが扱う試合は1試合あたり大体2000のデータポイント(記録)を持っています。

2.データ収集力の勝利:ゴール期待値

次に実現したのが「ゴール期待値」。シュートが決まる確率を、ゴールからの距離、角度(注:など)から計算するシステムです。

(注:ゴール期待値はフットボリスタをはじめとして注目する媒体が増えています↓)

この考え方が日の目を見たのは2017年、プレミアリーグ解説番組である『マッチ・オブ・ザ・デイ』で紹介されたことにより分析のメインストリームとなりました。

データが移籍市場に与える影響

選手レベルのデータが増えたことによる影響を最も受けているのが移籍市場です。

選手の統計データをみれば、グラウンドに行かずともチームが狙いとする理想の選手リストを簡単に作る事ができます。(注:現場で見ることの是非はありますが)それにより、チームのスカウトは時間とお金を節約することができます。

リクルートの舞台で活躍するのがデータを駆使するサッカーコンサルの21st Club。(注:21st Clubがあるイングランドのプレミアリーグをはじめとして欧州の1部リーグは大体20チームなので「21番目のチーム」って感じですかね。「12番目の選手」的な。)

彼らはピッチ上での選手のアクションチームのパフォーマンスレベルの関係性の時間変化を計算、選手を評価し、コンサルしていきます。チームはデータを使って、選手がチームを強くしているのか、弱くしているのか、どちらでもないのかを見ていくのです。

今年のはじめ、21st Clubは東ヨーロッパのあるクラブに、将来性有望な新しい選手をひとり推薦しました。その選手はクラブが持つ「ほしい選手リスト」の20名の平均よりも25%低い給料をもらっていたのです。一方、21st Clubの選手評価モデルは、彼が選手リストのうち95%の選手よりもよい給料をもらうべきと判断しました。

データを賢く使えばパワーを生み出せる
いままで選手がいた市場には選手にもクラブにもスカウトをするリソースがありませんでした。しかし、データを使うことで、簡単に特定の選手に注目することができます。

21st Clubの「Head of football intelligence」Omar Chaudhuri(注:企業の最高技術責任者のようなことだと思う)は上のように語りました。

データはどのように移籍市場を変えるのか

データによって生まれたモデルはどのように伝統的な選手リストアップの方法を変えることができるでしょうか。

(注:写真、原文サイトより)

データに注目するといっても文脈は依然として大事です。例えば、スペースがあるときと相手選手に囲まれたときで同じ選択をする選手はいません。そこで、StatsBombではある選手がパスをする際にプレッシャーを受けているかを評価することにしました。ほかにもStatsbombは、シュートの際にGKとゴールの間にいるDFの位置を記録します。(注:この辺の話もゴール期待値につながっています)

オプタCEOのKnutson曰く、「今必要となるのは何が試合中に最も大事なスキルになるのかを評価する複雑なモデルを作ること」。

StatsBombはパスの難しさ(プレッシャーのかかり具合)とパス総数を分析に使っています。

より良い評価のために

優秀なクラブの購入パターンは、適切な選手を少なく買うことです。そのときにデータ分析のツールはインパクトを持つでしょう。

Knutson:「リバプールは優秀なクラブの良い一例です。しかしマンチェスター・シティも、もはや片っ端からお金でFWを集めるチームではありません。デ・ブルイネ、スターリング、サネと立て続けに契約し、それらは毎回(データの上で)最高な選択でした。」

テクニカルスタッフにとって、新たな技術はコーチやスカウトの仕事をより良く・速く・賢くしてくれます。

FCバルセロナのデータアナリスト、ハビエル・フェルナンデスは「コーチから受ける最も興味深い質問は、データがカバーしていないものなんだ。(注:カバー「できない」じゃないのがミソなきがする)コーチはスペースを作るとか、スペースに入るとか、『スペース』について話すんだ。だから我々はもっと粒度の小さい(細かい)方法でピッチ上のスペースを理解する必要があったんだ」と語ります。

フィギュアスケート選手じゃないよ(いい選手)

バルセロナのデータサイエンティストは、メッシは他の選手が走ることで得るスペースよりも多くのスペースをジョギング・歩き・立ち止まる事によって生み出していることを発見しました。(注:ここでのスペースの定義を知りたい)

ゴースティング:「あの選手なら何をしただろう」を予測

最先端の研究において、データサイエンティストはゴースティングと呼ばれる技術を開発しました。これは、あるシチュエーションで選手が最もするであろうプレーを予測するアルゴリズムです。

(注:ディズニーリサーチによるゴースティングの研究、アカデミックに興味のある人は論文を、そうじゃない人も動画は面白いのでおすすめ)


たとえば30秒で相手の守備を崩すような、そんな特定のシナリオを見つけることができます。その30秒間のシナリオこそが、つぎのトレーニングでフォーカスすべき内容となります。
(Paul Power 分析会社 STATSのAIサイエンティスト)

(注:GIFが貼れないので記事内URLで)

まとめ

繰り返しになりますが、これらの技術は選手のリクルートにおいて大きな価値を持ちます。

選手の動きのモデルはチームのプレースタイルという形にまとめることができます。するとスカウトは自分のチームに似たスタイルを持った選手に狙いを絞ることができ、そのような選手からは戦術理解が保証されます。

「獲りたい選手が自分のチームでどのように振る舞うか」をゴースティングを使ってシミュレーションすることもできます。それも、勝ち点に与える影響のような抽象的なものだけではなく、特定のプレーをチームが成功させる確率にも影響を与えます。

20年前は、データが価値を持つにはサッカーは流動的すぎることを示す例もありました。しかし技術の進歩がそれらをぶち壊したのです。

「見せかけの距離計測」から「対戦相手の次のプレーを予測するツール」へ進化を遂げたトラッキングデータ、この進化は美しいサッカーの試合にふさわしいデータの生態系を作り上げました。

訳文以上

サムネイルにボロノイ図があったのに、その説明がほとんど無かったのが残念。もう少し深いところまで行ってほしかったけど、FINANCIAL TIMESに載ってる記事だしこれくらいのわかりやすい記事のほうがいいのかもしれない。ゴースティングは興味あるけどほんとにデータ持ってないと実装とかできない。

日本のスポーツデータ扱ってる会社さん、せっかくデータあるんならこういう研究にお金回してもいいと思うんだけどね。

ありがとうございます。