見出し画像

【論文紹介】類似したプレイをトラッキングデータから検索する【スポーツ】

1. はじめに

トラッキングデータの収集が盛んになったことによって、そのスポーツデータの効果的な処理方法やカテゴライズされたプレイへのアクセスなどに注目が集まっています。そこで、今回は「Chalkboarding: A New Spatiotemporal Query Paradigm for
Sports Play Retrieval」
という論文を紹介させていただきます。この論文の貢献をApple風にまとめるなら、"試合中の気になったシーンを入力すれば、過去の試合から類似したプレイを検索することができます。Chalkboardingならタグなしのトラッキングデータのみでね。"といったところでしょうか。

今回はデータ解析技術の新規性はあまり見られなかったので、はじめに論文で提案されたプレイ検索ツールの紹介を行ったのちに、具体的な手法の説明と評価実験について述べたいと思います。ですので、データ処理技術の具体的な部分に興味がある方のみ、3章以降に目を通していただければと思います。

2. ツールの紹介

どのようにして、このプレイ検索ツールを使うのか。そして何が得られるのかというところから紹介してみたいと思います。上の図(a)が従来手法で、気になるキーワードを入力すれば、タグ付けされたデータベースから類似したプレイを表示することができます。タグ付けする人によってその定義が異なったり、人的負荷があるため、データのみから検索できる方が望ましいと言えます。

図(b)が本論文におけるツールのGUIになっていて、(B1)で検索したいプレイのトラッキングデータを選択or描画すれば、既存手法と比べて"高速に"、"効果的に"(B2)のような類似プレイをランキング形式で表示することができます。

この論文ではバスケットボールのデータを用いて実験を行なっています。サッカーに置き換えるならば、先日の日本×オマーン前半に起きたネガトラのシーンを1つ検索クエリ(B1)に入力すると、(B2)へ過去の日本が受けてきたロングカウンターがでてきるようなイメージになります。検索データベースには他国のデータもあるのに、日本のネガトラばかりが出てくるのは切ない気もしますが、データアナリストの方は非常に助かることでしょう。

3. 具体的な手法の説明

具体的な手法を説明するにあたって、こちらでは3.1 プレイ検索データベースの構築3.2 入力クエリの種類と検索方法 の2つの節に分割したいと思います。

3.1 プレイ検索データベースの構築
こちらでは、事前に与えられたトラッキングデータを用いてプレイ検索のためのデータベースの構築方法について説明します。最もnaiveな方法としては、全プレイのデータを保存しておいて、入力クエリとのマッチングにより類似プレイのマッチングを測るといった方法が浮かぶと思います。しかしながら、そのマッチングにおいて莫大な計算資源と処理時間がかかるのも同時に考えられます。したがって、"高速に"処理のできる、"効果的な"検索データベースの構築が求められます。本論文では、各時刻ごとに各選手へポジションを割り当てる"役割分布"をプレイごとに導出しておいて、それらをクラスタリングにより階層的なデータベースにすることで、上記2点の課題を克服します。(役割分布の計算方法については、以下のnoteを参照ください)

3.2 入力クエリの種類と検索方法
3.1節で構築されたデータベースを用いて、対象となるシーンの類似プレイをどのように検索するかをこちらでは説明します。まず、入力クエリとしてはA. 試合中のプレイの例、B. 試合中のプレイの例から、検索対象となる選手を複数選ぶ、C. ユーザーが選手の軌道を自ら描画する、の3種類を用意しています。

それらの入力クエリが与えられたときに、以下の3つの処理を経て、類似プレイのランキングと検索を行います。

1. 入力クエリと検索データベースの各クラスタのボールの軌道の距離を計算し、最も類似しているクラスタのインデックスを得る ((a)~(c))
2. 1.で得られたインデックスに紐づくクラスタに割り当てられているプレイと、入力クエリのトラッキングデータの類似度を役割分布を用いて計算する (d) 
3. 2.で得られた類似度をK近傍法によりランキングして、類似プレイとして上位K個を表示する (e)

4. 評価実験

こういったツールの評価実験は非常に難しいと思いましたが、人手でタグ付けしたkeywordを用いる比較手法を用いて、その検索精度の定量的な評価とツールの使いやすさの定性的な評価を行なっています。8つの検索対象クエリを用いて、平均の精度を比較していますが、どのクエリにおいても比較手法より提案手法の方が高精度であったという実験結果になっています。

また、そのツールの使いやすさという定性的な評価実験が以下になっています。使いやすく、プレイ検索の補助となり、また楽しく使えた!という評価が得られました。

5. 今後の展望と考察

論文中のfuture workには、クエリ検索にボールの進行方向やプレイが起きている場所といったスポーツのドメイン知識を活用することで、その検索の高精度化を図りたいと書かれていました。また、類似度の計算指標の改良や、その検索の高速化も展望としてあるようです。

私としては、検索ツールにより実用性を持たせるために、既に各プレイに付けられているタグの情報とトラッキングデータを組み合わせた処理が必要になる気がします。使えるものは使った方がいいし、実際にクエリを入力する際にも、キーワードで検索したい時もあるだろうし。あとは、プレイに関与している選手やチームの情報も詳細検索設定のようにできたらいいのかな。今日はここまで。

#アナリティクス #データ分析 #バスケットボール #サッカー #スポーツ #論文紹介

この記事が気に入ったらサポートをしてみませんか?