見出し画像

Jリーグを分析してみた #1 ツール紹介編(2022シーズン)


最近、仕事でPythonやPowerBIを使うことがあり、個人の環境でもある程度好きにデータを取ってきたり可視化したりできるんだなと気づきました。

そこで、挑戦してみたのが"Jリーグの分析"!
何を隠そう私は小さい頃からジュビロ磐田が大好きで、大学時代はJリーグのお客さんを増やすための学生団体を運営するほどのJリーグ好き。
手探りではありますが、様々なデータを可視化してみましたので読んでいってくださいね⚽


データを取得する

まずはデータを取得するところから。
Jリーグ公式サイトのページに過去の試合結果一覧のページがあり、ここからスクレイピングでデータを取得することにしました。

J1、J2、J3のリーグ戦のみに絞っています。
ここから開催日やクラブ名、点数などをPythonのBeautiful Soupというライブラリを使ってスクレイピングし、csvファイルで出力しました。
また、この内容からクラブごとの勝点、得点、失点、得失点差を集計し、順位表も作成しました。

ここまで来ると、「誰が」「何分に」得点したのかも知りたくなってきます。
先ほどのページの「試合詳細」を押すと、試合ごとの得点者と時間が表示されているため、こちらも全試合分スクレイピングし、合わせて選手ごとの得点数を集計し得点ランキングを作成。

データの取得はここまでです。

データの可視化

ここからは、先ほど取得したデータをPowerBIで可視化していきます。
合計で4つのダッシュボードを作りました。

①順位表

リーグ別順位表

こちらはJリーグのサイトでも見ることができますが、リーグ別の順位表です。これを見て昨年ジュビロが最下位だったことを思い出して悲しい気持ちになりました。。。笑

②リーグ・クラブ別 得点・失点・勝点数

得点・失点・勝点ダッシュボード

こちらは、1年間の得点・失点・勝点が、デーゲーム/ナイターやホーム/アウェイ別に見られるダッシュボード。リーグごとも、クラブごとでも見ることができます。
画像はJ1からJ3まで全クラブの平均です。はやり、ホームゲームの方が点も取るし勝つ。たくさんのサポーターの応援が選手の力になっているんでしょうか。(そう思いたい)
デーゲームとナイターの差はあまりなさそうですね。

③得点ランキング

リーグ別得点ランキング

こちらはリーグ別の得点ランキングです。清水のチアゴ・サンタナ選手は本当によく点を取りますね。今シーズンも暴れています。
J1とJ3は1位と2位以下の差があまりないんですが、J2は横浜FCの小川航基選手がダントツの26得点。元ジュビロっ子なのでうれしい活躍です。
こちらは所属クラブのところでフィルターをかけてクラブ別のランキングを出すこともできます。

ジュビロ磐田の得点ランキング

試しにジュビロだけにするとこうなります。(特に言及することはないですね・・・)

④CK・FK・シュート数・時間帯別得点数

一番詳細なデータ

「試合詳細」のページから取得したデータを可視化。コーナーキック数、フリーキック数、シュート数、時間帯別得失点数をリーグ別やクラブ別に見ることができます。
前半後半に分けて見てみると、後半の方が得点数が多いんですね。

+αで、試合結果別(勝・負・分)にもフィルターを掛けられるようにしてみました。例として横浜Fマリノスのダッシュボードを載せます。

横浜FMの勝ち試合ダッシュボード(20試合)
横浜FMの負け試合ダッシュボード(6試合)

勝った試合と負けた試合で比べてみると、得点の分布が全く違いますね。勝った試合は全体的に得点が決まり、失点も少ないです。(特に後半開始すぐの50分台が一番得点しています)逆に負けた試合ではほぼ得点できておらず、特に後半に失点しています。
コーナーキック数・フリーキック数はあまり勝敗による差がないですが、シュート数に差が出ています。勝った試合はシュート数の平均が14.85本なのに対し、負けた試合は11.50本。シュート数は試合の結果に関わってきそうですね。

まとめ

今回作成したツールについて、ざっくり説明しました!
今後はクラブごとの分析結果を載せる予定です。とりあえずジュビロ磐田の分は載せますが、他に見たいクラブがあればぜひコメントくださいね。
他にも「こんな切り口で見てみたい!」などご意見ありましたらお待ちしています◎

この記事が気に入ったらサポートをしてみませんか?