- 運営しているクリエイター
記事一覧
【Rstudio】baseball savantのトラッキングデータを一括で取得
本noteは、MLBが公開しているトラッキングデータを、Rstudioで取得しようというnoteです。
特定の投手(打者)のデータを取得する方法はネットに溢れていますが、1年分の全データをまとめて取得する方法はあまり見かけません。あっても力技のみ。
というわけで、一括で取得する方法をお話しします。
いきなり模範解答
library(tidyverse)library(baseballr)s
【baseballr大解剖】第5, 6章
baseballrに収録されているコードの解説文を日本語訳したnoteです。
第1~4章までのnoteはこちら。
5.1 試合情報・日程
a57 <- mlb_schedule(season = 2022, level_ids = "1")a58 <- mlb_schedule_event_types()a59 <- mlb_schedule_games_tied(season = 2022
【baseballr大解剖】第4章 セイバーメトリクス
baseballrに収録されているコードの解説文を日本語訳したnoteです。
第1〜3章はこちら
①wOBAwoba_plus(df)
各打者のwOBAを計算してくれる。
dfに最低限入ってる必要なデータは以下。
手っ取り早いのは、baseball_referenceから取得したデータを入れること。他サイトからのデータだと、列名の違いが原因でエラーになる。
j <- fg_guts()
【baseballr大解剖】第3章 データ取得 part1
baseballrに収録されているコードの解説文を日本語訳したnoteです。
第1章・第2章はこちら。
3.1 pitch_by_pitch①baseball savant
scrape_statcast_savant(start_date, end_date)scrape_statcast_savant_batter(start_date, end_date, batterid = NUL
【baseballr大解剖】第1, 2章
baseballrに収録されているコードの解説文を日本語訳したnoteです。
第1章 データの情報源ざっくり分けると、以下の5つ。
①~③はもはや言及する必要ないので省略。
retrosheetは『Rによるセイバーメトリクス入門』の読者ならご存じのデータサイト。savantでは一球ごとのデータを取得できるが、こちらでは打席ごとのデータを取得できる。他にもTransactionやSchedul