EAGLEによるヒッタープレート規律の定量化：パート1

2024年3月19日 21:22

このコンセプトは2022年3月のSABR会議で発表されたもので、Baseball Prospectusに掲載するために改編された。パート2は明日に続く。

プレート・ディシプリンは、打撃成績の重要な一部として調査され続けている野球の側面である。この作品では、選手がプレート上での判断にどれだけ優れているかを正確に数値化するために開発された新しい指標Expected Additional runs Gained by Looking/swing Estimate（EAGLE）について説明する。プレート・ディシプリン革命は、四球が得点に大きく貢献するという認識がマネーボール時代の幕開けに貢献したことから始まった。 2002年、オークランド・アスレチックスはこの現象を発見し、年齢、投げる能力、スピードの欠如など、何らかの属性のために過小評価されている野球選手が相当数いることを突き止めた。結局のところ、これらの特徴は、これらの選手が過小評価された理由のすべてをカバーするものではなかった。野球はその創設以来、ボールを打てる選手を打てない選手よりも高く評価してきた。今、私たちはよく分かっている。

野球の分析は、四球率や追走率を高く評価し、インゾーンとアウトオブゾーンのスイング率や接触率も見て、選手の "プレート・ディシプリン "の良し悪しを判断するまでに進歩した。しかし、プレート・ディシプリンとは、単に四球を選び、三振を避けるだけのものではない。むしろ、バッターがスイングするかしないか、すべての決断についてである。私たちは、打者が4球目まで打つか、ストライクゾーンの外の球をスイングするかということだけでなく、より深いレベルでその判断を定量化しようとした。

ストライクゾーンにあるすべての球が、打者にとってスイングして良い球とは限らない。すべてのストライクが同じとは限らない。外角の速球は、ゾーンの真ん中にぶら下がるカーブよりも打つのが難しい。バッターは、ぶら下がるカーブをスイングして、速球をストライクに取る方が、特に有利なカウントで、良い結果を得る可能性が高い。さらに、外角の速球をボールと呼ぶこともある。バッターのバットを振るか落とさせるかの決断を評価する際には、これらすべてを考慮に入れる必要がある。

この決断を評価するアプローチとして、バッターが下図のような決断を下す可能性がある場合、それぞれどのような結果になるかを分類した。

バッターが投球を受けた場合の結果は比較的単純で、審判の判定によってストライクかボールのどちらかが発生するが、バッターがバットを振った場合の結果には多くの可能性がある。そのため、写真の7つの結果に絞った：ミス、ファウル、アウト、シングル、ダブル、トリプルスリー、ホームラン。

スイングの判断の結果確率を予測するために、XGBoost分類モデルを学習しました。私たちは、球速、スピン率、動き、位置、タイプなどの投球情報の特徴や、カウント、アウト、投手/打者の手数などの状況情報を利用しました。バッターとピッチャーに関する記述統計も以下に記載した：

打者
PA, AVG, OBP, SLG
EV、LA、xBA、xwOBA、wOBA、ISO
投手
IP、ERA、WHIP、GB/FB、K、BB%。
平均球速、平均スピン率
モデルの最適なメタパラメータを決定するために、クロスバリデーションを用いてモデルをチューニングした。このようにして、我々は平均二乗誤差を減少させることができ、結果として以下のような確率の混同行列に行き着くことができた。例えば、実際に二塁打になった各投球について、空振りの確率を16.0%、ファウルボールの確率を41.2%、二塁打の確率を4.2%（その他）と予測した。見逃し球については、40.98%の確率で見逃し、32.8%の確率でファール、ホームランの確率はわずか1.06%と推定した。

ここから、ベースとなる指標を決定する必要があった。言い換えれば、何を数値化すべきか？即座に、得点はこの測定基準にとって非常に魅力的な単位の形である。幸運なことに、これはTom Tangoによって考案されたデルタランエクスパクタンシーで行うことができる。この指標は、最終的な出塁予想、つまり投球後の出塁予想から最初の出塁予想を引くことで算出される。これは以下のような出塁率マトリックスを利用したものだが、一球一球のアプローチを扱っているため、カウントも含んでいる。

この計画ができたので、EAGLEを作成するために必要なデータを収集し、モデルを構築するプロセスを開始することができた。我々はbaseballrパッケージを利用して、2019年と2020年の野球シーズンからbaseball savantのデータをスクレイピングした。ここから、特定の投球に起こりうるすべての結果について、デルタ走者予想を統合し、これで基礎ができ、定義したすべての結果について走者を加算（または減算）することができる。

さて、可能性のある各結果の走者予想が得られたので、これらの各結果が発生する確率を知る必要があり、指定した9つの結果の走者予想への影響を理解する必要があります。

各決定に対する失点期待値を計算するには、それぞれの結果が発生する確率と、発生した場合の失点期待値が必要です。バッターがスイングしなかった場合、投球がストライクとコールされる確率とボールとコールされる確率を予測し、それぞれの結果に対する期待打点を計算する。それらを組み合わせることで、バッターが投球を受けた場合のイニングの予想失点が得られる。また、バッターがそれぞれの球をスイングした場合の7つの結果の確率を推定する必要がある。これらの推定値と各結果の予想打点を組み合わせて、バッターがスイングした場合の予想打点を計算する。

ストライクの確率を予測するために、審判の決定の非線形性を捕らえるために、ロジスティック目的語を持つXGBoostモデルを使用しました。最終的に、モデルの独立変数は、x-ロケーション、z-ロケーション、ストライクゾーンの上部と下部の変数でした。このモデルのAUCは0.982であり、リーグ平均身長のバッターのストライクゾーンの推定値は以下の通りである：

そして、スイングとテイクの各決定に対する得点期待値を算出する。この2つのうち大きい方の得点期待値の変化を正しい判断とし、その投球に対する選手のEAGLEは、取った判断と他の選択との差とする。これが、ここで定義する期待得点です。そして、EAGLEは、その決定に基づいて得られるランの期待値となる。

これをすべてまとめると、下の図のようになります：
残念ながら、得点期待値はこれほど単純ではない。マイク・トラウトが登板したときと、フレディ・ガルビスが登板したときとでは、得点数が異なることが予想される。これを調整するために、デルタ得点期待値を状況とバッターのOPSの両方に回帰しました。 EAGLEは、決定に基づいて予想される得点です。次に、状況の元の得点予想を、バッターの対応する予想デルタ得点予想で調整します。デルタ出塁率とバッターのOPSの関係を示すために、我々は以下のビジュアルを作成した。

EAGLEの指標を手に入れたので、次回はその有効性と他のプレート・ディシプリン指標との違いを調査し、個々の投球や集計レベルにも応用してみたい。

続く

ジョシュア・モールドはビラノバ大学でコンピューターサイエンスと統計学を専攻している3年生で、今夏フィラデルフィア・フィリーズのアソシエイト・クオンツ・アナリストになる予定である。
デビッド・アンダーソンはビラノバ・ビジネススクールのミケーレ＆クリストファー・イアナコーン'91助教授。

この記事が気に入ったらサポートをしてみませんか？