KATOHマイナーリーグ成績から予測

夏の間、私はFanGraphsのコミュニティセクションで、minor leagueの打者の年齢とスタッツが、Major Leagueでの彼の将来をどのように予測できるかを解明するために、いくつか数字を計算した。 ヤンキースの有望株である加藤豪将は、2014年 seasonを南大西洋リーグのチャールストン・リバードッグスAクラスで二塁手としてplayした。 当時、加藤は40%近い三振率を記録していたが、19歳という若さで、他の競合選手よりも2、3歳若かった。

加藤の状況は、彼のような選手のperformanceを評価する上で何が本当に重要なのか、自分には見当もつかない事に気づかせてくれた。 彼が10回に4回三振している事を心配すべきだろうか? 彼の立派な12%の四球率は、三振の問題を少なくするのだろうか? statsを完全に無視して、10代でfull season球団でplayしたことだけを評価すべきなのだろうか? 私にはさっぱりわからなかった。

何が最も重要なのかを知るために、私はBaseball-Referenceを通じて入手可能なminor leagueの膨大なDATAに目を向けた。 これらのデータを使ってプロビット回帰を行った。 例えば、年齢とリーグ調整後の奪三振率、四球率、単発打率、遊撃打率、盗塁の頻度に基づいて、有望株がメジャーに到達する確率を示すかもしれない。

KATOHの最初のイテレーションでは、私はminor leagueの打者だけに注目し、Majorでplayする確率を推定した。 今回、私はSystemを拡張して、選手が28歳までに達成する可能性のある様々な結果、つまりWARのしきい値に確率をかけた。 私が選んだ閾値は、カイリー・マクダニエルが示した総合的な価値の20~80の尺度に大まかに基づいている。

28歳までのキャリア価値

WARしきい値 将来の価値 

メジャーで少なくとも1試合 35
4 WAR以上 40
6 WAR 45
8 WAR 50
10 WAR 55
12 WAR 60
16 WAR 65

それ以上のしきい値を満たした選手のsampleは、一般的に少なすぎてあまり意味がなかったため、16WAR以上にはしなかった。 物事を比較的単純に保ち、異なるWARのしきい値間で同程度の比較ができるように、私は各minor leagueのlevel内で同じ変数群にこだわった。 そこで、各レベルについて、ほとんどのperformanceしきい値で統計的に有意なモデルを維持しながら、できるだけ多くの変数を含めた。 また、これらの確率を使って、28歳までの選手の予想WAR合計を推定した。

下の表は、各minor leaguel evelでどのstatsが有意であったかをまとめたものである。 この分析には、full seasonA球団がA class(A)とA class advanced(A+)に分割された最初の年である1990年までのminor league dataが含まれる。 R+は、アパラチアリーグとパイオニアリーグという上級ルーキーリーグを指し、R-はアリゾナリーグとガルフコーストリーグを含む。

レベル別の有意な統計

レベル 年齢 BB% K% ISO BABIP SB% 年齢2 K%2
AAA
AAクラス
A+ はい はい はい
A はい はい はい
A- Yes Yes Yes Yes Yes
R+ Yes Yes Yes Yes Yes Yes
R- Yes Yes Yes Yes

*SB% = (SB+CS) / (Single + WALK + HBP)

ここでの最大の収穫は、minorの下位レベルでは四球率はあまり重要ではない事だと思う。 実際、rookie ballやlow Aの選手にはまったく予測できない。 そして、ダブルA levelであっても、三振率の1%の変化は、四球率の1%の変化の約1.5倍、選手のProjectionに影響を与える。

直感的には、これは理に適っている。 このようなlevelの投手は、ボールの行方をほとんど考えていない事が多いからだ。 その結果、打者は3strikeを見る前に4 ballを見ることを期待して、超受動的なapproachを取る事ができる。 この戦略はrookie ballやA ballでは有効かもしれないが、投手のControlが良くなるupper levelでは有効性を失う可能性がある。

はっきりさせておきたいのは、高四球のプロスペクトが低四球のプロスペクトよりも成功する可能性がないではない。 四球率は一般的に将来の成功と相関するが、それはISOと共線関係にあるからに他ならない。 簡単に言えば、パワーのある打者は四球も多い傾向があるが、大リーグでの成績を予測するのは、四球よりもむしろパワーなのである。

prospectがMajorで何をするかを予測するのは愚の骨頂だが、minor leagueの階段を下りるごとに、それはさらに愚の骨頂となる。 ダブルAやAAAにいるbatterは、ある程度高度な投手と対戦しているため、その成績から少なくとも大リーグの投手に対してどのような成績を残すか、ある程度予測できる。 しかし、rookie ballにいる選手にとっては、この統計はほとんど役に立たない。 これらの選手の大半は10代であり、その大半はメジャーを嗅ぎつけることすらなく、Majorでplayできるのはまだ4、5年先である。

その結果、KATOHはlow minorの選手に対してやや気弱になる。 メジャーで通用するかどうかを判断するだけでも、ほとんどの予想は1%から15%の間のどこかに落ちる。

当然、KATOHはこうしたロー・マイナー選手の活躍を予測するのは得意ではない。 1990年以降にKATOHが予想した全打者を対象に、KATOHの予想と実際に起こったこと(ゼロか100%)の差である平均残差を、各レベルにおけるKATOHの平均予想で割ったものが下の表である。 緑色の枠が多いほど、KATOHは的中率が高い。 このシステムは、ハイ・マイナーにいる打者に対してはかなり良い結果を出すが、まだフルシーズン球団に所属していない選手、特に選手がメジャーに行けるかどうかを予測する以上のことをしようとすると、本当に苦労する。

このような方法論は、決してプロスペクト評価のスカウティングの側面に取って代わるべきものではない。 2003年にデイン・ペリーが書いた有名な文章にあるように、スタッツとスカウティングのどちらを選ぶかは、ビールとタコスのどちらかを選ぶようなものである。 言い換えれば、どちらも素晴らしいものであり、一緒に飲めばさらに良くなる可能性があるのだから、誰も選択する必要はないのだ。

多くの場合、優れたscouting reportは、犬の年齢分の統計的回帰に値する。 KATOHは、bat speed、緩いswing、バットヘッドの感覚といったバッターの特徴が、fieldでのperformanceに反映されているかどうかを判断できない。 しかし、KATOHが行っているのは、100%客観的な視点からprospect評価に取り組むことであり、これは、従来のprospect評価では見落とされていたかもしれない統計的要因を特定するのに役立つと思う。

ヤンキースの有望株アーロン・ジャッジを例に考えてみよう。 ジャッジは、6ft7外野手、ローとハイ-Aの間で印象的な.308/.419/.486campaignを回した昨年、彼はprospect radarに保管され、彼はキース-ローの season半ばのトップ50prospectlistのSPOTを獲得した。 KATOHは売れていない。 このSystemは、ジャッジがメジャーでplayする確率をわずか54%とし、28歳の seasonまでに4WAR以上を記録する確率をわずか13%とした。

KATOHが何と言おうと、ジャッジが今後6年間で大リーグに進出する可能性は五分五分だと私は思っている。 実際に彼のプレーを見たプロのスカウトたちは、彼には中軸打者として威力を発揮する素質があると見ているし、彼らが何をやっているのか知っていることに疑いはない。 しかし、私はKATOHが何かを掴んでいるのではないかと思うし、一部の評価者はジャッジの一見印象的なA球団の数字を少し過大評価しているのではないかと思う。

ひとつは、ジャッジがAボールで22歳であり、競合選手の多くよりも年上であることだ。 信じられないかもしれないが、彼はブライス・ハーパーやマニー・マチャドよりも年上である。 しかし、彼の年齢を考慮したとしても、OPS.905という数字は決して驚くようなものではない。

しかし、ジャッジがOPS.905に至った経緯が気になる。 彼は.308という堅実なアベレージを記録し、パワーもそこそこあったが、彼の価値の大部分は、16%という印象的な四球率から来ている。 四球は素晴らしいことだが、先に示したように、下位マイナーでプレーする打者にとって四球率はほとんど意味がないことをデータは示唆している。 ジャッジの四球を取り除けば、彼のスタッツラインは突然、三振の問題を抱えた何の変哲もないマイナーリーガーのように見える。

KATOHの最大の欠点は、守備を考慮していない事だ。 エリート守備の遊撃手とゴツゴツした一塁手が同じ打線だったら、同じ確率になるのは明らかだ。 このギャップを少しでも縮めようと、私は各ポジションの選手に適用する経験則を開発した。

まず、メジャーでプレーし、1990年以降のKATOHプロジェクションを持つすべての打者を、28歳まで最も多くのイニングをプレーしたポジションに割り当てた。 そこから、各ポジションの選手が予想に対してどのような成績を残したかを見てみた。 メジャーリーガーだけを考慮すると、選択バイアスが生じる: メジャーで活躍した選手は、ランダムに選ばれた選手よりもWARのしきい値を上回る可能性が高い。 そこで、この要因を探るために、下表のデータを平均的なメジャーリーガーに対する各ポジションの成績を参照するように調整した。

当然のことながら、KATOHは、捕手、中堅手、遊撃手のような守備の重要なポジションにいる選手を過小評価する傾向がある。 この表は、メジャーリーグでのポジションであり、現在のポジションではないことに留意してほしい。 例えば、ルーキー戦でショートを守っていた有望株は、長期的には二塁手か三塁手になるかもしれない。 これはまた、各ポジションの他の選手と比較した場合の守備能力も考慮していないので、適当に上下にヘッジしてください。

話はもう十分だ。 これらのモデルを現在の有望選手と2014年のスタッツに適用してみよう。 以下は、2014年のシーズンで28歳(最低200登板)までの期待WARが最も高かった選手である。

レベル別の重要な統計

私は現在、投手の同様の分析に取り組んでいるが、これはもっと難しいものになると予想している。 投手はいつキャリアを左右するような怪我に見舞われてもおかしくないため、投手の有望株は打者よりもはるかに不安定だ。 諺にもあるように "投手有望株など存在しない" マイナーリーガーの過去の球速データがないことを考慮すると、投手有望株の統計的予測を作成することは、ほとんど時間の無駄のように感じられる。 ほとんどね。

何はともあれ、私なりのベストを尽くすつもりだ。 もしご興味があれば、昨年マイナーリーグで少なくとも1回登板した全選手の予測を含むGoogleスプレッドシートも作成した。 ただ、数回しか登板していない選手については、予測はあまり意味をなさないことを覚えておいてほしい。 ほんのわずかな試合を通しての選手の打率やWOBAを見るのと同じように、これらは大目に見てほしい。 そして、もし本当に退屈なら、過去のシーズンの計算された予測を含む別のスプレッドシートも作った。

新年を迎える少し前、私はこの『The Hardball Times』でKATOH-minor league statsを使ってメジャーリーグのパフォーマンスを予測する手法-を紹介する記事を書いた。 一連のプロビット回帰分析を使って、ルーキーからトリプルAまでのマイナーリーグの全レベルにおいて、打者の年齢と攻撃的統計が将来の大リーグでの成績をどのように予測するかを探った。

その結果、各マイナーリーグの打者について、メジャーでプレーする確率と、28歳まで一定のWAR基準値を達成する確率を含む、一連の予測が得られた。 この分析では、マイナーリーグの各レベルの選手について、どの攻撃的統計が将来の成功を予測するかについての洞察も得られた。 最も顕著な、おそらく最も驚くべき傾向は、バッターの四球率に関するものである。 マイナーの下位レベルでは、スタッツは選手の将来の大リーグでの成功にはほとんど関係がない。

今日は、同じような方法論を使ってminor leagueの投手を扱おうと思う。 オリジナルの記事で、私はこれらの予測は従来のスカウティングに基づく方法論に取って代わるために使用されるべきではないと指摘した。 むしろ、それらを補完し、見過ごされてきた統計的要因を明らかにすることを意図している。 これは特に投手に当てはまり、投手のスタッツは安定するのに時間がかかり、スタッツよりもスタッツの方が重要であることが多い。

下の表は、各マイナーリーグでどのスタッツが有意であったかをまとめたものである。 この分析には、Baseball-Referenceが投手の打者別通算投球回を記録している最も古い年である1991年までのマイナーリーグデータが含まれる。 R+は上級ルーキーリーグ(アパラチアリーグとパイオニアリーグ)を指し、R-はアリゾナリーグとガルフコーストリーグを含む。

以下の要因は、1つ以上のマイナーリーグレベルの投手において有意であった: 年齢、先発試合の割合、奪三振率、与四球率、被本塁打率、手数。 さらに、投手の奪三振率の2乗(K%^2)は、トリプルAレベルでは負の係数で有意であった。 基本的には、高い奪三振率はトリプルAでの投手にとって良い兆候だが、その恩恵は25%あたりから減少し始めるということだ。 すべてのパフォーマンススタッツ(K%、BB%、HR%)はリーグ平均に調整されているが、パーク調整されていない。

レベル別重要統計量
レベル 年齢 GS% K% BB% HR% 手数 K^2
AAA Yes Yes Yes Yes Yes Yes
AA Yes Yes Yes Yes Yes
A+ Yes Yes Yes Yes
A Yes Yes Yes Yes Yes
A- Yes Yes Yes Yes
R+ Yes Yes Yes
R- Yes Yes Yes Yes Yes Yes

当然ながら、投手の年齢と先発試合数の割合は、どちらも期待通りの結果を示している。 また、一般的に先発投手の方がリリーフ投手よりも成功しやすい。 奪三振率もまた、将来の成功の非常に重要な予測因子であり、特にshort season leagueでは、他の指標では将来の成功について何もわからない。

打者で見たように、投手の四球率はminor leagueの最下位レベルでは全く予測できない。 しかし、一旦投手がフルシーズン球に到達すると、四球率の1%の変化は、将来の成績を予測する上で、奪三振率の1%の変化とほぼ同等に役立つようになる。 これは打者の場合とは異なり、四球率はダブルA以下ではほとんど意味を持たず、トリプルAレベルまでは奪三振率ほど有用ではない。

本塁打率もまた、マイナーの下位レベルではほとんど意味のない指標である。 奪三振率は早くもA球団で予測価値を持ち始めるが、ダブルA、トリプルA以下の投手ではその効果は比較的小さい。 奪三振率と比較すると、投手の本塁打率が1%上昇することは、Low-AやShort-Season-Aの投手の約2倍、トリプルAで重要である。

もう一つの興味深い発見は、投手の手の大きさである。 ダブルAとルーキー下位の投手では、右投手の方が左投手よりも大リーガーとして成功する可能性が高い。 しかし、予想に顕著な違いが出るほど影響は大きくないので、あまり深読みしない方がいい。 同程度のスタッツを持つ左投手よりも右投手の方が成功する可能性が高い理由を正確に言うのは難しいが、私の推測では、minor leagueの打者が、サイドアームを投げるような変わったデリバリーをする左投手と初めて対面する事と関係があるのではないかと思う。

投手の身長という変数もここに入れたいと思う。 背の高い投手の方が、背の低い投手よりも有利であることは一般に知られている。背の高い投手は、より下り勾配でボールを投げることができ、通常はホームプレートの近くでボールをリリースする。 その結果、180センチを超える投手候補を「プロジェクタブル」と評価するのをよく耳にする。 その結果、身長変数が正の係数で有意になると想像される。 言い換えれば、身長185センチの投手と195センチの投手が同じスタッツを記録した場合、長身の投手の方が成功する可能性が高いということだ。

残念ながら、マイナーリーガーの身長データを読みやすいフォーマットで見つけることができなかったので、確実なことは言えません。 しかし、私は将来の予測のために身長をミックスに加えたいと考えています。 そこで、この種のデータをどのように追跡したらいいか、何か提案があれば教えてほしい。

minor leagueの打者がMajorでどのような成績を残すかを予測するのは簡単ではない。 ことわざにもあるように "投手有望株など存在しない" minor leagueでとんでもない数字を残したものの、大リーグで定着することなく燃え尽きた投手有望株は数え切れない。 ライアン・アンダーソンやニック・ノイゲバウアーのような有望な投手がどうなっていたかはわからないが、リック・アンキエルやサロモン・トーレスのように、Majorに行った途端にカボチャになってしまう事も、ヨハン・サンタナやロイ・オズワルトのように、minorで数年間低迷した後に正真正銘のエースになるような選手もいる。 ということわざがあるように、投手候補なんてものは存在しないのだ。

minor leagueでの投手statsは、打者 statsほど予測的ではないのだ。 KATOHは、特にlow minorにいるほとんどの投手については、かなり気まぐれである。 short seasonの投手については、Majorに行ける確率を単純に推定する場合でも、KATOHのほぼ全ての予想が比較的近い所にまとまっている。 AAAでの成績は別として、投手のminor league statsからわかることは限られているので、低 levelの投手がよっぽどの事がない限り、KATOHはその投手を中央値に近い所に位置づけるだろう。

KATOHは打者よりも投手の予測がかなり難しいが、成功も失敗も似たようなものだ。 打者と同様、High and minorの選手にはかなり良い結果を出すが、それ以下のレベルの選手、特にWARのしきい値が高い選手には本当に苦労する。 低レベルの投手の場合、KATOHが確実に教えてくれるのは、29歳の誕生日までに大リーグに進出するかどうかということだけだ。

下の表は、1991年以降にKATOHが予測したすべての投手を対象に、平均残差(KATOHの予測と実際に起こったこと(ゼロか100%)の差)を各レベルの平均予測で割ったものである。 ボックスの色が緑であればあるほど、KATOHは的確な推測をしたことになる。

KAT
さて、ここからが楽しいところだ。 しかし、予想に没頭する前に、2、3のことを心に留めておいてほしい:

  1. minorの下位レベルの投手の予想には注意が必要である。 上述したように、minor leagueを下るごとに予測の信頼性は低くなる。 minor下位の予想は、入手可能なデータに基づく最善の推測であるが、誤差の可能性が非常に大きい。

  2. sample sizeに注意する事。 私のGoogle documentに記載されている投手の多くは、少ないイニング数で優れた予測をしているかもしれない。 同じイニング数の投手のFIPと同じように、塩の粒をたくさん持ってこれらを取る。

当然、KATOHの上位予想投手(最低打者数200人、投球イニング数約50イニング)のリストは、球界の上位投手候補の「誰々」のように読める。 しかし、リストのさらに下を見れば、knockoutされるような投球はできないかもしれないが、それでも2014年にそのレベルにしては若いにもかかわらず打者をOUTにできた、あまり知られていない投手が何人か見つかるだろう。

この記事が気に入ったらサポートをしてみませんか?