WAA対WAR:MLBの総合パフォーマンス、平均以上の勝利、代替以上の勝利。より良い指標はどれか?

要約版

過去40年間に発表された野球の統計解析の中で、私が最重要だと考えるのは、ピート・パーマーとジョン・ソーンによる『The Hidden Game of Baseball』(1984年)である。研究は、野球統計の大規模な回帰分析に基づいており、いくつか要因を考慮して標準化された総合成績(batting、base running、pitching、fieldingを含む)の要約尺度を開発するに至ったもの。要素には、1試合あたり平均得点の経年変化、Home parkの違い、野手positionの相対的な難易度などが含まれる。この最後の要素は、同じ攻撃力を持つ2人の選手について、より難しいposition(例捕手や遊撃手)で playする選手の方が、より難しくないposition(例左翼)で playする選手よりも価値が高いという事実を反映する。

パーマーとソーンの2つの主要な総合指標 TPR(Total Player Rating)とTPI(Total Pitcher Index)の優れた点は、選手(投手と非投手の両方)のperformanceを、平均performanceに対するteamへの勝利貢献度で定量化する事。
これらの指標は、plus、 zero、minusのいずれになり、team合計はteam成績と非常に高い相関関係にある。チーム成績は主としてteamの選手の成績の良し悪しによって決まるので、これらの指標は実際、team成績の良い予測因子であった。

第8版では、Total Player Wins(TPW)という用語が導入され、次のように説明されている。「統計学の "MVP "であり、投手とposition playerの全活動に貢献した総勝利数でrank付けし、その年に最も価値のあるperformerを明らかにするもの」(2,673page)。(TPWは、以前使われていたTPRとTPIという用語に取って代わるものである(2,673page)。TPWの概念は、Batter-Fielder Wins(BFW)と呼ばれるようになった。

Total BaseballはInternetの影響で時代遅れになってしまいました。ショーン・フォーマンが開発したBaseball-Reference.comは、2000年に公開されました。B-R.comのdatabaseは、元々Total Baseballと同じdataを使って開発されました。B-R.comでは、TPRの概念はWins Above Average(WAA)と改名された。
WAAは、選手(投手と非投手の両方)performanceを、平均のperformanceと比較して、その選手のteamに貢献した勝利数で定量化するもの。

平均勝利数(WAA)

WAAが選手の値とteam performanceをどう関連付けるかを説明する。
まず2018年 seasonから
最も平均的なteamは、80勝82敗のロサンゼルス・エンゼルスだった。野手WAAが+5.2、投手が-5.0であり、team WAAは+0.2(実質0)であった。当然、team最高の選手はマイク・トラウトでWAA+8.1。トラウトの代わりに平均的選手ならば、teamはおそらく8勝ほど減らし、72勝90敗になっただろう。

Best teamはボストン・レッドソックスで、勝敗は108勝54敗、team WAAはposition playerが+6.2、pitcherが+16.1で構成され、+22.3。このWAAの値は、.500を約22ゲーム上回る103勝59敗を示唆している。レッドソックスの得点は876でアメリカン・リーグ1位、失点は647で3位と少ないが、WAAは投手が野手より更に平均を上回っていた事を示す。この見かけ上の矛盾を説明するのが、park factorを組み込んだWAAの特徴の一つである。例によって、2018年のフェンウェイパークは、平均的なparkよりも打者に有利で、投手に不利だったのである。2018年、ムーキー・ベッツのWAAは+8.9で、Major Leagueで最高値でした。ムーキー・ベッツがおらず、代わりに平均的な選手がいた場合、レッドソックスのposition playerのWAA値の合計は、minus(+6.2-8.9で計算)になっていただろう。

2018年の最弱チームは47勝115敗のボルチモア・オリオールズで、team WAAは-22.9、野手の-15.6と投手の-7.3から構成。これは、勝敗記録が.500より約23試合低い、58勝104敗である事を示唆している。弱いteam(勝った試合の2倍以上負けたteamなど)にありがちだが、オリオールズの1点差gameでの成績も12勝29敗と低調である。

WAAが選手の価値とteam performanceをどう結びつけているか示すもう一つの例として、1927年のニューヨーク・ヤンキースを挙げたい。
史上最高のチームと言われる1927年のヤンキースには、後に殿堂入りを果たす選手が6人いた。ベーブ・ルース、ルー・ゲーリッグ、ハーブ・ペノック、ウェイト・ホイト、アール・コムズ、トニー・ラゼリ、そして監督のミラー・ハギンズである。team勝敗は110勝44敗、teamWAAはposition playerが+26.7、ピッチャーが+6.7で、+33.4であった。当時の154試合制(77勝77敗が平均)では、約110勝44敗となり、この年のヤンキースの成績とぴったり一致する。

つまり、WAAの概念は、選手の成績を数値化する上で直感的に魅力的であり、選手成績とteam成績を体系的に結びつける優れた手法だと言える。
(なお、teamWAAは勝敗を正確予測するものではなく、例えば1点差gameでの成績の良し悪しなど、様々な理由で差が生じる可能性があります)

WAR(Wins Above Replacement:代替価値以上の勝利)

Baseball-Referenceのsiteに掲載されているWARの概要定義は以下の通り。"代替選手よりも、その選手がチームに加えた勝利数を示す一つの数字"......。 (この代替選手はminor leagueのTOP levelの選手である)
また、B-R.comではWAR概念の包括的歴史と議論が提供されている。この議論にあるように、「WARを決定する方法は1つではありません。この計算には何百ものSTEPがあり、合理的な人々が枠組みの特定の部分を実行する最良の方法について意見を異にする事ができる何十もの場所があるのです。. . .WARは必然的に近似値であり、人が望むような精密さ、正確さを持つことはない。」
議論には代替選手の概念も含まれ、「 major leaguerの価値を計算する場合、平均は比較の基準としては不適切である。平均的選手は比較的希少であり、獲得に高額費用がかかる事もある。
. . .代替levelの選手の定義は、先発選手が故障した時に簡単に手に入る選手で、年明けに非roster招待を受ける選手や、6年間minor leagueでfree agentとなる選手。」

WAAとWARの計算はどちらも複雑で多くのSTEPを経るが、WARの計算はより主観的である。WARの計算はWAAから始まり、benchmarkを平均という概念(分かりやすい統計的尺度)から、代替選手という概念に調整します。代替選手の概念は、異なる情報源(Baseball Reference、Fangraphsなど)により異なる計算がされている事実が示すように、全く単純ではありません。また、minor leagueの選手が球団によって異なるため、実際に使える最高の代替選手が異なるという事実も、計算をさらに複雑に。

WARの定義や代替選手の概念の議論から明らかなように、WAR開発の主要な動機は野球選手全般の成績レベルではなく、Major Leagueの選手を利用可能なminor leagueの選手で置き換えることに関連する成績levelである。

このapproachの問題点は、代替level概念は選手の代替に関しては非常に有用かもしれないが、一般的には望ましくはなく、また、選手performance全般の評価においてWARがWAAより望ましいわけでもないという事である。WARの概念が選手交代の金銭的costの分析に広く使われてきた事や、野球journalistの間で選手の年俸、teamの年俸総額、free agentの金銭的価値などに注目が集まる事もあり、WARの値が頻繁に引用されます。一方、WAAは新聞や雑誌ではほとんど目にせず、野球の成績分析に関する専門的な文献にのみ(あるいはごく例外的に)登場します。また、WAR値がその限界について議論される事なく、Mediaで使用されている事も難点である

WAR(Wins Above Replacement)の限界点

まず、WAA概念の代わりにWAR概念を用いると、選手価値とteam performanceを関連付ける例において、どのような影響が出るかを見てみましょう。平均的なteamである2018年のロサンゼルス・エンゼルスとその80勝82敗の成績の場合、team WARは+35.0(position playerが+26.0、ピッチャーが+9.0の構成)でした。team WAAの値+0.2とは異なり、team WARの値+35.0は、平均的なteamであった事を伝えてはいない。平均的なチームの基準が、もはや81勝81敗、勝率5割ではなく、47勝115敗、勝率2割9分である事は、WAR計算の専門的な部分を掘り下げればわかるだろう。このbenchmarkを決定するために多くの研究が行われてきましたが、先に引用したWins Above Replacement Explainerにあるように、時代と共に変化し、多くの主観的な判断が反映されるようになってきています。

47勝115敗という代替levelのbenchmarkが、2018年のボルチモア・オリオールズの実際の成績と等しいという事は、代替levelの選手を集めたteamと契約してきても同じ結果になったでしょうか。これは大いに疑問である。
minor leagueのTOP levelの人材 pool(WARの概要定義に記載)と、実際に利用できる人材(前述の非roster招待選手や6年minor leagueのfree agent)には大きな差がある。

歴史的に見ても、minor leagueのTOP playerが、希望するMajor Leagueの球団や代打を探す球団と自由に契約できなかった例は多くあります。1937年のinternational leagueのニューアーク・ベアーズ(勝率.717)は、その顕著な例である。このteamはニューヨーク・ヤンキースの所有で、minor league、farm system のTOP teamであり、打点王チャーリー・ケラーをはじめ、1938年に他のMajor League teamで先発を務めるほどの実力を持った選手が何人もいた。1938年シーズンは、ヤンキースがジョー・ディマジオ、トミー・ハインリッチ、ジョージ・セルカークという先発外野陣を擁していたため、彼はNewarkに留任したのである。

上記のように、まさに「平均的」ではないmajor leaguerが非常に少ないという事と、獲得にはcostがかかる事実はありますが、major leaguerの平均が一般的な選手評価にとって有用なbenchmark、最も有用なbenchmarkではない事を意味するわけではありません。分布の平均値(より厳密には平均値)、中央値、最頻値が一致する古典的なベル型曲線(統計理論的には正規分布)に適合する値の分布を扱うのは良いですが、こうした分布は主に統計理論に存在します。簡単な例としては、coinを100回投げて、表が出るかどうかの分布があります。

現実世界での統計分布は歪んでおり、平均値は最も頻度の高い値ではない事がほとんどである。アメリカの世帯の年収分布もその一例。分布は右側に偏っており(値が極端に大きい場合がある事を反映している)、ほとんどの場合、平均値より小さい値になっている。

WAAの値の分布はも右側に偏っており、ほとんどの場合、平均値より低い値を示している。
主な理由は、平均を大きく上回る選手(例えばWAAが5.0以上)は、通常、team試合の大部分で playするからだ。平均を大きく下回る選手(例えば、1 seasonのWAAが-5.0以下のpace)は、Major Leagueであまり長く playできない。2018年、100打席以上立ったposition playerは448人で、そのうちWAAがPlus(+0.1以上)だったのは194人、WAAが0.0だったのは11人、minus(-0.1以下)だったのは243人と過半数を占めています。一方、これら448人のposition playerに対応するWAR値は+338、0.0が9、−101であり、WAR値のbenchmarkがMajor Leagueの平均的な成績を大きく下回っている事を反映している。

2018年、600打席以上立った上位10人のposition playerは、平均WAAが5.8、平均WARは7.9であり、full timeの選手の場合、1 seasonの平均WAAを約2.0上回っている事が示唆される。

これまでの議論を踏まえて、WARのconceptについて、大きく3つの見解がある。

  1. WARの概念は、元々Major Leagueの選手をminor leagueの選手に置き換える事に焦点をあて開発されたものであり、選手performanceを一般的に評価するためのものではない。

  2. リプレイスメントレベル概念の実装は非常に主観的である。

  3. WARの概念は、平均値などの分布の基本的な統計的特性を歪めている。

この3点から、これらの事実が提起する問題を研究している人がいないかどうか調べてみた結果、2012年にアダム・ダロウスキーがHighHeatStats.comで発表したWARとWAAを比較した研究結果を見つけた。
彼は、WAAからWARに変更する事によって選手のcareer数値が増加する事に加え、この増加は選手間で一貫性がなく、career成績による選手のrankingに多大な差異をもたらす事を示した。

WAA値ではなくWAR値を用いる事でcareer rankingが向上する選手の主な例として、ピート・ローズを挙げています。なぜなら、ローズはWAA値で測ると平均か平均以下の seasonが多く、特に長いcareerの後半では、それでもWAR値に加算されたり、大きく減少する事はなかったからです。ダロウスキーは、ある選手を殿堂入りさせる時、"彼は当時のAAA選手よりはるかに優れていた "のか、それとも "彼は他の誰よりもはるかに優れていた "のかを問うのだろうかと問いかけます。ダロウスキーは後者の基準を支持し、選択した上で、選手WAR値を、WAA勝利(他のメジャーリーガーと比較して平均以上であるによる)と「Show up勝利」(major leaguerの中では平均以下だがminor leagueの基準よりは良いによる)の2つのcategoryに分けます。メジャーリーガーの成績が平均を大きく下回り、WAR値がマイナスになるケースもある(例えば、1981年と1982年、41歳と42歳のピート・ローズのWAA値は-3.4と-4.0、WAR値は-1.1と-2.1である)。

先に説明したように、どの年においてもほとんどの選手はWAA値が平均以下である可能性が高いので、「Show up勝利」という言葉は少し厳しい皮肉に見えるかもしれない。これは、彼らがMajor Leagueで playする資格がない事を意味しない。しかし、ここでは、他の選手全体と比較した総合的performance(例、その選手が殿堂入り検討に値するか)に焦点が当てられており、その選手が使えなくなった場合(例えば、怪我やfree agentした場合)チームがその選手を誰と交代する可能性があるかには焦点を当てていないため、ダロウスキーの用語が使用されている。

表は、ダロウスキーが提案したTOP選手のWAR勝利をWAA勝利とShow up勝利に分ける事で、WAR値とWAA値の関係を説明するためのもの。

WAAとWARの上位65人のlistには同じ選手が多く含まれているが、顕著で系統的な偏りがある。
一般に、career打席数が平均より少ない選手は、WAAからWARに切り替えた時に順位が下がり、その逆もまた然り。

表1のWAAとWARの選手rankingを74人の選手について散布図。順位相関係数(rho)=0.62。

系統的な偏りは、2つのリストのうち片方だけに登場する18人の選手について、career打席数とWAA rankingからWARrankingへの変化との統計的関係の比較で定量化できる。18人の選手career打席数と順位変動の相関係数(r)=0.96。つまり、決定係数(rの2乗)=0.92となる。
従って、この18人の選手WAA rankingからWAR rankingへの変化の92%は、全てcareer打席数の違いによるものである事がわかります。これは、先に述べたダロウスキーの結論を支持するもの。
これは、WAR概念が開発された目的を問うものではなく、殿堂入りを検討すべき選手を決めるなど、career全体performanceを評価する場合、WAR概念には顕著なbiasがあると示す。

この分析では、上記の議論や図1に反映されているように、WAAとWARによる選手rankingの違いに焦点を当てているが、WAAとWARの値( rankingではなく)の統計的関係をまとめる事も興味ある。これは、独立変数(X)が従属変数(Y)に及ぼす影響(例 教育が所得に及ぼす影響)を定量化しようとする古典的caseではないが、
ここでは、WARがperformanceのbenchmarkをmajor leaguerの平均からminor leagueのTOP playerに調整する事を反映して、WAAを独立変数(X)、WARを従属変数(Y)として指定する。線形回帰で、この関係を示す最小二乗直線(Y = a + bXの形)は、WAR = 28.358 + (1.112)(WAA) である。この関係から、74人の選手について、WAAの平均値は56.3、WARの平均値は91.0となる。74人の選手の中でWARの予測値(最小二乗法による)と実際のWARの値との差が最も大きいのはピート・ローズである。彼のWAA値が29.7であることから、彼のWAR予測値は60.7であるのに対して、実際のWAR値は79.7である。

最後に、Darowskiが定義し、前述したように、WAR値における選手の勝利のうち「show up」の割合を見てみると、興味深い。
史上最高の選手の何人かは30%を下回っている。
数人が50%を超えています。

まとめと提言

本稿で示したデータは、
WAR(Wins Above Replacement)概念が、比較的careerの短い選手の価値を系統的に低く、比較的careerの長い選手(打席数)の価値を過大評価する事によって、Major Leagueにおける選手成績の評価を著しく歪めており、アダム・ダロースキー氏の知見と一致を示すものであった
選手成績の評価はWAA(Wins Above Average)概念に基づく値を用いて示し、
WAR概念の使用は、Major League選手をminor league選手に置き換えるという本来の焦点に限定が推奨される。(怪我や移籍時の穴埋め度合い計算などに)

備考

3 http://www.highheatstats.com/2012/07/wins-above-replacement-war-vs-wins-above-average-waa/.

この記事が気に入ったらサポートをしてみませんか?