見出し画像

【SABR】セイバー指標の解説 - wOBA

鯖茶漬です。いつもお世話になっております。

□前書き

先日、Xでとあるフォロワーのスペースを覗いていたところ、少しだけ合同noteの話題に触れられていました。

「結局セイバーメトリクス部門って言っても、英語の記事を適当に翻訳してそれっぽく記事にするだけじゃないの?」(ちょっと内容は変更してます)

ぐ、ぐぬぬ・・・。

悔しいけど反論の余地なしです。初めて世に送り出した「WARの解説」も、現状そこまで調べて体系的にまとめた人がいなかっただけ、だと自分では思っています。0を1にする作業ではないというか、海外の有識者らが創り上げたものを自分なりに訳しただけというか...。それでも需要があったからある程度の反響があったのだと思ってますし、それはそれで意味のある事だとも思うんですが。

私が特に目新しい記事を書かなくとも、ネットで検索すればいくらでも有益な情報が落ちている時代です。目から鱗とも言える視点からの考察、またそれを発表するまでの速度感。私がセイバーメトリクスに興味を持ち始めたのはここ1年くらいの話ですが、そういった記事を目にする度に感動を覚えますし、同時に能力の差を痛いほど実感します。

「MLB30球団ファン合同note」の企画を通じて、今の自分にできることは何かなあと考えていたんですが、大雑把に「セイバーメトリクスの面白さを普及すること」かなと考えています。

もちろん自分なりに研究して新しい発見を世に送り出すのがベストだとは思うんですが、まずは「入口」を作るのが大事なんじゃないかなと。ハマる人って勝手にハマっていくと思っています。皆さんがいつの間にか野球に熱中して、自らどんどん情報収集していったのと同じように。まずはその手助けとなる記事を書きたいと思っています。

前置きから長々と書いてしまいましたが、要はせっかく合同noteの企画としては初めての部門に就いたので、まずは「面白さを広めること」を目標にしたい、という話です。頑張ります。頑張りましょう。


□打撃指標「wOBA」の紹介

▼MLBはデータの宝庫

皆様は「野球に関する数字・成績」を眺めるのはお好きでしょうか?私は大好きです。何が面白いのかも分からない幼少期からプロ野球選手名鑑の成績の欄を舐め回すように読んでいましたし、いつの間にかそれが習慣になっていたので今でもそれが好きな理由は説明できません。ただ、その気持ちは今でも変わっておらず、だからこそ野球のプレー以外の面にも魅力を感じているのだと思っています。

このnoteまで辿り着いてる方はご存知かと思いますが、MLBで集計・公開されている指標の数は日本のプロ野球の比ではありません。また、国内のプロ野球しか見ていなかった私がここ数年で一気にMLBの魅力に引き込まれたのは、そういった膨大なデータ量に興味を持ったから、というのが大きな理由です。

大事なのは「ただ数が多いだけでなく、理に適った指標がたくさん開発されており、それらはMLBの現場でも活用されている」ということです(中には『この指標はどこで役立つんだよ』みたいなものもありますが…)。

Baseball Refereceより引用。訳が分からない…。

なので導入として、膨大な指標の中から「これさえ覚えておけば間違いない」と私が考えているものを、シリーズ化して分かりやすく解説したいと思います。既に様々な媒体で指標の解説はされていますので、参考にしたサイトを私なりに解説しながら、あまり知られていない部分にも触れたいと思います。今回は打撃指標「wOBA」の紹介から。

▼打撃指標「wOBA」とは?

正式名称はweighted On Base Average、日本語で表すと「加重出塁率」と言ったところでしょうか。一般的に「打率」や「OPS」といった指標ほど普及しているとはまだまだ言えませんが、ある程度データに精通している野球好きの中では最も主流とされている指標でもあり、後ほど紹介する総合指標「WAR」の「打撃創出得点」の部分を担っている重要な指標です。計算式は以下。

一見複雑に見えますが…。

頭痛がしそうな計算式です。上の計算では「四球」「本塁打」などの各イベントにそれぞれ「得点価値」を反映した係数が与えられています。この数字は「得点期待値」の変化から算出されており、得点期待値の考え方については「1.02」で分かりやすく解説されているのでそちらをご参照ください。この式により「1打席あたりの得点貢献」を測ることが出来ます。

▼「打率」や「OPS」よりも優れる理由

過去に主要とされていた指標と比較してみます。まず「打率」は「四球・死球」と言った出塁能力や「単打か本塁打か」といった長打力の差を反映できておらず、四球・死球を含めた「出塁率」も「どれだけ長打を放ったか」を反映できません。また「長打率」も打率と同様、四球などのイベントの影響を受けていません。これらの比較から、上記の指標が「なぜ打者の貢献を測る為に重視されていないか」をご理解頂けるかと思います。

じゃあ『出塁率』と『長打率』を足しちゃえばいいんじゃない?」という一見雑な考えのもとに生まれたのが「OPS」ですが、細かい話をするとこの指標は「四球・死球」の価値をやや小さく見積もっています(1打席1単打でOPS2.000、1打席1四球でOPS1.000、と考えると分かりやすいかも?)。

上記の点を踏まえながら各イベントの得点価値の統計を取ってみると、それぞれのイベントにどれだけの価値があったのかがはっきりと見えてきます。

▼各イベントの得点価値

前提として、ここでの得点価値はあくまで「平均」の数字です。例を挙げると「本塁打」というイベントでも「勝利を決定付ける満塁ホームラン」と「10点ビハインドでのソロホームラン」は、試合においての価値としては大きく異なりますが、wOBAの計算上はこれらを全て同一のものとして扱っています。

「各イベントの得点価値」は、MLBファン御用達のデータサイト「Fangraphs」の「Grossary」→「Seasonal Constants」のページで確認出来ます。「こんなマニアックなページ誰が見に行くんだよ…」という気持ちも若干ありますが、試合が行われる度に少しづつ得点価値は変動している為、細かい部分まで興味を持った方は覗いてみるといいかもしれません。

ということで直近10年分の各イベントの得点価値は以下。

Fangraphs参照。wOBAScaleについては後述。

これらの係数を上に載せた公式に当て嵌めることで「wOBA」を算出します。

「アウトの価値=0」をベースとした得点価値が記載されている為、アウトの価値がマイナスとなる実際の試合ではもう少し価値が下がります。表にあるBB(四球)の価値が約0.7点、実際のアウトの価値が約-0.3点だとすると、実際の得点価値は約0.4点になる、といった具合です。

▼2023年シーズンwOBAランキング

FangraphsBaseball Savantを開けばすぐにランキングを確認できますが、あくまで「導入」としての記事ということでドカっと貼り付けます。人によって差はあれど、皆様の体感の「打者ランキング(大雑把)」と概ね一致するのではないでしょうか。

Baseball Savant参照。xwOBAについては後述。

2023年のリーグ平均は.318。.400を超えてくればリーグを代表するレベルの打者と言えるでしょう。アメリカン・リーグ本塁打記録を塗り替えた2022年のAaron Judgeは.458。2023年シーズンの大谷翔平よりも高い数値を維持しながらフルシーズン稼働したと考えると、如何に記録的なシーズンを送ったかが分かるかと思います。

…と、ここまでは割と認知されてそうな範囲のお話。ここからはもう少し掘り下げて解説していきます。


□細かすぎるwOBAの話

▼wOBA開発の背景

wOBAの開発は、カナダ出身のセイバリスト「Tom Tango」が著書「The Book」を制作する過程で行われたとされています。参考までに、Tangoが「The History of the wOBA」と題し、その制作過程を語っているリンクを貼っておきます。

私が上でwOBAと他の指標を比較したように、Tangoは最初に「打率」「出塁率」といった既存の打撃指標の欠点を指摘しつつ、各イベントに適切な得点価値を割り当てることでwOBAの開発に至ったとしています。

また「打者有利」「投手有利」といった球場の特性を定量化した「パークファクター」が反映されていない理由として、本の制作にはリーグ全体の統計を利用する前提であった為パークファクターの影響は特に考慮する必要がなかった、とも説明しており、個々の打者にwOBAを扱う場合はそういった調整が必要である、とも記しています。

余談ですが、Tangoはセイバーメトリクスを語る上では外せない最重要人物のひとりであり、総合指標「WAR」や投球指標「FIP」の考案も担っています。Xやブログでも度々興味深い議題を取り上げているので、興味のある方は古臭いフォントのブログを覗いてみることを強くお勧めします。

▼「wOBAScale」によって出塁率スケールに

先ほど説明した「Fangraphs」→「Seasonal Constants」で確認できた「各イベントの得点価値」の表に載っている「wOBAScale」の説明です。この数値は、上に貼った「四球係数×四球+死球係数×死球+単打係数×単打…」の式で算出したリーグ全体のwOBAをリーグ全体の出塁率に合わせる為の値です(細かい話をすると「wOBAには敬遠を含まないが、出塁率には敬遠を含む」為、リーグ平均出塁率の方が若干高くなっていますが…)。

この値を掛けることによって、視覚的に出塁率ベースで貢献度が把握しやすくなっています。先程「シーズンwOBAランキング」でも述べたように「.400を超えればトップクラス」のような評価基準で見てみると、各選手がどれだけの打撃成績を残しているかが理解しやすいのでは、と思います。

注意したいのは「wOBAScaleは見栄えや技術的な事情によって追加されているだけの数値」という点です。例えば「打率.400」はそのまま4割の確率でヒットを打っている、と解釈できますが「wOBA.400」は「1打席に0.4点を創出している」というわけではありません。1打席毎の平均創出得点を算出したい場合には、データサイトに載っているwOBAの値からwOBAScaleを割ってあげる必要があります。

▼「単打・四球・死球」は価値が異なる?

かなり細かい話ですが、個人的には野球の「攻撃」の部分をしっかりと反映していると感じる面白い点を解説します。

一見「打者が1塁ベースに出塁する」という点では同じイベントのように見えますが、実際のゲームをイメージすると微妙に異なってくるのが分かるはずです。参考までにもう一度「各イベントの得点価値」の表を貼ります。

BB=四球、HBP=死球、1B=単打。

まずは「単打」と四死球の比較です。上の「得点期待値」で説明したように、上の表は「各イベントによってどれだけ得点期待値が変化したか」を平均化したものです。

無死1塁の場面を想定してみます。四球 or 死球の場合は走者、打者共に1つずつ塁が進み「無死1、2塁」となるパターンしか発生しませんが、単打の場合だと1塁走者は「2塁に進む」だけでなく「3塁へ進む」=「得点期待値が1、2塁の状況よりも高くなる」というパターンも存在します。ランナーの走力によっては一気に本塁まで生還するかもしれません。「塁上の走者への影響」という点で、単打と四死球は明確に差があるのが分かるかと思います。

次に「四球」と「死球」の比較です。表を見てみると、若干ではありますが死球の価値が高く見積もられていることが分かります。走者への影響は「1つだけ進塁する」という点で同じですが、どこで差が発生しているか分かるでしょうか…?

ある程度野球に精通している方ならイメージ出来ると思いますが、野球の試合では時に「最悪歩かせてもいい場面」=「少しでも投手・守備側に有利な局面を意図的に作る場面」というのが発生します。wOBAの計算上敬遠は含まない為、それ以外の「際どいコースを攻め続けて、結果的に四球になった」というような野球ファンなら一度は見たことのある状況が、この数値に影響を及ぼしています。

その一方で、死球は完全にランダムです。時に守備側に不利になるような出塁を発生させることもあり(勿論四球にもあるのですが)、そういった差が僅かな得点価値の差に繋がっていると推測出来ます。

MLBには意図的な死球もあるだろ」というツッコミはなしでお願いします。

▼fWARは「wOBA」、rWARは「rOBA」

総合指標「WAR」における「打撃の貢献」を算出する上で、Fangraphs社算出の「fWAR」とBaseball Reference社算出の「rWAR」で微妙に異なる点です。

Baseball Reference社は、2021年に「our version of wOBA(当社版wOBA)」と称して「アップデートされたwOBA=rOBA」を発表しています。

Baseball Referenceに「Advanced wOBA? - 拡張されたwOBA」と題し、既存のwOBAとの違いを記したリンクがあるので貼っておきます。上のアップデートの内容を含め、Fangraphsに使用されるwOBAとの違いは以下。

①wOBAに「盗塁-盗塁死」の得点貢献を含める
「三振」と「それ以外のアウト」に異なる係数を与える
「内野安打」の係数を他の安打と区別する

特に②、③の部分は、前述した「四球と死球の差」のような細かいアップデートですが「アウトの質」や「走者への影響」を出来る限り反映するような内容になっています。

「盗塁での貢献が大きくて三振の少ないバッター…イチローかなあ…」と考え実際の数値を見に行ってみると、キャリア通算wOBA.328に対しrOBA.343、rOBAは内野安打の評価をやや低く見積もってはいますが、盗塁の貢献での部分で大きく差が出ていることが分かります。


□wOBAから派生した打撃指標

ここまでの内容でwOBAの細部までの説明は出来たかと思います。ここからはwOBAを活用した別の指標をいくつか紹介します。どれも重要なものばかりですので是非覚えてください。

▼「wRC+」で相対的に評価する

野球は相対評価のスポーツです。毎年のようにwOBAが.400を超える打者でも、平均が.320の環境と.400の環境では大きく価値が変わってきます。wOBAは打席毎の貢献度を適切に評価しますが、個人の数字を見ただけでは「全体と比較してどれ程傑出しているか」が分かりません。そこで「wRC+」という指標が出てきます(Baseball Referenceは『Rbat+』表記)。

wRC+は「平均的な打者の打撃貢献を100とした場合の傑出度を表した指標」です。「wOBA.370」という数字単体ではリーグ平均と比較してどれ程優れていたかが把握出来ませんが、「wRC+140」の場合は、リーグ平均よりも1.4倍の打撃貢献をしている、というのが一目で分かるのが特徴です。

もうひとつの特徴は「パークファクター補正を加えている」という点。平均で3点程しか入らない球場と平均で6点入る「打高」の球場では、勝利を目指す上で必要な「1点の価値」が異なります。各プレイヤーがどういった特徴の球場でプレーしたかを考慮することで、より中立的な評価が可能になります。

再びFangraphsより引用。wRC+上位10名。
補正によりwOBAの順位と若干異なります。

「wOBAの紹介」と題しておいては何ですが、球場補正を施したwRC+による打者評価を行う方がより正しいと言えます。また「相対評価」のメリットとして「異なるシーズンでの傑出度の比較」も可能になる、という点も挙げられます。野球は常に相対評価のスポーツです。

▼WARを構成する「wRAA」

「1打席毎の創出得点が算出可能」というwOBAの特徴を利用した指標であり、総合指標「WAR」の打撃貢献の部分を担う重要な指標です。また「wRC+」と同様「リーグ平均と比較した傑出度が分かる」という特徴も持っています。

2名の選手が「wOBA.400、wRC+160」という成績を残したとして、その数字のみの比較だと一見同等の打撃貢献があったように見えますが、「1人は20打席のみ、もう1人は600打席での数字」という要素を加えると、その2人の貢献度で大きく差が開くのが分かると思います。wRAAは「1打席毎の打撃貢献-リーグ平均の打撃貢献」に「打数」を掛けることで「リーグ平均の打者と比較しどれだけ得点を創出したか」を表す指標です。

WARの基準は「リプレイスメント・レベル」となる為、正確にはもう少し計算を足して初めて「野手の貢献」が算出されますが、打撃の創出得点を担うのはこの指標です。WARは「平均より少し上の打撃成績だったが、1年間出場し続けた」というような選手も評価するような仕組みになっていることが分かるかと思います。

▼Statcastで解析する「xwOBA」

Baseball Savantで確認出来る「xwOBA」についても触れます。「Expected wOBA」の略であり、直訳すると「wOBA期待値」という指標です。打者ページの「Batting」の項目には最上部に位置しており、MLBファンには比較的認知されているかもしれません。

Baseball Savantより引用。大谷のxwOBAは上位2%。

スタットキャストが導入されているMLBでは「打球速度・角度」「回転数・リリースポイント」「捕球確率」といった、ありとあらゆるプレーが瞬時に解析出来るようになっており、それらのデータは主にBaseball Savantで一般向けに公表されています。

「xwOBA」はその中の「Exit Velocity(打球射出速度)」「Launch Angle(打球角度)」「Sprint Speed(走塁速度)」のデータを利用し、各打球の「期待値」からwOBAを算出した指標となっています。「良い当たりだけど野手の正面だった」「詰まったけど内外野の間に落ちた」というような守備の影響を無視し、純粋な「打球の質」で算出しているのが特徴です(三振や四球といった『非打球』のイベントもwOBAと同様に含める点は注意)。

Baseball Savant参照。

2023年シーズンのxwOBA上位10名の数字です。また、横にwOBAと「wOBA-xwOBA」という興味深い数字も並べてみました。

この数字から分かるのは「期待値と比較して実際のwOBAがどれだけ乖離していたか」という点ですが、例えばAcunaの欄を見てみると「xwOBAよりも.032低かった」ということが分かります。歴史的なシーズンを送ったAcunaですが、Statcastの期待値は実際のwOBAよりも更に高い数字であった、というのはかなり驚きです。

主な原因としては「不運が重なった」という部分が大きいでしょうが、この「wOBA-xwOBA」の乖離には「他の要素も関わっているのでは?」と推測しています。この原因はまた別の記事で考察したいと思いますが、Xのフォロワーであるxgraphs氏がご自身のブログで「AcunaのwOBA-xwOBAの乖離の原因」について分析していますので、参考までにリンクを貼っておきます。

また「MLBの読み物」氏もJose Ramirezを取り上げてこの部分に触れています。こちらもご参考までに。


□終わりに

数ある指標の中から「創出得点」に直接関わってくる重要な指標として、まずはwOBAの解説をしました。派生系として紹介した他の打撃指標も含めて「これさえ覚えておけば間違いない」というものを紹介したつもりですので、野球を楽しむ上で参考になれば幸いです。

また、具体的な算出方法まで記載したのは、改めて「理に適った指標であること」を示す為でもあります。「MLBでは打率を重視していない」「長距離打者が評価されやすい」等の意見はネットで散見されますが、その理由についてまで触れられる事が少ない、と感じていたのもひとつの理由です。

「最高峰のリーグで重視されているのだから優れた指標である」ではなく「優れた指標であるからこそ、最高峰のリーグで重視されている」という認識が少しでも広がればいいな、と思います。ズラッと並んだ指標を眺めて楽しむのもいいですが「どういった理屈で成り立っていて、どのように活用するのだろう」という部分まで考えてみると、もっと数字の面白さに気付けるのではないでしょうか。



※上記以外の参考文献

※ヘッダー画像は「https://www.marca.com/en/mlb/atlanta-braves/2023/10/14/652aa2cf46163fbf9e8b45a0.html」を引用。
※全ての商用的、あるいは著作権侵害の意図を放棄して投稿します。

この記事が気に入ったらサポートをしてみませんか?