#NulNote 信じるな危険!? ネットの海で拾えるデータとの上手な付き合い方


■「問題」
里崎智也氏の通算捕逸数はいくつでしょうか?

こんな問いがあったとして、みなさんはまずどうしますか?
多くの人が、スマホかPCを手にGoogleにこう打ち込むと思います。

「里崎智也 通算捕逸数」

すると、トップにいきなりこういう情報が出てきました。

2014年に現役を引退。 1000試合以上出場した捕手では日本プロ野球最少となる通算捕逸19個の記録を持つ。

おお、通算捕逸数19って出とるやん。イージーモードや!
ということで多くの人が「19」と回答することになると思います。

ちょっと意地悪ですが、検証のため同じような問いを自分のXにて投票機能を利用して出題してみました。

※ググっても大丈夫ですよ^^

と敢えて記載して。

するとこのような結果になりました。ご協力頂いた皆さんありがとうございました。

やはり最多回答は「19」という結果になりました。

■Wikipediaを疑え

1人1人に聞けてないのであくまで想像ですが、「19」と答えた方の多くが氏のWikipediaを確認したんだと思います。

Wikipediaの詳細情報⇒年度別守備成績を見ると、捕逸の通算数に19と記載されています。

やっぱり19じゃないか、何か問題でも?

と思われる方が多いかもしれませんが、この年度別守備成績の情報を改めて確認してください。何かに気付きませんか?

2000~02年、04年の捕逸の欄が「空白」になっていますよね。
「0」ではなく「空白」です。
さらに、2014年の捕逸の欄には「0」と書いてあるので、「空白=0」とは限らないことがわかると思います。(0かもしれません)

すなわち、この空白は「0」を示しているわけでは無く、「不明」であることを示していると言うことになります。
つまり、2000~02、04年に関しては「捕逸を記録している可能性がある」ということになるのです。(繰り返しますが0かもしれません)

なので、データクラスタがこのWikipediaを見て考えることは
「空白だから0だろう」
ではなく
「空白ということは記録されている可能性があるので調べなくては」
なのです。

■Let's Go to Library

ということでデータクラスタな私は実際に調べてみました。

まずは私たちデータクラスタが足を向けて寝られない偉大なサイト
「日本プロ野球記録(ウスコイ企画さん)」を確認してみます。
1936年の日本プロ野球誕生から現在までのデータを網羅しているスーパーサイトですから当然過去のデータもしっかりと確認されているはずでWikipediaより信頼度は高いはずです。

すると…

2004年に捕逸1が記録されており、通算捕逸数が20となっていました!

さっそくWikipediaの情報と差分が出ました。これはどちらが正しいか検証が必要になります。
2004年に記録されている可能性があるとわかりましたので、まずはWeb Archiveを使って過去の日刊スポーツの速報を確認し、里崎氏に捕逸が記録されている試合を検索しました。
(捕逸の記録が確認出来るネットメディアは日刊スポーツしかありません。Yahoo/SportsNavi速報では確認できません。)

その結果、見つかりました。

2004/8/25 札幌ドームでの試合で2回に捕逸が記録されていました。

ただ、ネット速報は後日修正が入っても反映されないことが多々あります。
ですので、さらに信頼度を上げるため、図書館に出向いて書庫に眠っているベースボールレコードブックを引っ張り出して調べてみました。
すると、やはりレコードブック上でも上記試合で捕逸が記録されていることが確認出来ました。
なお、念のため2000~02年のレコードブックも確認しましたが、捕逸は記録されていないことを確認しました。
当時の速報およびレコードブックでも記載されているところを鑑みれば、この記録が事実である可能性が極めて高いと考えて問題ないと思います。
すなわち

・Wikipediaで不明だった2004年の捕逸は0ではなく1である
・Wikipediaで不明だった2000~02年の捕逸は0である
・通算捕逸数は19ではなく20である

という結論に至りました。
つまり日本プロ野球記録さんの情報が正しかったということになります。
さすがです。一生付いていきます(大袈裟)。
※ちなみに2005年以降の守備データはNPB公式で確認可能で、2005年以降の捕逸数に誤りがないことも確認しています。

■改めて、ネットデータとの向き合い方とは?

Wikipediaはビッグデータであり、しっかり調べられているものもあるので、何かを調べるときに盲目的に使ってしまいがちなのは私も理解出来ます。
しかし、Wikipediaはあくまで有志による編集で成り立っているものであり、不正確な情報のままになっているページも多数あるはずです。
ですので、ちょっとした会話のネタ程度であれば良いですが、何かの記事であったり論文であったりというオフィシャルな文章・レポートを書く場合にはWikipediaの情報は慎重に扱うべきです。

ネット記事でもWikipediaの情報を基にしたと思われる記事が結構あると思います。さらに本人にも誤った情報が伝わってるケースもあるのです。

これは里崎氏の引退試合前にアップされたインタビュー記事です。
この中で

それは、1000試合以上出場捕手の中での捕逸の通算最小記録である。シーズン最多捕逸記録を持つ野村克也氏は、2921試合で207個(14試合に1個の割合)、古田氏は1959試合で104個(1/19試合)あったが、里崎は、1003試合の守備出場で、わずか19個、53試合に1個の割合である。

https://news.yahoo.co.jp/articles/1dc435b7ee903850a2af58e6e685ce0cb726658f
※2014年は捕手出場15試合で捕逸0なので最終スタッツは1018試合で捕逸20

という記載があります。

この時点でのWikipediaの情報がどうなっていたかWeb Archiveを調べましたが、やはり2004年の捕逸は空白でした。
ただ、通算のところも空白になっていたので、記事を書かれた方は自力で計算したんだと思います。

この記事の中で里崎氏本人も

ーー捕逸が歴代最小という素晴らしい記録を知っていましたか?
「ええ。でも特別なこととは思っていません。パスボールはノーバウンドのボールをミスしたときに記録されるもので、ワンバウンドを逸らしたボールは、ほとんどの場合、ピッチャーのワイルドピッチと記録されるんです。自分でサインを出しているんだから捕球するのは当たり前。サインミスなら仕方ないですが、僕からすれば19個でも多いくらい

https://news.yahoo.co.jp/articles/1dc435b7ee903850a2af58e6e685ce0cb726658f?page=1

「捕逸19」ということに関して特に疑問は持たなかったようです。
さすがに選手がみんな自分の全記録を把握しているとは限らないし、さらに守備の記録は特に情報が少ないので、これは致し方ないとは思います。

私もそうですが、おそらく多くのプロ野球ファンはこの記事を目にしていて、「里崎氏の通算捕逸=19個」という認識を持っていたのではないでしょうか。
ですので、実は私も日本プロ野球記録さんのサイトを見て捕逸20となっていたことに驚いたのです。

改めて「里崎智也 捕逸」でググるとわかると思うのですが、プロフィール説明で「通算捕逸19」と記載している記事は非常に多いのです。
先程も記載した通り、守備の通算記録の情報は極めて少なく、NPB公式でも確認できません(2005年以降のシーズンごとの数字はあります)。
ですので、通算本塁打や安打のように簡単に検索して確認が出来ない側面があるので、Wikipediaや先程の記事などから情報を取り出してしまっているのだと思われます。そこは同情の余地はあります。

しかし、やはり不明点があるデータを鵜呑みにした記事を大手メディアが安易に公開してしまうのは問題があると思いますし、ここまで訂正したメディアがおそらく無いというのも危機感を感じざるを得ません

プロ野球界隈もセイバーメトリクスを代表とするデータの時代に突入しており、さらなる正確性を求められる時代になっていると思います。
我々のようなデータクラスタでない方からすれば一からデータを集めることに抵抗があることは理解出来ます。
しかし、やはり正確なデータを得るには公式発表されたものを集計することが一番の近道なのです。
安易にWikipediaを始めとするネットの情報に縋りたくなる気持ちも理解できますが、メディア各位はぜひ「正確な情報の提供方法」について今一度お考えいただければと思います

長文失礼しました。おやすみなさい。

※補足

投稿内で引用した記事で「1000試合以上出場捕手の中での捕逸の通算最小記録」という記載がありますが、これは2014年時点であり、2015年に引退した藤井彰人氏がこの記録を上回っています。

この記事が気に入ったらサポートをしてみませんか?