見出し画像

憧れるのはやめましょう!大谷選手の記録を超えるのは大谷選手しかいない!?ホームラン数の経過をWeb scrapingで図化する話2023


はじめに

こんにちは。
もはや、ありとあらゆるエンタメを超越したエンタメ性を見せている、ロサンゼルス・エンゼルスの大谷翔平選手。2023/7/18現在で35号のホームランをかっ飛ばし、2位に8本差を付けて独走状態にあります。その割には、なおエ、なのですが。移籍の噂も多くあり、やきもきするところです。

さて、2022/9/17のジャッジ選手と村上選手のホームラン数の経過をWeb scrapingで図化した話の記事で、pythonによるWeb scrapingの方法の記事を紹介しました。
今回は、それをほぼそのまま使って、今年の大谷選手の出場試合数ごとのホームラン数合計も出してみます。もっともコードはほとんど同じなので、詳しくは前回記事を参考にしてください。

村上選手の記録の代わりに、今年2023年の大谷選手のstatsと、ナショナルリーグで現時点でホームラン王 アトランタ・ブレーブスのマット・オルソン選手、アメリカン・リーグホームラン数2位 シカゴ・ホワイトソックのロバートJr選手のstatsを図示してみます。
実は前回の方法では、NPBの場合、当該年、つまり2023年の記録しかログを追えないのです。年ごとの集計値になってしまうので、排除したということもあります。

新規の追加コード

URLは以下の3つです。はじめの変数名は任意でOKです。

#大谷選手2023
urlOhtani23='https://baseballsavant.mlb.com/savant-player/shohei-ohtani-660271?stats=gamelogs-r-hitting-mlb&season=2023'
#オルソン選手(ブレーブス)2023
urlOlson23='https://baseballsavant.mlb.com/savant-player/matt-olson-621566?stats=gamelogs-r-hitting-mlb&season=2023'
#ロバートJr.選手(ホワイトソックス)2023
urlRobertJr='https://baseballsavant.mlb.com/savant-player/luis-robert-jr-673357?stats=gamelogs-r-hitting-mlb&season=2023'

これを次のような形で取り込むことができれば(dfOhtani23のところ)、あとは、pandasの文法に沿って整形し、他の選手の属性を結合してやればいいわけです。ここでキーはあくまで「本人の」出場試合数なのでご注意ください。「チームの」消化試合数がキーでも良いのですが。

driver.get(urlOhtani23)
wait = WebDriverWait(driver, 5)
wait.until(EC.presence_of_all_elements_located)
gamelogs=driver.find_element(By.CSS_SELECTOR,"#tab_gamelogs")
gamelogs.click()
wait.until(EC.presence_of_all_elements_located)
stats=driver.find_element(By.CSS_SELECTOR,'#div_gamelogs').get_attribute("outerHTML")
dfOhtani23 = pd.read_html(stats,header=0)[0]

出来上がったのがこの図です。日本の7/18までで大谷選手は93試合出場(2試合欠場)しています。同じ93試合の消化時点で見ると、大谷選手の2021年は奇しくも同じ35本でした。ジャッジ選手2022年は36本(最終的に62本)、ボンズ選手2001年は42本(最終的に73本)でした。(ボンズ選手の2001年の記録を見てみると、40試合前後のとき、6試合で9本という確変期があるのでそこで一気に伸びているようです。)

オルソン選手、ロバートJr.選手は92試合ですがそれぞれ30本、27本です。
ボンズ選手すごいですが、大谷選手は、二刀流だし、WBCの年だしということで、もはや漫画のようです。
残り何試合出場するのか、移籍するのかどうかによりますが、2022年のジャッジ選手並みのペースだと60本を超えることになり、もう期待しか有りませんね。
なおリーグを変わってしまうと、この数字は0になってしまうので、それだけは避けてほしいなと思いますが。。。どうでしょうか?

出場試合数ごとのホームラン合計数比較 赤が今年の大谷選手のペース
(大谷選手は2021と2023年、ジャッジ選手は2022年、ボンズ選手は2001年)
92,93試合出場時点の年間ホームラン数の比較
(左からジャッジ2022,大谷2021,大谷2023,オルソン2023,ボンズ2001,ロバートJr.2023)
NaNはまだその試合数に達してないことを意味する

まとめ

今回は、昨年秋のpythonでWeb scrapingをやってみた、の2023年版です。
実は題材はなんでも良くて、毎日更新される気象データで実施してみても面白いかもしれません。例えば50年前の7月の気温はどうだったのかなどなど。

終わりに

ここまでご覧いただき、ありがとうございました。

普段は北海道に本拠地を置くNPOに所属し、環境保全を主な題材としてGISやリモセンに関する仕事をしています。

コンサベーションGISコンソーシアムジャパン の活動もその1つです。
ご相談、ご質問、お仕事のご依頼などがございましたら、コンサベーションGISコンソーシアムジャパンWEBサイト掲載のメールアドレスまでメールをお寄せください。

コンサベーションGISコンソーシアムジャパンの活動及びこのnoteでの活動はボランティアで行っているのですが、何分資金が不足しています。
もしサポートしてもいいなという方がいらっしゃいましたら、そちらもよろしくお願いします。

noteの中の人は都内に居るので、お仕事などお声がけいただければと思います。

この記事が気に入ったらサポートをしてみませんか?