見出し画像

①競馬の過去データを集める。【競馬ビギナーは三連単的中の夢を見れるか】

ダービーでビギナーズラックあてた競馬素人が
独学の機械学習で予測して競馬三連単的中を目指してます。

その後……

鳴尾記念 1,300円➡0円
安田記念 3600円➡0円
エプソムカップ 2000円➡0円
マーメイドS+ユニコーンS 5000円➡0円
宝塚記念 3500円➡0円
CBC賞+ラジオNIKKEI賞 2000円➡0円
……(ノД`)・゜・。

と、調子に乗って続けたら
ダービーの払い戻し以上に大負けしてしまいまして。

予想って難しいですね(失った金額から目をそらしながら)

さて今回は、機械学習で利用するデータを探します。
Googleとかで「競馬 データ」で検索すると、

まず出てくるのが、
netkeiba.comの『競馬データベース』

ここは競走馬やレースはもちろん、
騎手、調教師、馬主、生産者もデータ化されてるのでいろいろな情報を集められそう。
ただ、情報が膨大なので使うデータを選んで拾っていかないと時間がかかりそうな感じがする。

次に出てきたのが、
競馬ラボの『競馬データベース』

こっちのは、サイトを訪れたユーザーによるレビューなどがないのでnetkeiba.comのデータと比べると若干はシンプル。
データの項目はnetkeiba.comとあまり変わらないようなので、どちらをとっても問題なさそう。

次に検索結果にあるのが、
JRA-VAN データラボ|競馬予想・競馬情報ならJRA-VAN

これは見ての通り、JRA(日本中央競馬会)の公式データ。
ただ、ここはレースのみで競走馬個別のデータが見られなさそう。
あと、前の2つに比べてデータを取得しにくそうでもある。

そのあとに、
JRA-VANの有料データ提供サービスなどが続く。


ここまで調べて(というか、いつも参考にしてるので)、
使い勝手が良さそうなnetkeiba.comさんからデータをお借りしようと思います。

次は、どんなデータをスクレイピングするか考えようと思います。




この記事が気に入ったらサポートをしてみませんか?