競馬予想におけるデータの落とし穴

競馬予想におけるデータの落とし穴

皆さんはどのように競馬予想をされていますか? 血統、ラップ、調教、コース、騎手、厩舎・・・etc。世の中には色々な予想の仕方が存在しますよね。

かく言う私は毎週データを取って競馬予想をしています。相性の良い血統、相性の良いローテーション、相性の良い騎手等、今の時代調べれば簡単に出てきますよね。

でも私はどんな数字が出てこようとも、それをそのまま予想に利用するということはしません。少し昔の話になってしまい恐縮ですが、2017年の皐月賞でデータを調べていた際、過去15年前走毎日杯組は[0-0-0-20]というデータがありました。

しかし私は前走毎日杯に出走していたアルアインに◎を打ち、見事単勝20倍を的中することが出来たのです。そのデータが浸透していたかは分かりませんが、同馬の実績を考えれば不当な倍率だったと今でも思っています。

ではなぜ私はアルアインに◎を打てたのか?
理由は大きく分けて3つあります。

1つ目はアルアインがシンザン記念で不利があって負けた以外は全勝していて、能力を見せていた。

2つ目はディープの子供は新鮮だと強くて、まだ初G1のアルアインにはぴったりな舞台だった。

3つ目は[0-0-0-20]というデータの中にアルアインが存在しているわけではなかった。

3つ目に関しては当たり前じゃねーか!と思われた方もいるかもしれませんが、データとはある種そういう側面も持っていると思っています。つまりデータはあくまでも過去の積み重ねであって、今現在のものではないということです。ではちょっと話を変えましょう。

例えばここに東京芝1600m[2-1-0-0]という成績の馬がいたとします。競馬新聞にもコース実績という名目でデータとして扱われています。

「この馬は東京が得意だから買い!」
毎日競馬を取材している記者さんたちも平然と書いていますよね。

でもよく考えてみて下さい。これは本当に信用足り得るものなのでしょうか? たった3戦ですよ。心理統計学を扱うテレビ番組でこんなシーンがあったとしたらどうでしょう。

A「仲の良い夫婦にアンケートを取ったら、66%の人が毎日○○○をしていたんだ」

B「へ~そうなんだ! ちなみに何組くらいにデータを取ったの?」

A「3組さ!」

どう思いました? 絶対もっと100組とか200組とかデータ取れよ!って思ったと思います(話が進まないのでそういうことにして下さい笑)。でもこと競馬においては平然と3~4回の成績がデータとして成り立ってしまっているんですね。

先程のデータが取られたときの条件は多種多様です。いつ? 相手は? 頭数は? 馬場状態は? 展開は? 騎手は?

確かに実際東京が得意な馬もいて、東京で実績を残しているケースもあるでしょう。でもそれが未勝利戦のものだったら? 何年も昔のものだったら?

今回は良馬場で行われるのに、重馬場でのものだったら? 今回は多頭数なのに、少頭数でのものだったら? 今回は若手の減量騎手なのに、一流騎手でのものだったら?

仮に今回大惨敗を喫したとして、東京芝1600mが[2-1-0-1]になったら、それは得意、不得意どっち?

これらって数字だけ見て考えたって無駄なんです。いや考えているならまだマシな方で、そのまま数字を鵜呑みにしてしまうのが一番危険です。

でもせっかく競走馬が戦績を残してくれているわけですから、利用しない手はないですよね。私も別にデータ予想自体を否定しているわけではありません。だって私自身毎週データを取って予想してますからね。

何が言いたいかというと、重要なのは数字ではなく中身だということなんです。どういう過程を経てその数字に行き着いたのかを分析するのが競馬予想の醍醐味だと思っています。

東京芝1600m[2-1-0-0]だから買い!は、もう今日で卒業しましょう。数字に騙されない目を養って下さい!私も頑張ります!!

記事がためになりましたら、ご支援いただけたら嬉しいです。ご支援はMラジのサーバー代、ステッカー代等の維持費に使わさせていただきます(^^)