サンプル数と賭け

◆近頃の批判の1つに、私が予想TVなどで、「種牡馬データはサンプルが少ない方が、傾向を掴む上では役に立つことが多い」と発言したことを取り上げて叩いている人が少なからずいて、統計学を知らないのか、などという声もあるようだ。

という文章を水上学さんのブログで読んで考えるヒントを頂いたので、すこし書いてみる。今週のうちに ( 水上学公式ブログ 白線の内側)という記事。

一般にはサンプル数を増やせば統計的な結果の信頼性は上がるとされる。しかし、「賭け」という場面での「信頼性」とは何なのか。

単純な例を挙げると、ある種牡馬の産駒が阪神芝 1600m を 10 回走って 4 勝している時点でと、それから何年か後にデータが溜まって 100 回走って 40 勝している時点とでは、統計的な信頼性は後者の方が高い(ということに、とりあえずは同意しておく)。しかし、じゃあ実際に単勝を 10 万円、どちらかのデータを理由として「賭け」なきゃならないとなれば、私なら前者に賭けるだろう。たとえオッズが同等でも。

別の例を挙げると、ある G1 で近 3 年で 2 回内枠の馬が上位を独占しているという時点と、それから 6 年後に近 9 年で 6 回内枠の馬が上位を独占しているという時点では、内枠の馬を狙う「賭け」としてはどちらのほうが「信頼性」が高いのか。

前者の例にもどると、 10 回走って 4 勝というデータが 11 回走って 5 勝になる確率と、 100 回走って 40 勝というデータが 101 回走って 41 勝になる確率とではどちらが高いのか。あるいは 110 回走って 50 勝になる確率はそれらとの関係でのどこに位置づけられるのか。

そもそもそれらが数値化可能なのかどうか、可能ならばどう算出するのか、私は知らない。ただ、前記 3 つの確率を馬券に活かせる場面ってのは考えることができる。馬券を買っているひとなら、それぞれがそれぞれの馬券イメージを抱けると思う。そのイメージには、さきほどのような数字を信じている誰かの裏をかくという場面だって含まれるだろう。

昨日たまたま読みはじめたケインズの『確率論』に、次のような文章があった。

(…) というのは、新しい証拠はわれわれに新しい確率を与えるのであり、古い確率についてのより充実した知識を与えるのではないであろうからである。(…)( 35 頁)

いろいろと考えることがあるのは楽しい。経験からの思い込みが確認されても否定されても、どちらでも充実感がある。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です