ベイズの定理
がんの人が要精密検査とされる率は約90%だという。これはつまり「健康診断で胃X線検査が要精密検査だった場合、胃がんの可能性が非常に高い」と言えるのか。
この場合、次の仮定をたててみる。
①「がんにかかっている人」1000人に1人(0.1%)
②「がんの人が要精密検査になる率」90%
③「本当はがんではないのに、精密検査に回される率」10%
・がんで陽性反応あり:0.1%×90%=0.09%
・がんでないのに陽性反応あり:99.9%×10%=9.99%
陽性反応がでる率は0.09%+9.99%=10.08%
この内、がんにかかっている確率は0.09/10.08=約0.9%
健康診断で胃X線検査が要精密検査だった場合に、実際にがんである確率は1%にも満たない。このように、結果から原因の確率を計算する定理を「ベイズの定理」という。人はインパクトのある数字を見ると、確率的に稀な事を過大評価してしまいがちである。「個々の比率だけを見て、全体の比率を見ない」のは、本質を見誤る原因である。
バースデーパラドックス
あるクラスに23人の生徒がいる。彼・彼女らの内、同じ誕生日の人がいる確率は何%か。この確率は50.7%もある。
まず23人の中で「あなたと同じ誕生日の人」がいる確率は約6.1%に過ぎない。私達が最初に頭に思い描くのは「自分と同じ誕生日の人」がいる確率で、それは確かにとても小さい。ところが23人の人がいる時、「どの誕生日でも良いから、同じ誕生日のペアが1組以上になる確率」であり、そもそも前提が異なる。
一般にn通りある場合、50%になるのは、およそ1.18√n人集めた時になる。1.18√365=22.5人となる。
平均
100回サイコロを振るといった、不規則な数字でも、たくさんの回数で平均を取ってみると、だんだんと真の平均値に近づいていく。これを「大数の法則」と言う。
(1+2+3+4+5+6)÷6=3.5
サイコロを振る回数を増やしていくにつれ、徐々に3.5に近づいていく。この大数の法則には必ず「前提」がある。その前提は「真の平均が存在する」という事である。数学には「真の平均が存在しない」場合がある。
例えば、ダーツ実験によると、極端に0から外れた値が出るため、大数の法則が成り立たない。つまり、平均が存在しない事になる。