ビッグデータ時代には、間違った分析によって、間違った理論が出てくる事も多い。統計的に導かれた答えが本当に事実なのか、統計の嘘を見抜くためのリテラシーが必要であると説き、様々な統計的な嘘を事例を紹介している一冊。
■統計リテラシーが必要である
データはどの部分に注目するかによって、分析結果が正反対になる。重要なのは、どれだけ多くのデータを分析するかではなく、どのように分析するかだ。データ分析は厄介な仕事で、常に正しい答えを出せる人などいない。なぜなら、完全な情報は存在しないからだ。
ビッグデータは基本的に、因果関係について何かを語るものではない。データの洪水が、隠れていた因果関係をさらけ出すというのは、ありがちな誤解だ。例えば、ウェブ上のログデータは混沌とした世界だ。あるサイトのトラフィックを2つの業者が解析すれば、導き出された数字が一致する事はまず考えられない。その差は20〜30%に及ぶ時もある。
ビッグデータをもてはやす人々は、データが多いほど的確な分析が増えると思いがちだ。しかし、より多くの人がより多くの分析をより迅速に行えば、より多くの理論や視点が生まれ、複雑さや矛盾や混乱が増えて、明晰さや意見の一致や信頼度が薄れる。少なくとも私たちは賢い消費者にならなければならない。そのためには統計のリテラシー「ナンバーセンス」が必要である。
変数の種類が増えれば増えるほど、最もらしい分析が幾何級数的に増え、誤差や矛盾が生じる可能性もそれだけ増える。データの量が多ければ、議論や検証、調整、反復可能性の計測などに要する時間は必然的に増え、それだけ疑問や混同が生じる。ビッグデータは、私たちを前進させるのではなく、後退させかねない。問題のあるデータをかき集めれば、問題のある理論が裏付けられ、正しい理論がかき消される。
だからこそ、より賢い消費者にならなければならない。そのためには統計リテラシー、すなわち「ナンバーセンス」が必要である。
著者 カイザー・ファング
アメリカの衛星放送会社シリウスXMラジオの統計学者。 ニューヨーク大学非常勤教授。 統計的手法を広告やマーケティング、消費者行動に適用する統計のプロフェッショナル。10年を超えるキャリアをもつ。 ブログJunk Chartsは、マスメディアに登場するデータやグラフィックの批判的検証という新しい研究領域を切り開いたとして高く評価されている。
帯 作家 エリック・シーゲル |
帯2 ハブソン大学教授 トーマス・H・ダベンポート |
帯3 作家 トム・ピーターズ |
マインドマップ的読書感想文 smooth |
章名 | 開始 | 目安 | 重要度 |
---|---|---|---|
プロローグ | p.9 | 14分 | |
1 なぜロースクールの学長はジャンクメールを送り合うのか? | p.30 | 31分 | |
2 違う統計を使えばあなたの体重は減るだろうか? | p.74 | 18分 | |
3 客が入りすぎて倒産するレストランはあるか? | p.100 | 17分 | |
4 クーポンのパーソナライズは店舗や消費者の役に立つか? | p.124 | 17分 | |
5 なぜマーケターは矛盾したメッセージを送るのか? | p.148 | 15分 | |
6 失業率の増減をあなたが実感できないのはなぜか? | p.170 | 21分 | |
7 誰がどうやって物価の変動を見極めているのか? | p.200 | 18分 | |
8 コーチとGMどちらが勝敗のカギを握るか? | p.226 | 23分 | |
エピローグ | p.259 | 9分 |
ヤバい経済学 [増補改訂版] [Amazonへ] |
まぐれ―投資家はなぜ、運を実力と勘違いするのか [Amazonへ] |
ブラック・スワン[上]―不確実性とリスクの本質 [Amazonへ] |