ゴミ箱の中のメモ帳

まだ見ぬ息子たちへ綴る手記

統計はウソを吐く 人をだます統計法

「統計」と言う言葉をよく見るし、統計の結果だとして宣伝されている情報をよく見る。

知っておいて欲しいのは、統計はウソを吐くし、そもそも統計は人をだますための手段であるということを知っておいて欲しい。

私も統計情報はよく使わせてもらう。統計情報を使ったほうが人は信じやすいようで、私が言葉で説明するよりも統計情報を見せたほうが信じられる。

それ故に統計情報をよく利用しているが、そんな統計を信じるバカで浅はかな人間が多いことには正直驚いてしまう。

身の回りでも、携帯電話3キャリアがどこも「一番繋がりやすい、通信速度最速」と宣伝しているのを目にするだろう。本当に正しい統計を元に書かれているのであれば、最速者が二方以上いるはずがないのだ。

バカなあなたのために少し例を交えて説明しておく。統計用語のサンプルや標本などは使わないようにした。あなたにでもわかるように。

統計学が最強の学問である

統計学が最強の学問である


そもそも統計を見せられた時に、その統計が取られた背景と状況、統計の対象者を見ているだろうか。

例えば簡単には、「50%」と言う数字にも雲泥の差があり、二人から統計をとっても、四人から統計をとっても、一万人から統計をとっても対象が偶数である限りその数字には成りうるのだ。

日本人の人口が1億5000万人だとすると統計学的には2000人から統計をとればいい人数になるが(1万人なら1300人)、ここでもまた、年代という問題が出る。

日本人の統計を取ろうとして、10代の人間にのみ質問をしても意味がないのはわかるだろう。

そして、更に場所も重要だ。同じく日本人の統計を取ろうとして、長野市の人間のみ対象にしても全く意味がない。

例えば日本国民から統計を取る際は、「国民生活に関する世論調査 5 標本抽出方法 - 内閣府」を見たら、どのように統計の対象をを取得しているのかわかるかと思う。

このように統計と言っても日時や人数、年代、地域等、様々な要因で変化する値から取得する必要があるので、きちんとした情報が必要になる。

更に例えれば、「折りたたみ傘の携行率」と言う統計を取るのであれば、その統計を取った日の天気が雨なのか、晴れなのか、曇りなのかで全く状況は違う。統計にはその内容に応じて前提が付与されるべきなのだ。「晴れの日の折りたたみ傘携行率」のように。


簡単に説明しただけでこのように様々な要因から統計の結果は変化、操作することが出来ることがわかったと思う。そして、世間で公開されている統計の多くにはこれらの情報が書かれていない物が多く、その情報を確認しないまま統計値を鵜呑みにするバカが多い。

統計を見せられたら、それぞれの状況や、その状況を選択した事由を確認し、その妥当性について考えた上でその統計値を判断しなければならない。


またまた例えると、「iPhoneの普及率」については統計業者によって2倍以上の開きが出ている物もある。一度見た業者は、80%以上の数値をあげていた。だがその業者について調べてみると、iPhoneのアクセサリの制作、販売を行っている業者であった。

これはiPhoneの普及率を高く見せることで、集団心理を誘いiPhoneを購入させることや、Androidが選ばれていないことをアピールしたかったのであろう。


このような統計結果は、実際に統計を取らずに都合がいいように勝手に作られていることも多いが、実際に統計を取ったとしてもその値を操作し、iPhoneの普及率を90%以上にすることも簡単だ。

銀座Appleストアから出てくる人を対象に統計を取れば90%近くに普及率を上げることができるし、そもそも「iPhoneを操作している人間」を対象にすれば普及率を100%にすることもできる。統計値など、対象を操作することでいくらでも操作可能なのだ。

iPhoneの普及率を駅構内で取得するにしても、時間帯で学生やサラリーマンの比率が違うし、路線により都心に向かうか、田舎に向かうかによってユーザ層が全く異なる。


統計を正確に取ることは非常に難しく、その逆に、当てにならない統計は簡単に取得できるのだ。

正しい知識無くして統計を信じてはいけない。

完全独習 統計学入門

完全独習 統計学入門

マンガでわかる統計学

マンガでわかる統計学

1億人のための統計解析 エクセルを最強の武器にする

1億人のための統計解析 エクセルを最強の武器にする

「それ、根拠あるの?」と言わせない データ・統計分析ができる本

「それ、根拠あるの?」と言わせない データ・統計分析ができる本