統計を見る上で気を付けたい4つのこと。
明日食べるべきベストな晩御飯も「統計学」で決められるんじゃないか? という勢いで、神のお告げのごとく、世の中あらゆる事に統計学が用いられていますよね。
で・す・が、多くの人が統計を根本的なレベルで大きく読み違えやすいと、lifehackerが警鐘を鳴らしています。
統計を読み違えず、意味あるものにするための4つの原則は以下より。
【大きな画像や動画はこちら】
---------------------------------------
1.基準率の錯誤
「基準率錯誤」と呼ばれる統計の読み間違いの例を挙げてみましょう。
ある会社では、従業員の25%が女性で、75%が男性だとします。表面的には、この会社は男性に偏った採用をしているように見えるかもしれません。なぜなら、(少なくとも米国では)男女の人口分布はほぼ同じだからです。ですが、この見方は応募者の内訳を考慮していません。もし女性の応募者が全体の10%しかいなければ、採用率は男性よりも女性のほうが高いことになります。
---------------------------------------
---------------------------------------
2.「昨日は夫0人、今日は1人、なら明日は...」:外挿法
既知のデータに基づいて未知の事柄を推定する「外挿法」は、経済動向や将来の予測によく使われる統計的手法のひとつ。「過去の一定期間にわたってこういうことが起きているのだから、今後もそうなるだろう」という考え方です。けれども、その考え方がいつも正しいとは限りません。過去の傾向を分析する時は、その傾向を生んだ要因がこの先変化する可能性を心に留める必要があります。
---------------------------------------
---------------------------------------
3.でも、因果関係がある可能性は検討すべき:相関関係と因果関係の混同
「相関関係は因果関係を含意しない」という原則は、統計の読み間違いに関する話題の際に、古くからたびたび引用されます。
相関関係と因果関係の混同は古くから見られ、ラテン語の決まり文句「cum hoc ergo propter hoc」(それとともに、そしてそれ故に)もあるほどです。ただし、見過ごされがちですが、これは裏を返せば「相関関係は因果関係の可能性を示唆する」ということでもあります。外挿法の項目でも引用したウェブコミック「xkcd」には、「相関関係は因果関係を含意しないけれども、因果関係のほうを指差しながら思わせぶりに眉を動かし、口の動きで『あれを見て』と伝える」と書かれています。
---------------------------------------
---------------------------------------
4.「米国人の賃金は上昇している」のからくり:シンプソンのパラドックス
「シンプソンのパラドックス」と聞くと何だか難しそうですが、要は計算上のトリックのようなものです。簡単に説明しましょう。
あるグループをいくつかのサブグループに分割して、それぞれのデータを調べた場合に、ある傾向が見られたとします。ところが、グループ全体について同じデータを調べると、まったく反対の傾向が見られることがあるのです。例えば米国では、インフレ調整後の賃金メジアン(中央値)は、2000年以降上昇を続けています。ところが、学歴ごとのサブグループに分けてみると、どのサブグループでも、賃金メジアンは下がっているのです。
シンプソンのパラドックス(と言うより、事実上すべての統計データ)に対して取るべき最善策は、データの文脈に立ち返って情報を用いることです。統計は数字を多用しますが、もともと現実世界の展開や状況を分析するために使われるものです。現実と切り離してしまえば、統計にはあまり価値はありません。
---------------------------------------
ただ数字を弄くり回すのではなく、現実の人々や状況と結びつける努力がなければ、無意味なものになりかねないということでしょうか。下記リンクのlifehackerでは、より詳しく解説していますので、気になった方は是非ご覧ください。
統計にダマされないための4つの原則[lifehacker]
(ロバーツ町田)
関連記事
-
重力剛を制す。『ハーフライフ』の「グラビティガン」の威力を証明するショートムービー
-
一覧へ
-
カワバンガ! 家具付きの家を買ったら『スターウォーズ』と『ニンジャ・タートルズ』の凄いコレクションがついてきた