日刊紙「信用情報」で人気のコラムを毎週お届けします

シンプソンのパラドックス No.904

「世の中には3種類の嘘がある。嘘、大嘘、そして統計だ」という言葉がある。統計のあいまいさを皮肉ったものだ。

厚生労働省の「毎月勤労統計」の不正調査問題。この調査は、賃金や労働時間、雇用の動向を把握するためのもので、従業員500人以上の事業所は全数が対象となっているのに、東京都では、約1400事業所のうち3分の1、約500事業所しか調査していなかった。その結果、この統計をもとに算定される雇用保険や労災保険などが過少に給付されていて、追加給付の対象者は、延べ1973万人、30万事業所で総額567億5000万円にのぼる。また、事務手続きやシステム改修に200億円程度かかることが明らかになり、追加給付に関する費用は総額約800億円に膨らむ事態となっている。

そもそも多くの統計では全数を調査せず、一部のサンプルを抽出して、全体像を表すことがほとんど。テレビの視聴率やメディアの世論調査もサンプル数はごくわずかである。「毎月勤労統計」も従業員5~499人の企業は全国の約3万3000事業所を抽出して行う調査だが、統計学上は正しいそうだ。

統計には「嘘」ではないが、マジックのような側面もある。米国の統計学者E.H.シンプソンが提示した「シンプソンのパラドックス」と呼ばれるものである。たとえば男女合わせて100人のA校、B校2つの学校の成績をみると、男子の平均点はA校が60点、B校は55点でA校が5点高い。女子の平均もA校75点、B校70点でA校が5点高い。では全体の平均点が高く優秀な学校はどちらと問われると、男女とも高いA校と即断しがちだが「これだけではどちらか分からない」というのが正解。

なぜか。A校は男子が70人、女子は30人とすると平均点を掛け合わせ(60点×70人+75点×30人=6450点)これを100人で割ると64.5点。一方、B校は男子30人、女子は70人とすると、同じく男女合わせた平均点の合計(55点×30人+70点×70人=6550点)を100人で割ると65.5点でB校が全体の平均点は1点高くなる。「集団を2つに分けた場合、ある仮説が成立しても全体では正反対の仮説が成立することもある」というのがシンプソンのパラドックス。

統計には「嘘」ではなくても危うさが潜んでいる。まして「嘘」で固められた統計であれば、国を危うくする。