久留米大学の松尾先生が「
犯罪の9割は失業率で説明がつく」というエッセイを書かれています。
この中で出てくる推計の問題点については、ドクター矢野が「
線形回帰モデルの古典的仮定」で指摘をされ、松尾先生も同意されているので、関心のある方はご参照ください。
しかし、推定に問題がなかったとしても、松尾先生が、本当にタイトルどおり「犯罪の9割は失業率で説明がつく」とお考えであるなら、私は賛成できません。
松尾先生のエッセイから二つの引用をします。ゴチックによる強調は平家によるもの。
引用1
『
犯罪白書』に載っている「交通関係業過を除く一般刑法犯の認知件数」である。まず、これを、その年の失業率で単純に回帰させた結果が次のようになっている。
1953-2004(観測数52)
犯罪件数=749523.5+348753.6×その年の失業率
(15.4368) (19.1076)
括弧内はt 値である。重決定係数は0.879547、定数項と係数のp値はそれぞれ、1.17×10-20、1.25×10-24である。つまり、
犯罪件数の88%はこの式で説明がつき、(平家注 これを主張1とします。)本当は関係ないのに
たまたまこんなふうになった確率がこのp値しかないということ。統計的に有意も有意である。
引用2
おもしろがって調子にのって僕もやってみたのですが、一番よかったのはこれ。説明変数を二変数にした。ひとつは、その年の失業率。もう一つは4年前から6年前までの失業率の平均。するとこうなりました。
1959-2004(観測数46)
犯罪件数=577410+229763×その年の失業率+225657×4年前から6年前までの失業率の平均
(12.69) (10.66) (6.70)
重決定係数は0.947707、定数項、第一係数、第二係数のp値はそれぞれ、3.93×10-16、1.21×10-13、3.46×10-8であった。やはり十分有意である。
犯罪数の実に95%は失業率だけで説明がついてしまう(平家注 これを主張2とします。)わけである。
主張1と主張2はぜんぜん意味が違います。
一方の主張1は、重決定係数の値から、式の説明力が著しく高いことを主張したものです。これはまったく正しい。
他方、主張2は、同じく重決定係数の値から、式に含まれている変数の説明力が著しく高いことを主張したものです。これは正しくないと、私は信じます。
式の説明力を変数の説明力と混同してはいけないはずです。こんな例があったとします。
仮想例期間 | 犯罪発生件数(万件) | 失業率(%) |
---|
Ⅰ | 101 | 1 |
Ⅱ | 102 | 2 |
Ⅲ | 103 | 3 |
Ⅳ | 104 | 4 |
Ⅴ | 103.5 | 3.5 |
犯罪発生件数をY、失業率をXとして、Y=a+bXという式を作り、このデータから推定を行うと、こういう結果が出ます。
Y=100+1×X
決定係数は1になります。どの期をとっても推定誤差はゼロ。式の説明力は完全です。
したがって、この式を元に失業率が10%になれば犯罪発生件数は110万件に増えてしまうと考えてもいいでしょうし、失業率をゼロにできれば、犯罪発生件数を100万件に抑えられると考えていいでしょう。
しかし、この例からも分かるとおり、失業率が10%という高い水準になったとしても、犯罪発生件数のうち失業率で説明できるのは10万件、全体の1割にも足りません。犯罪100万件分は、失業率とかかわりなく発生しているのです。
式の説明力を示す決定係数は、従属〔被説明〕変数(この場合は犯罪発生件数)の変動のどれぐらいの割合が独立〔説明〕変数の変動によって説明できるかを示すもので、従属変数そのものを独立変数で説明できるかを示すものではありません。
ここをクリック、お願いします。
人気blogランキング
人気blogランキングでは「社会科学」では40位でした。