「犯罪の９割は失業率で説明がつく」のではないと思います。

久留米大学の松尾先生が「犯罪の９割は失業率で説明がつく」というエッセイを書かれています。この中で出てくる推計の問題点については、ドクター矢野が「線形回帰モデルの古典的仮定」で指摘をされ、松尾先生も同意されているので、関心のある方はご参照ください。しかし、推定に問題がなかったとしても、松尾先生が、本当にタイトルどおり「犯罪の９割は失業率で説明がつく」とお考えであるなら、私は賛成できません。松尾先生のエッセイから二つの引用をします。ゴチックによる強調は平家によるもの。引用１『犯罪白書』に載っている「交通関係業過を除く一般刑法犯の認知件数」である。まず、これを、その年の失業率で単純に回帰させた結果が次のようになっている。 1953-2004(観測数52) 犯罪件数＝749523.5＋348753.6×その年の失業率　　　　　(15.4368)　(19.1076) 　括弧内はt 値である。重決定係数は0.879547、定数項と係数のp値はそれぞれ、1.17×10－20、1.25×10－24である。つまり、犯罪件数の88%はこの式で説明がつき、（平家注　これを主張１とします。）本当は関係ないのにたまたまこんなふうになった確率がこのp値しかないということ。統計的に有意も有意である。引用２おもしろがって調子にのって僕もやってみたのですが、一番よかったのはこれ。説明変数を二変数にした。ひとつは、その年の失業率。もう一つは4年前から6年前までの失業率の平均。するとこうなりました。 1959-2004(観測数46) 犯罪件数＝577410＋229763×その年の失業率＋225657×4年前から6年前までの失業率の平均　　　　　(12.69)　(10.66)　　　　　　　　　(6.70) 　重決定係数は0.947707、定数項、第一係数、第二係数のp値はそれぞれ、3.93×10－16、1.21×10－13、3.46×10－8であった。やはり十分有意である。犯罪数の実に95%は失業率だけで説明がついてしまう（平家注　これを主張２とします。）わけである。主張１と主張２はぜんぜん意味が違います。一方の主張１は、重決定係数の値から、式の説明力が著しく高いことを主張したものです。これはまったく正しい。他方、主張２は、同じく重決定係数の値から、式に含まれている変数の説明力が著しく高いことを主張したものです。これは正しくないと、私は信じます。式の説明力を変数の説明力と混同してはいけないはずです。こんな例があったとします。 仮想例

期間	犯罪発生件数（万件）	失業率（％）
Ⅰ	１０１	１
Ⅱ	１０２	２
Ⅲ	１０３	３
Ⅳ	１０４	４
Ⅴ	１０３．５	３．５

犯罪発生件数をY、失業率をXとして、Y＝a＋ｂXという式を作り、このデータから推定を行うと、こういう結果が出ます。 Y=１００＋１×X 決定係数は１になります。どの期をとっても推定誤差はゼロ。式の説明力は完全です。したがって、この式を元に失業率が１０％になれば犯罪発生件数は１１０万件に増えてしまうと考えてもいいでしょうし、失業率をゼロにできれば、犯罪発生件数を１００万件に抑えられると考えていいでしょう。しかし、この例からも分かるとおり、失業率が１０％という高い水準になったとしても、犯罪発生件数のうち失業率で説明できるのは１０万件、全体の１割にも足りません。犯罪１００万件分は、失業率とかかわりなく発生しているのです。式の説明力を示す決定係数は、従属〔被説明〕変数（この場合は犯罪発生件数）の変動のどれぐらいの割合が独立〔説明〕変数の変動によって説明できるかを示すもので、従属変数そのものを独立変数で説明できるかを示すものではありません。ここをクリック、お願いします。人気blogランキング人気ｂｌogランキングでは「社会科学」では４０位でした。