見出し画像

【経済】わかる重回帰分析【成田悠輔】

 成田悠輔氏がコロナの補助金がコロナ患者を助けることに繋がらず、病院の補助金になっただけだった、という論文で使われたのが重回帰分析だ。

 その論文を読んだわけではないので、おそらく、であるが、You Tubeの今は無き「日経テレ東大学」で猪口邦子議員とのやり取りで分かった。

 できるだけカンタンに説明します。数式に抵抗感を持たないでください。

 y=β0+β1x1+β2x2x+・・・βρxρ+ε

 この式でyが被説明変数、xが説明変数です。
 これはβ0は定数項だから無視します。最後のε(イプシロン)も誤差項なので、ここではいったん無視します。

 yに助けられたコロナ患者を入れて、βに様々な要素を入れてコントロールするのが重回帰分析です。コントロールというのはβが上下したとき、yがどれだけ影響を受けるのかを知りたいのです。コロナ患者が助かるかです。

 猪口議員は単回帰分析と勘違いして「βが一つだけなら」と仰っておられましたが、成田氏は人種はもとより目の色までコントロールしたと言っていたのでかなり複雑な重回帰分析だと分かったのです。

 説明変数が十や数十ある重回帰分析は、「多重共線性」というワナがあって、例えば東大に入れる確率(y)を求める場合に親の年収(β1)と親の学歴(β2)が相関していると、見かけの説明力のみ上がってしまうのです。

 見かけの説明力ではなく、本当の説明力がどれくらいか、頑健性のテストを繰り返します。

 成田氏はコンピュータサイエンスと経済学のハイブリットと自称していましたが、何十という説明変数を扱う場合はもはや完全に理系のお仕事ですね。

 この式を導出するには最小二乗法というのがあるのですが、それはまた今度の機会に。ではまたお会いできるのを楽しみにしております。

よろしければ下の記事・マガジンも合せてお読みください。

・マガジン全16話完


この記事が参加している募集

仕事について話そう

お金について考える

計算式で分からない場合はノートに写してみてください。複数回かんがえても詰まったら、どこが分からないか言葉で書いて送ってください。理論もなにが疑問か聞いてください。返信します。