回帰分析を学ぼう

ExcelとかRとかPythonなどさまざなソフトウェアで手軽に回帰分析は実行できる。加えて、回帰分析は直感的にもわかりやすい。
ただ、個人的には出力される結果をきちんと理解せずに使っていた。例えば、p値は0.05より小さければ問題無いとか、決定係数は1に近いほど当てはまりが良いといった程度の理解だ。p値の0.05が何を意味するのかとか、そもそも決定係数ってどのように求めるのかといったことはスルーしてきた。

多くのソフトウェアでは、回帰分析を実行すると推定結果以外に分散分析表、決定係数、F検定、RMSEなどを出力してくれる。
どうして分散分析表が出力されるのか?よくわからずに使っていた。

最近、改めて勉強し直して、分散分析表と各指標の関係を学び、理解を深めると共にその一連のストーリーの面白みを噛み締めている。

目的変数の変動が回帰と残差の変動に分解できるというのも面白いし、単回帰分析において決定係数が相関係数の二乗と等しくなるのも面白い。検定統計量のF値の算出も「そういうことか」と頷かされるし、これらの指標が分散分析表と繋がっている感じがなんとも言えない。ようやく分散分析表が表示される理由がわかったような気がする。

回帰分析がわからない、という人に、この面白さを伝えたい。

というか、初めて回帰分析を学んだ時の自分に教えてあげたい。笑

この記事が気に入ったらサポートをしてみませんか?