【心理統計】#2 重回帰分析

(最終更新 : 2019.5.25)

部分相関係数と偏相関係数

部分相関係数 (part correlation coefficient)
・相関を求める2つの変数のうち、1つの変数が第3の変数の影響を除いたものであるとき、その相関係数を部分相関係数と呼ぶ。

偏相関係数 (partial correlation coefficient)
・相関係数を求める2つの変数のそれぞれから、共通の第3の変数の影響を除くとき、その相関係数を偏相関係数と呼ぶ。

偏回帰係数

偏回帰係数 (partial regression coefficient)
・ある独立変数から他の独立変数の影響を除いた残差変数によって、従属変数(または従属変数から他の独立変数の影響を除いた残差変数)を予測するときの回帰係数のこと = 残差どうしの回帰係数
・複数の独立変数によって従属変数を予測するときに、個々の独立変数にかかる係数。

・「x1をとりあえず動かしてみたらy(の予測値)がどう変わるか」ということを示しているのが単相関。
「他の独立変数を一定にした上で,x1を動かしてみたらyがどう変わるか」という、x1からyへの直接的な効果を示しているのが偏回帰係数。
☆単相関=直接効果(偏回帰係数)+間接効果

標準偏回帰係数 (standardized partial regression coefficient)
・標準化されていて、測定単位の影響を受けない偏回帰係数のこと。

偏回帰係数の解釈
・影響を取り除く変数 (x1) と独立変数 (x2) の相関が高いほど、残差変数 (x2/x1) と x2 の相関が低くなり、影響を取り除く前後で、変数が意味するものが異なる。
・偏回帰係数の解釈においては、影響を取り除く他の独立変数の内容、およびそれらと当該の独立変数との相関関係をふまえて、残差変数の具体的な意味について考える必要がある。
・偏回帰係数のより深い解釈のためには、独立変数と従属変数、独立変数間の相関係数が必要になる。

重相関係数

重相関係数(R)
・従属変数 y と最小二乗法によって得られた予測値 y^ (yハット) との相関係数
・独立変数群の1次式で与えられる変数と従属変数との相関のうち最大のもの
→個々の独立変数と従属変数との相関係数(の絶対値)を下回ることはない

重相関係数を規定するもの
・それぞれの独立変数と従属変数の相関によって規定 。
→単独でも高い予測力を持つ変数を独立変数として用いるのが有効
・独立変数相互の間の相関係数(内部相関)が低い = 予測に用いる変数が互いに類似した冗長なものでない ほど、より正確な予測が可能
・重相関係数が統計的に有意でなければ、帰無仮説の棄却ができない。
→詳細な分析に進むための最低限の条件

重決定係数
・従属変数の分散のうち何%を独立変数が説明しているかを表している指標。
・重相関係数を二乗して求められる!

その他

多重共線性
・独立変数間の相関が高すぎる場合に、偏回帰係数の推定量が不安定になる(ひ標準誤差が大きくなる)。
→研究の目的にとってそれらの独立変数のすべてが必要なのかという吟味を行い、重要度の低い変数を削除するなり、複数の変数を合成してまとめるなりの工夫が必要

回帰分析の注意点
・回帰分析は因果関係を表しているわけではない。
・独立変数間に相関がある場合、偏回帰係数の解釈を目的とする場合には、独立変数の数は2つにとどめることが望ましい(豊田, 1998)。

・変数間の「相関関係」(正確には分散と共分散)によって回帰係数が決定されており、本質は「相関係数(の関数)」と言える。
・相関係数に関する注意点はすべて回帰分析の注意点に当てはまる。

・直線的な関係しか見ることができない(非線形回帰という手法で解決可能)
・グループによる分割が結果を変えてしまう可能性をもっている
・希薄化(ただし共分散構造分析を使うという手もある

参考・引用文献

書籍・論文
・南風原 朝和. (2002). 心理統計学の基礎 統合的理解のために. 有斐閣アルマ.

インターネット上の記事
重回帰分析について (村山先生)
cikit-learn : pythonで重回帰分析をやってみた

この記事が気に入ったらサポートをしてみませんか?