【論文レビュー】交差遅延モデルの基本的な考え方と特徴とは？：荘島他（2017）

2024年1月22日 06:21

本論文のタイトルは「縦断データ分析のはじめの一歩と二歩」というものです。タイトル通り、縦断研究をこれからやろうという立場にいる身として大変ありがたい入門的な内容でした。

荘島宏二郎, 宇佐美慧, 吉武尚美, & 高橋雄介. (2017). 縦断データ分析のはじめの一歩と二歩. 教育心理学年報, 56, 291-298.

縦断データ分析の利点

縦断データとは特定の対象に対して複数時点で収集したデータのことを指します。おそらく、私たちにとってより馴染みがあるのは横断データで、こちらはある一時点において複数の対象者から収集するものです。企業組織で行われるアンケートや市場調査などの多くは横断データです。

では縦断データを用いた分析を行うことにはどのようなメリットがあるのでしょうか。

　縦断データを収集することの利点としては具体的に、（１）興味ある変数に関する時間的な変化（発達・成長）の平均像や個人差について正確に知ることができること、（２）時間的な変化の個人差が他の変数からどのように予測・説明できるかを知ることができること、（３）縦断的に測定された複数の変数がある場合、それらの時間的な変化の関係性を知ることで、因果関係に迫った推論ができること、（４）（１）ー（３）に関する集団差が考察できること、といった点を挙げることができる。

p.291

これらの利点のうち、私が特に調べたい交差遅延モデル（cross-lagged model）は（３）の利点に関わる統計モデルとされています。私の今の理解力で他の統計モデルまで書くのはあまりにしんどいので以下では交差遅延モデルに絞ってまとめます。

交差遅延モデルの特徴

では交差遅延モデルとはどのような統計モデルなのでしょうか。

　縦断データ（または時系列データ）において、過去の自身のデータから現在の測定時点の値を予測・説明するための統計モデルとしては自己回帰モデル（autoregressive model）が有名である。交差遅延（クロスラグ）モデルは、２変数以上の縦断データがある場合の多変数の自己回帰モデルとして位置付けることができる。

p.293

前節で触れたように、交差遅延モデルの特徴は複数の変数間の因果関係を推定できることにあります。このような縦断データ間の関係性を予測するモデルなので自己回帰モデルに位置付けられるのです。

自己回帰モデル

ここまでで終わりでも良いのですが、では自己回帰モデル（autoregressive model）とはいったい何者なのでしょうか。私は恥ずかしながら聞いたこともないものなので早速GPT-4先生に聞いてみました。

GPT-4先生を疑うわけではないものの、どこまで正確かは怪しいのですが、自己回帰モデルは過去のデータが将来のデータに影響を与えると仮定して、過去のデータが将来のデータに対して自己相関（autocorrelation：データが時間的に依存関係にあること）を持つと捉えるモデルのようです。いやはや生成AIの恩恵は何かを初めて学ぼうとする人間にとって大きすぎますね。ありがたや。

この記事が気に入ったらサポートをしてみませんか？