【論文レビュー】交差遅延モデルの基本的な考え方と特徴とは?:荘島他(2017)
本論文のタイトルは「縦断データ分析のはじめの一歩と二歩」というものです。タイトル通り、縦断研究をこれからやろうという立場にいる身として大変ありがたい入門的な内容でした。
縦断データ分析の利点
縦断データとは特定の対象に対して複数時点で収集したデータのことを指します。おそらく、私たちにとってより馴染みがあるのは横断データで、こちらはある一時点において複数の対象者から収集するものです。企業組織で行われるアンケートや市場調査などの多くは横断データです。
では縦断データを用いた分析を行うことにはどのようなメリットがあるのでしょうか。
これらの利点のうち、私が特に調べたい交差遅延モデル(cross-lagged model)は(3)の利点に関わる統計モデルとされています。私の今の理解力で他の統計モデルまで書くのはあまりにしんどいので以下では交差遅延モデルに絞ってまとめます。
交差遅延モデルの特徴
では交差遅延モデルとはどのような統計モデルなのでしょうか。
前節で触れたように、交差遅延モデルの特徴は複数の変数間の因果関係を推定できることにあります。このような縦断データ間の関係性を予測するモデルなので自己回帰モデルに位置付けられるのです。
自己回帰モデル
ここまでで終わりでも良いのですが、では自己回帰モデル(autoregressive model)とはいったい何者なのでしょうか。私は恥ずかしながら聞いたこともないものなので早速GPT-4先生に聞いてみました。
GPT-4先生を疑うわけではないものの、どこまで正確かは怪しいのですが、自己回帰モデルは過去のデータが将来のデータに影響を与えると仮定して、過去のデータが将来のデータに対して自己相関(autocorrelation:データが時間的に依存関係にあること)を持つと捉えるモデルのようです。いやはや生成AIの恩恵は何かを初めて学ぼうとする人間にとって大きすぎますね。ありがたや。
この記事が気に入ったらサポートをしてみませんか?