応用統計講座_中間レポート
どうも!
セイタです!!
北京大学社修士課程で社会学を学んでいます。
この記事では2023年春学期に受講した《応用統計講座(高级统计专题)》という授業の中間レポートについて書いていきます!!概略について興味のある方は以下の記事をご覧ください。
この中間レポートはこの授業の成績の30%を占めており、そこそこ重要なため、ある程度しっかりと取り組みました。
レポート課題概略
中間レポートの課題は実際に定量分析を用いた研究を真似してみるといった内容です。先生曰く、「統計の一番の方法はまねること」だそうです。なので、実際の研究をまねてみることがこの授業では求められました。
レギュレーションとしては
・真似した論文の典拠を示すこと
・どのような過程でデータを算出したかを示すこと
・自分の出力結果と元のデータで違いが生じた場合は、原因を探ること
・研究内容に評価を下すこと
です。
レポートへの取り組み方
ここからいよいよどのようにレポートに取り組んだかについて書いていこうと思います。
模倣する対象の研究の探し方
自分はこの授業を履修していたタイミングで、北欧の経済学博士より以下の本を紹介してもらい、読み進めていました。
世銀のエコノミストが発展途上国に対する援助が如何に非効率であったかを述べています。開発経済の理論と実践を具体例を基に学べて、非常にためになりました。
自分は上記の本で取り扱われていた発展途上国における希望出生数と合計特殊出生率の関係性を示した下記の論文を題材にしました。
論文の内容としては、20世紀末の発展途上国の「各国間の出生率の違いの約90%は欲しい子供の人数によって説明できる」と言ったものです。家族計画や避妊方法の普及はほとんど意味がなかったと述べられています。
この研究を選んだ理由は簡単な統計手法しか使っていないのと国別データという非常に入所し易いデータが使われていたからです(笑)
また、先生が人口学の先生だったのも決め手の1つです。
レポートの概略と背景
まず、レポートの要約としては以下のものになります。
最初に自分がこの研究を選んだ理由や研究が行われた当時のバックグラウンドを簡単に説明しました。なにしろ1994年の研究なので現代とは文脈が全然違いますから。
定量分析の前処理と結果
その後はデータの取得元とどのような変数を使ったのかの説明です。変数は「合計特殊出生率」「出生意向」「家族計画得点」「避妊普及率」の4つという非常にシンプルなモデルです。
前者二つのデータはThe International Statistical Institute (ISI) が実施しているThe World Fertility Survey program(WFS)から取りました。
家族計画得点は"Robert J. Lapham and W. Parker Mauldin:《Family Planning Program Effort and Birthrate Decline in Developing Countries》International Family Planning Perspectives 1984年10卷4号"が各国の家族計画を得点化した研究から取りました。
避妊の普及程度に関しても同じ著者の"Robert J. Lapham and W. Parker Mauldin:《The Influence of Organized Family Planning Programs》Studies in Family Planning 1985年16卷3号"よりとりました。
データは国ごとのマクロデータだったので、扱いやすかったのですが、いかんせん古い論文が多く、電子データがなかったためすべて手作業での集計となり、地味に時間がかかりました。。
そのようにデータをそろえた後に、回帰分析を行った結果以下のような出力を得ることができました。
DTFRというのが希望出生数なのですが、非常に高い説明力を持っていることが分かります。なお、元の研究とほぼほぼ一致しています。また、オリジナルの研究では単純な回帰分析に加えて、固定操作法を用いて頑強性のチェックもされていましたが、ほぼ結果が変わらなかったので、割愛しました(笑)
まとめ
最後に、この研究の問題点と限界についてサラッと触れています。
問題点としては、平均寿命や都市化比率、平均GDPといった社会経済変数がコントロールされていないので、それがどのような影響を及ぼすかが未知数な点です。
※下記図参照
限界としては、発展途上国を対象にしているため、先進国への説明力を有さない点です。また、中国は桁外れに家族計画スコアが高いのですが、その場合にどのような影響があるかは別途研究する必要があります。なおこの授業を行っている李健新先生の別の研究では一人っ子政策(極端な家族計画)の影響について述べられています。
以上のような形で自分は模倣という課題に取り組みました。
このレポートで使った参考文献は以下の通りです。
レポート執筆にかかった時間
プレゼン準備トータルでは12時間かかっています。
なお、この時間は『エコノミスト 南の貧困と闘う』や《Desired Fertility and the Impact of Population Policies》を読んだ時間は含めておりません。レポートのための定量分析とレポート執筆にかかった時間になります。
また、応用統計講座の授業中で課題として課された中間発表に関しては以下の記事をご覧ください。
期末課題に関しては別途執筆していく予定です。
このマガジンでは引き続き、北京大学社会学修士の授業について執筆していきます。
また、人口学について興味のある方は以下のマガジンをご参照ください。
もし気に入っていただけたならば、
スキとフォロー、マガジンの購読よろしくお願いします~
この記事が気に入ったらサポートをしてみませんか?