【第2章因果関係】練習問題2.8.3「自然実験としての指導者暗殺の成功」

1.データセット・元論文の紹介

(1)データセット
 ・第2章の練習問題に取り組む際に必要になるデータセットは、第1章の練習問題と同様に以下のリンク先からダウンロードできる。

(2)元論文
 ・本練習問題の作成に際して参考とした論文が脚注で紹介されている。参考のためリンクを貼っておく。

2.練習問題2.8.3「自然実験としての指導者暗殺の成功」

(1)データセットの概要把握
  ①観察数250、変数11のデータ。データは250の暗殺計画を記録している
  ②1度でも指導者暗殺が計画された国は88ヵ国
  ③計画の総数と国のユニーク数より1ヵ国当り約2.84の暗殺計画がある

> leaeders <- read.csv("leaders.csv")
> dim(leaeders)
[1] 250  11

> summary(leaeders)
      year               country            leadername       age         politybefore    
 Min.   :1878   Japan        : 11   Mussolini    :  6   Min.   :18.00   Min.   :-10.000  
 1st Qu.:1920   Mexico       : 11   Alexander II :  4   1st Qu.:45.00   1st Qu.: -7.000  
 Median :1949   France       : 10   De Gaulle    :  4   Median :52.50   Median : -3.000  
 Mean   :1945   Russia       : 10   Alexander III:  3   Mean   :53.52   Mean   : -1.519  
 3rd Qu.:1972   United States:  8   Amin         :  3   3rd Qu.:61.75   3rd Qu.:  4.000  
 Max.   :2001   Guatemala    :  7   Carlos I     :  3   Max.   :81.00   Max.   : 10.000  
                (Other)      :193   (Other)      :227                                    

  polityafter      interwarbefore  interwarafter   civilwarbefore  civilwarafter  
 Min.   :-10.000   Min.   :0.000   Min.   :0.000   Min.   :0.000   Min.   :0.000  
 1st Qu.: -7.000   1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.000  
 Median : -3.167   Median :0.000   Median :0.000   Median :0.000   Median :0.000  
 Mean   : -1.650   Mean   :0.188   Mean   :0.148   Mean   :0.216   Mean   :0.184  
 3rd Qu.:  3.917   3rd Qu.:0.000   3rd Qu.:0.000   3rd Qu.:0.000   3rd Qu.:0.000  
 Max.   : 10.000   Max.   :1.000   Max.   :1.000   Max.   :1.000   Max.   :1.000  
                                                                                 
                                         result  
 not wounded                                :96  
 dies within a day after the attack         :46  
 plot stopped                               :40  
 wounded lightly                            :25  
 hospitalization but no permanent disability:20  
 survives, whether wounded unknown          :14  
 (Other)                                    : 9  

> length(unique(leaeders$country))
[1] 88

> length(leaeders$country) / length(unique(leaeders$country))
[1] 2.840909

(2)指導者暗殺計画の成功率とランダム性
 <暗殺成功フラグ(success)の設定条件>
  ①変数resultが以下に該当する場合「1」を、非該当の場合「0」にする
   ・dies between a day and a week
   ・dies between a week and a month
   ・dies within a day after the attack
   ・dies, timing unknown
 <結果の確認>
  ①指導者が死亡した場合が計54ケースある
  ②指導者暗殺計画の全体的な成功率は21.6%になる
  ③必ず成功又は失敗する訳でなく、5回に1回程度の成功率である。
   しかし、成功をもたらす他の要因が存在する可能性があるため、
   成功がランダムに決まると仮定することは妥当ではない。

> as.data.frame(summary(leaeders$result))
                                            summary(leaeders$result)
dies between a day and a week                                      2
dies between a week and a month                                    2
dies within a day after the attack                                46
dies, timing unknown                                               4
hospitalization but no permanent disability                       20
not wounded                                                       96
plot stopped                                                      40
survives but wounded severely                                      1
survives, whether wounded unknown                                 14
wounded lightly                                                   25

> leaeders$success <- ifelse(leaeders$result == "dies between a day and a week"|
+                              leaeders$result == "dies between a week and a month"|
+                              leaeders$result == "dies within a day after the attack"|
+                              leaeders$result == "dies, timing unknown", 1 , 0)

> sum(leaeders$success)
[1] 54

> mean(leaeders$success)
[1] 0.216

(3)暗殺成否別の平均ポリティ指標・指導者の年齢
  ①暗殺計画前の3年間のポリティ指標の平均
   1)平均値は失敗の場合-1.743、成功の場合-0.7037と1の差がある
   2)箱ひげ図を見ると成功時の方がIQRの範囲が上振れしている
   3)指導者暗殺が成功した国の方が民主的だった可能性がある
  ②暗殺計画時の指導者の年齢
   1)平均値は失敗の場合52.71、成功の場合56.46と約4の差がある
   2)箱ひげ図を見ると成功時の方がIQRの範囲が上振れしている
   3)年齢が高いほど、暗殺が成功する可能性も高いことが考えられる

> tapply(leaeders$politybefore,leaeders$success,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
-10.000  -7.000  -3.000  -1.743   3.000  10.000 
$`1`
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
-10.0000  -6.0000  -3.0000  -0.7037   5.5000  10.0000 

> tapply(leaeders$age,leaeders$success,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.00   44.00   51.50   52.71   61.00   81.00 
$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  34.00   47.25   58.00   56.46   64.75   77.00 

> par(mfrow = c(1,2))
> boxplot(politybefore ~ success, data = leaeders,ylab = "politybefore",main = "plot failure / success politybefore")
> boxplot(age ~ success, data = leaeders,ylab = "age",main = "plot failure / success age")

画像1

(4)内戦及び戦争の発生状況別の平均ポリティ指標・指導者の年齢
  ①暗殺計画前の3年間のポリティ指標の平均
   1)平均値は失敗の場合-1.570、成功の場合-1.431と約0.17の差
   2)箱ひげ図を見ると成功時の方がIQRの範囲は広いがほぼ同じ
  ②暗殺計画時の指導者の年齢
   1)平均値は失敗の場合53.25、成功の場合53.99とほぼ同じ
   2)箱ひげ図を見ると成功時の方がIQRの範囲は狭いがほぼ同じ

> leaeders$warbefore <- ifelse(leaeders$civilwarbefore == 1 |
+                              leaeders$interwarbefore == 1 , 1 , 0)

> sum(leaeders$warbefore)
[1] 92

> mean(leaeders$warbefore)
[1] 0.368

> tapply(leaeders$politybefore,leaeders$warbefore,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
-10.000  -6.917  -3.000  -1.570   3.833  10.000 
$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
-10.000  -7.250  -3.000  -1.431   4.250  10.000 

> tapply(leaeders$age,leaeders$warbefore,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.00   45.00   52.00   53.25   62.00   81.00 
$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  31.00   45.75   53.50   53.99   61.00   81.00 

> par(mfrow = c(1,2))
> boxplot(politybefore ~ warbefore, data = leaeders,ylab = "politybefore",main = "warbfore politybefore")
> boxplot(age ~ warbefore, data = leaeders,ylab = "age",main = "warbfore age")

画像2

(5)指導者暗殺の民主化又は戦争発生への影響
 <データ分析上の仮定>
  ①比較するグループ間の特徴を極力合わせるため、暗殺計画前に内戦又
   は戦争状態にあった国のみを抽出(変数warbefore=1)
  ②暗殺が行われた後の3年間で内戦又は戦争状態にあった場合1になる
   変数warafterを追加
  ③暗殺の成否別(変数success)に暗殺後3年間のポリティ指標の平均 
   と内戦又は戦争の状態を比較
 <結果の確認>
  ①暗殺計画から3年間のポリティ指標の平均
   
1)計画が失敗の場合の平均値は-1.466、成功の場合0.7982である
   2)その平均の差は2.2642と大きい
   3)暗殺の成功が、民主化に寄与していると思われる
  ②暗殺計画から3年間の内戦又は戦争の状況
   1)計画が失敗の場合の平均値は0.7534、成功の場合0.5263である
   2)その平均の差は0.2271と大きい
   3)暗殺の成功は必ずしも内戦や戦争を引き起こすとは言えず、寧ろ
    発生する可能性を低下させると思われる

> leaeders.warbefore <- leaeders[leaeders$warbefore == 1,]

> dim(leaeders.warbefore)
[1] 92 13

> leaeders.warbefore$warafter <- ifelse(leaeders.warbefore$civilwarbefore == 1 |
+                                         leaeders.warbefore$interwarafter == 1,1,0)

> tapply(leaeders.warbefore$polityafter,leaeders.warbefore$success,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
-10.000  -7.000  -3.000  -1.466   3.667  10.000 
$`1`
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
-10.0000  -3.6667   1.0000   0.7982   5.7500  10.0000 

> tapply(leaeders.warbefore$warafter,leaeders.warbefore$success,summary)
$`0`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.0000  1.0000  1.0000  0.7534  1.0000  1.0000 
$`1`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.0000  0.0000  1.0000  0.5263  1.0000  1.0000

> par(mfrow = c(1,1))
> boxplot(polityafter ~ success, data = leaeders.warbefore,ylab = "polityafter")

画像3

3.練習問題を解いた感想

 ・比較するグループ間のランダム性が必ずしも保証されていない場合に、比較可能なグループを抽出してくるというタイプの問題を初めて解いた。

 ・現実のデータ分析では、RCTによる実験データでもない限り、こうしたタイプの問題の方が圧倒的に多いと思われる。様々な観点からデータセットを部分集合化して、知見をひねり出した際に、その知見での外的妥当性に範囲を強く意識すべきだと思った。

 ・ようやく第2章まで終わったが、残りの第3章・第4章、そして下巻とまだまだ先は長いので頑張っていきたい。

この記事が気に入ったらサポートをしてみませんか?