見出し画像

クラスターのお勉強

クラスターって言葉は流行病のあれですっかり有名になりましたが,統計です。要素をいくつかのグループ(クラスター)に分けるというものです。ちょっと頼まれてクラスター分析のやり方というか考え方を教えることになったのですが,私も詳しいわけでなく,復習がてらまずはExcelで距離を手計算というか自分で関数を打ち込んで出すところから。

式は見えるよね?

そしてrank関数で順位を出し,上位から手作業でくっつける。そうして一応樹形図が出来上がり。

でも,距離を反映させるのができてないし,ちょっと面倒ねということで,Rを使って出すことに。Rでクラスター分析をするのはさほど面倒ではない。参考ページを見ながらできます。

データにラベルを付けるために入力で row.names=1を忘れずに。そして出力。

最初の2グループがかなりきれいに分かれてますね。また,データラベルをローマ字表記にしているので,横に倒してみることに。

plot(as.dendrogram(result), horiz = TRUE)

これを足すだけでできました。

plotではなくggplot2を使った方がもっときれいに出来ますが,今回はとりあえず教えることが目的だったので簡単な方を選んでます。

jamovi本を書いたときには気にしなかったけど,jamoviだとさすがにできませんね。


この記事が気に入ったらサポートをしてみませんか?