見出し画像

qiime2Rを用いてβ多様性解析を美しく描画


この記事では、バイオインフォマティクス解析ツールQiime2で得られたデータから、統計計算環境Rを用いたβ多様性解析のデザインについて説明します。


実行環境とソフト

実行環境:Ubuntu 22.04.2 LTS (GNU/Linux 5.15.146.1-microsoft-standard-WSL2 x86_64)
実行ソフト:QIIME 2 2023.9 Amplicon Distribution上のR version 4.2.2

※WSL上でQiime2をactivateし、RでR環境を立ち上げています。

conda activate qiime2-amplicon-2023.9
R

データの読み込み

tidyverseとqiime2Rをインストール。
Rでメタデータとα多様性データを読み込みます。

install.packages("tidyverse")
library(tidyverse)
if (!requireNamespace("devtools", quietly = TRUE)){install.packages("devtools")}
devtools::install_github("jbisanz/qiime2R")
library(qiime2R)

metadata <- read_q2metadata("sample-metadata.tsv")

メタデータ

> head(metadata)
  SampleID 3groups 4groups days-since-experiment-start date-taken
1  imm2rpt     imm     imm                           0     231116
2  imm3rpt     imm     imm                           0     231116
3  imm4rpt     imm     imm                           0     231116
4    1day3    1day    1day                           1     231030
5    1day4    1day    1day                           1     231030
6  1dayrpt    1day    1day                           1     231116

"qiime diversity core-metrics-phylogenetic"で得られるα多様性指数及びβ多様性指数を読み込みます。

wunifrac <- read_qza("beta-diversity/core-metrics-results/weighted_unifrac_pcoa_results.qza")
shannon <- read_qza("beta-diversity/core-metrics-results/shannon_vector.qza")$data %>% rownames_to_column("SampleID") 

β多様性の可視化

微生物群集間の差を探求するためよく用いられる、主座標分析(Principal Coordinate Analysis)を実施します。
主成分分析(Principal Component Analysis)との違いについては、ユークリッド距離を扱うかどうかのようです。ここで用いる距離はUniFrac, Jaccard, Bray-Curtis全てユークリッド距離ではありません。

以下の記事でPCoAについて解説されています。

https://hoxo-m.hatenablog.com/entry/20120313/

可視化します。

wunifrac$data$Vectors %>%
  select(SampleID, PC1, PC2) %>%
  left_join(metadata) %>%
  left_join(shannon) %>%
  ggplot(aes(x=PC1, y=PC2, color=`4groups`, size=shannon_entropy)) +
  geom_point(alpha=0.5) +
  theme_q2r() +
  scale_shape_manual(values=c(16,1), name="Antibiotic Usage") +
  scale_size_continuous(name="Shannon Diversity") +
  scale_color_discrete(name="4groups")
  ggsave("beta-diversity/PCoA_wunifrac_0314.png", height=4, width=5, device="png")


"PCoA_wunifrac_0314.png"

まとめ

この記事では、Rを用いたβ多様性の可視化方法を説明しました。
異なるグループの微生物群集間の差を調査することができます。


次回はβ多様性の可視化をします


この記事が気に入ったらサポートをしてみませんか?