見出し画像

シングルセルRNA-seq解析の始め方:Dockerを使ったSeuratの環境構築!

シングルセル解析は,近年急速に発達している技術で,一細胞ごとのRNA発現量(シングルセルRNA-seq)や,クロマチンアクセシビリティ(シングルセルATAC-seq)などを評価できる手法です。

最初は敷居が高く感じますが,プログラミングを体系的に勉強したことのない私も独学で仕事にできるまでになっているので,どんな方でも習得可能な技術だと思います。最近では数多くの研究が発表されて,公開されているデータも非常に多いので,「WETでこんなふうに見えるんだけれども,シングルセル解析のデータではどう見えるのだろう?」「とりあえず研究シーズを見つけるために,公共データのシングルセル解析をしてみたい!」「公共データの再解析だけで論文書くぞ!」というさまざまなモチベーションを持って,さっと解析できるようになると大きな強みになるのではないかと思います。

シングルセルRNA-seq解析で最も使用されているのはR言語ベースのSeuratです。機能が豊富で,割と直感的にさまざまな解析ができるので,とても使いやすいです。初学者がまずスタートするのにとても良いツールだと思います。

しかし,解析初学者の苦悩として,ツールをインストールするところでつまづくいてしまい,匙を投げるというのはよくあることだと思います。ということでdockerを使った環境構築について紹介したいと思います。以下
「dockerって何?」と「実際の導入例」についてご紹介します。

*この記事は,macまたはLinuxマシンを前提に書いております。


Dockerって何?

詳しい説明はこちらの記事がとてもわかりやすいですが,とにかく簡単に教えてくれという方のためにざっくりご説明します。

解析環境を整えるときに一番苦労するのが,「Aというツールを使いたいが,AはBというツールがないと動かない。ところがBがうまくインストールできない」とか「Bにはバージョン1とバージョン2があって,バージョン2に上げるとAが動かない。でもBのバージョン2も使いたい」みたいな状況が割とよく起こることです。

Dockerは,仮想環境を作るためのツールです。仮想環境とは「パソコンの中に,別のパソコンを作る」みたいなイメージです。Dockerを使うことで「AとBのバージョン1が入っている環境」と「Bのバージョン2が入っている環境」を両立させて使うことができます。

Dockerは,仮想環境の設計図となる「イメージ」というものを基に,「コンテナ」という環境を作り,そこで作業を行います。設計図から箱を作り,その中で仕事をするという感じですかね。あまりに便利なので,数多くのバイオインフォマティクスツールについて,docker環境が用意されています。

では,以下から実際にDockerでR+Seuratを動かすための環境構築をしてみます。

実際の導入例

1. Docker Desktopをインストール

まず,ご自身のOSに合ったDocker Desktopをダウンロード,インストールしましょう。方法はこちらの通りです。アプリをインストールするのと同じです。

2. 目的のDockerイメージをダウンロード

Docker Desktopが入ったら,早速起動してみましょう。Docker Desktopからもイメージをダウンロードしてコンテナを作ることはできるのですが,RStudio環境を立ち上げるときに少し複雑なので,私はターミナルからコマンドを打ち込んでいます。ここでは私が解析用に組んでいるイメージをダウンロードしてみます。(無料で公開しているのでぜひ使ってみてください!)

docker pull koheilk/biorstudio:1.1

3. Dockerコンテナを立ち上げる

イメージをダウンロードできたら,次はコンテナの作成です。ターミナルで再び以下のように打ち込みます。

% docker run --name biorstudio -p 8787:8787 -v "/:/mnt/" -e PASSWORD=[好きなパスワード] koheilk/biorstudio:1.1

[s6-init] making user provided files available at /var/run/s6/etc...exited 0.
[s6-init] ensuring user provided files have correct perms...exited 0.
[fix-attrs.d] applying ownership & permissions fixes...
[fix-attrs.d] done.
[cont-init.d] executing container initialization scripts...
[cont-init.d] 01_set_env: executing... 
skipping /var/run/s6/container_environment/HOME
skipping /var/run/s6/container_environment/PASSWORD
skipping /var/run/s6/container_environment/RSTUDIO_VERSION
[cont-init.d] 01_set_env: exited 0.
[cont-init.d] 02_userconf: executing... 
Generating locales (this might take a while)...
  ja_JP.UTF-8... done
Generation complete.
[cont-init.d] 02_userconf: exited 0.
[cont-init.d] done.
[services.d] starting services
[services.d] done.

一度,Control+Cでプロセスを閉じておきます。

Docker Desktopのダッシュボードの「コンテナ」タブを開くと,新しいコンテナができていることがわかります。矢印の再生ボタンでコンテナを開始できます。

4. 解析を始める

あとはhttp://localhost:8787/にブラウザでアクセスすればRStudioが立ち上がります。Safariだとうまくいかないことがあり,Google Chromeを使っています。

上記のコマンドだと,
/mnt/host_mnt/
以下に,ローカルの環境が現れるはずです。

それでは,楽しいシングルセル解析ライフを!

この記事が気に入ったらサポートをしてみませんか?