アメリエフ代表の山口です。アメリエフが提供する受託解析サービスやトレーニング、解析ソフトのQuick Start Packageでは、シングルセルRNA解析とRNA-seq解析が一番人気です。シングルセルRNA解析は、細胞レベルでの遺伝子発現解析を可能にする強力な技術です。 今回は、アメリエフの技術ブログから、シングルセルRNA解析の方法を紹介する記事をいくつかピックアップし、その要点をまとめました。アメリエフのシングルセルRNA受託解析サービス
シングルセルRNA解析のプロトコル
シングルセルRNA解析では、まず個々の細胞を分離し、RNAを抽出する必要があります。 この細胞分離の手法には、大きく分けて以下の3つの方法があります。
- Droplet型: マイクロエマルジョン技術を用いて、1細胞と1つのゲルビーズを油滴に閉じ込めて分離する方法。10x GenomicsのChromiumがこの方式を採用しており、シングルセル解析市場の大部分を占めています。 RNA-seqだけでなく、CITE-seqやATAC-seqなど、様々な解析に対応していることも特徴です。
- 集積流体回路型: 集積流体回路を用いて、カスタマイズ性の高い解析をプログラムする方法。FluidigmのC1がこの方式の代表的な製品です。 再現性の高さや精度が利点として挙げられます。
- ナノウェル型: チップ上に配置された微小なウェルに、精密な分注を行うことで1細胞ずつ分離する方法。Takara BioのICELL 8がこの方式の代表的な製品です。 検出細胞数が比較的多く、顕微鏡で細胞の生死を確認できることが特徴です。
細胞分離後、次世代シーケンサーを用いてシーケンシングを行います。ここでも、IlluminaのSmart-seq2やMARS-seqなど、様々な手法があります。 それぞれの方法には、感度やコスト、細胞数など、異なる利点と欠点があるため、用途に合わせて適切な方法を選択する必要があります。
参照
・Single Cell RNA-seq解析で使用されるプロトコルのご紹介
Seuratを用いたシングルセルRNA解析
Seuratは、シングルセルRNA解析で広く用いられているRパッケージです。 Seuratを用いることで、
- データの正規化・スケーリング:
- 主成分分析:
- データ統合:
- 発現変動遺伝子の探索:
- マーカー遺伝子の検出:
など、様々な解析を行うことができます。
Seuratオブジェクトの結合:
Seuratでは、複数のデータセットを結合する方法として、merge
関数とIntegrateData
関数が用意されています。 IntegrateData
関数は、バッチエフェクトなどを補正しながらデータセットを統合するのに対し、merge
関数は単純にraw countデータを結合します。 バッチエフェクト補正などを別途行う必要があるため、注意が必要です。
Seuratオブジェクトからのデータ取得:
Seuratオブジェクトには、assays
スロットの中に、raw countデータや正規化後のデータなど、様々なデータが格納されています。 例えば、raw countデータを取得したい場合は、pbmc@assays$RNA@counts
のように指定します。
発現変動遺伝子の探索:
FindMarkers()
関数は、2群間での発現量の有意差を調べる関数です。 この関数で得られた結果は、Volcano plotやMA plotで可視化することができます。 ただし、FindMarkers()
関数は、デフォルトのオプションではプロットに適していないため、注意が必要です。
異なるサンプル間での共通マーカー遺伝子の検出:
FindConservedMarkers()
関数を用いることで、異なるサンプル間で共通しているマーカー遺伝子を検出することができます。 この関数は、複数のサンプル間で共通して発現している遺伝子を調べるのに対し、FindAllMarkers()
関数は、1つのサンプルや統合後のデータに対してマーカー遺伝子を調べます。
参照
・Seuratのmerge関数とIntegrateData関数の違い
・Seuratオブジェクトからraw countデータ・正規化データなどを選んで呼び出す方法
・SeuratのFindMarkers() の結果を使ったVolcano plotの描き方
・【シングルセル解析】サンプル間で共通するマーカー遺伝子の検出方法
データ可視化
シングルセルRNA解析では、データの可視化も重要です。
Volcano Plot:
Volcano Plotは、遺伝子の発現変動を可視化するのに便利な方法です。 Rパッケージ EnhancedVolcano
を用いることで、見やすく美しいVolcano Plotを作成することができます。
ヒートマップ:
ヒートマップは、遺伝子発現量の全体像を把握するのに役立ちます。 Rのggplot2
パッケージを用いることで、カラースケールなどを調整し、見やすいヒートマップを作成することができます。
参照
・Volcano Plot を綺麗に描きたい
・【R】ヒートマップのカラースケールの調整方法
まとめ
今回は、アメリエフの技術ブログから、シングルセルRNA解析の方法を紹介する記事をいくつかピックアップし、その要点をまとめました。 シングルセルRNA解析は、複雑なデータ解析が必要となるため、今回ご紹介した内容以外にも、様々な解析方法や注意点があります。
人材募集
アメリエフは、「バイオインフォマティクスの活用を促進し研究を加速させる」という理念のもと、医学研究やデジタル創薬(AI創薬)研究を前進させています。
現在、次世代シーケンサーデータの解析、遺伝子発現解析、ゲノム解析を通して、創薬ターゲットの探索やバイオマーカーの発見に貢献するバイオインフォマティシャン、AI創薬のための機械学習モデルの構築、データ分析、アルゴリズム開発などを行うデータサイエンティスト、機械学習エンジニアなどを募集しています。新卒やポスドク、中途のリーダー職まで、幅広いポジションで活躍の場があります。
アメリエフでは、社員一人ひとりの成長と働きがいを大切にしています。フレックスタイム制で柔軟な働き方が可能で、リモートワークも可能です。また、社内外の研修制度が充実しており、スキルアップを支援しています。
私たちと一緒に、医療の未来を創造しませんか? ご応募お待ちしております!
コメント