SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
理解して使うRNA Velocity解析ツール
- 最近のツール編 -
Mika Yoshimura
2023/02/08 理化学研究所
scVelo開発チームによるレビュー論文
• RNA velocity—現在の課題と将来の展望
Volker Bergen, Ruslan A Soldatov, Peter V Kharchenko, Fabian J Theis
Mol Syst Biol. 2021 Aug;17(8):e10282
• Velocity解析手法の限界についての実例とFeature Plansを示す
scVeloの今後の展望 A. velocityモデルの拡張
細胞の状態間やダイナミックなプロセス中におこる
パラメータの動的な変化を考慮した拡張
B. 細胞特異的ダイナミクスの確率論的モデル
RNA velocityのモデルは決定論的な微分方程式で
記述されるため、不均一性は無視されている
→ 確率的変動をモデルに取り込む
C. システムダイナミクスに向けた多変量解析モデル
RNA velocityのモデルで各遺伝子の制御関係は無視される
→ 細胞状態の遷移に沿った制御性相互作用を記述する
多変量モデルに拡張する
D. Multi-modal omics models
protein, 細胞質のmRNA, キャッピングmRNA,
クロマチンの状態等、他のシグナルをモデルに組み込む
scVeloの現在
複数の系統をもつ細胞集団
特定のクラスタで、推定されたダイナミクス(紫の曲線) では説明できない挙動を示す遺伝子
異なる挙動のクラスタ Velocity再計算
[疑問]
2022.12 時点で、 Velocity解析の課題を認識した 新しいVelocityツールは
どれくらい発表されているのか?
→ レビュー論文 Mol Syst Biol. 2021 を引用する論文を調査
V.Bergen.et.al, Mol Syst Biol. 2021 を引用している論文
22年12月時点
引用論文数 : 54報
重複を除去 : 51報
23年2月現在 → 70報
A : Review(解析者向け) = 1本
B : 手法検証= 2本
C : 既存velocityの応用 = 3本
D : scVeloの後継手法 = 13本
E : scVeloのFigを掲載 = 10本
F : velocityに言及・他 = 21本
A : Review(解析者向け) = 1本
B : 手法検証= 2本
C : 既存velocityの応用 = 3本
D : scVeloの後継手法 = 13本
E : scVeloのFigを掲載 = 10本
F : velocityに言及・他 = 21本
V.Bergen.et.al, Mol Syst Biol. 2021 を引用している論文
22年12月時点
引用論文数 : 54報
重複を除去 : 51報
23年2月現在 → 70報
scTour
DeepVelo
LatentVelo
PhyloVelo
Pyro-Velocity
veloVI
VeloVAE
spliceJAC
Molecular Systems Biology (2022)18:e111
MultiVelo
UniTVelo
κ-velo/eco-velo
ValoAE
Nature Biotechnology (2022)
Nature Comm volume 13, 6586 (2022)
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
Proc Natl Acad Sci U S A. 2021 Dec 7
Preprints
Published
not use
“velocity”
scVeloの後継手法 一覧
モデル拡張
MultiVelo
Nature Biotechnology (2022)
UniTVelo
Nature Comm volume 13, 6586 (2022)
モデル拡張 + embeddingの改良
κ-velo/eco-velo
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
変分オートエンコーダー(生成モデル)
ValoAE
Proc Natl Acad Sci U S A. 2021 Dec 7
scTour LatentVelo
Pyro-Velocity
深層生成モデル
veloVI
グラフ畳み込み
ネットワーク
DeepVelo
変分ベイズ
VeloVAE
細胞系統樹
多変量スプライシングモデル
(not use velocity)
PhyloVelo spliceJAC
Molecular Systems Biology (2022)
オートエンコーダー
モデル拡張
MultiVelo
Nature Biotechnology (2022)
UniTVelo
Nature Comm volume 13, 6586 (2022)
MultiVelo
Nature Biotechnology (2022)
・エピゲノムデータを取り入れた微分方程式モデル
・転写速度はクロマチンアクセシビリティ (c)に
比例し時間的に変化すると仮定
・時間tが進むにつれて変化する状態kをモデル化
・遺伝子発現のスイッチ時間
(クロマチン閉環、転写誘導、転写抑制が始まるタイミング)
・遺伝子固有のVelocityパラメータ
→ 3次元位相ポートレートを用いて推定
UniTVelo
Nature Comm volume 13, 6586 (2022)
・spliced-RNAを使用し遺伝子発現の完全なダイナミクスを
放射状基底関数 (RBF) でモデル化、トップダウン的にRNA velocityを推定する
・スプライシングされていないRNAが全くない状態でもVelocityを予測することができる
・細胞ごとにトランスクリプトーム全体で共有する潜在time pointを導入し、
遺伝子間でのノイズ(方向性の不一致)を解決 → 細胞分化経路の予測精度が向上
モデル拡張 + embeddingの改良
κ-velo/eco-velo
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
Cell volume 185, Issue 4, 2022
・代謝標識シーケンスデータを
spliced/unsplicedダイナミクスに基づくモデルに統合し
真の(absolute) velocity を推定
・代謝ラベリングなしの1細胞RNA-seqデータにも適用可
・各細胞の遺伝子発現量と変化速度(velocity) から、
遺伝子発現量ベクトルを受け取って変化速度を返す
関数 f (ベクトルフィールド)を学習する
・再構成された解析的ベクトルフィールドを用いて、
細胞が存在しない領域に対しても、低次元空間の
ベクトルフィールドを数学的に復元したり、
細胞運命変遷、遺伝子擾乱の結果などの予測が可能
参考:1細胞シーケンシングデータを用いた遺伝子発現変化予測
(in silico perturbation) 手法 (Dynamo, SCENIC+) の紹介
https://qiita.com/masa12/items/1e564768ad98c0d4cf9c
κ-velo/eco-velo
PLoS Comput Biol. 2022 Sep 28
・メインはκ-velo
・細胞密度 = 遺伝子に依存しないグローバルな
潜在時間 “スケーリングファクターκ”をモデルに導入
(スケール不変性問題を克服)
・非線形低次元空間embeddingに
Nyström射影を用いる
・eco-veloは 高次元のRNA velocityを推論しない
ヒューリスティックなアプローチ
変分オートエンコーダー(生成モデル)
ValoAE
Proc Natl Acad Sci U S A. 2021 Dec 7
scTour LatentVelo
Pyro-Velocity
深層生成モデル
veloVI
グラフ畳み込み
ネットワーク
DeepVelo
変分ベイズ
VeloVAE
オートエンコーダー
VeloAE
Proc Natl Acad Sci U S A. 2021 Dec 7
・ノイズの多い高次元spliced/unsplicedベクトルを
オートエンコーダで低次元潜在空間に射影し、
線形回帰(=定常状態モデル)を用いて潜在空間上の
velocityを推定する
※embeddingはscVeloと同じく遷移確率を用いる
scTour
・変分オートエンコーダ(VAE)とneural ODEを用いて、
教師なしでpseudotime、トランスクリプトームベクトル場、
潜在空間を同時に推定
・バッチ効果を受けず、事前知識(ルート細胞の指定など)や
spliced/unspliced mRNAの区別も必要ない
biorxiv.org/content/10.1101/2022.04.17.488600v2.full
LatentVelo
・変分オートエンコーダ(VAE)で細胞のカウントデータを
低次元潜在空間に埋め込み、潜在空間上での
分化ダイナミクスをneural ODEで記述する
・VeloAEと異なり、細胞状態を学習した潜在空間に埋め込み
ダイナミクスを細胞状態や系譜に依存させることができる
・単に局所的なVelocityベクトルを出力するのではなく、
個々の細胞ごとにグローバルな経路 を推定する
→ 潜在的な軌道も予測することができる
・細胞状態とRNA velocityに対する一括バッチ補正が可能
biorxiv.org/content/10.1101/2022.08.22.504858v2.full
Pyro-Velocity
・spliced/unsplicedリードカウントを用いてvelocityベクトルフィールド & 共有潜在時間の不確実性推定を行う確率的生成モデル
・変分推論の自動化として提案されている自動微分変分推論(Automatic Differentiation Variational Inference ; ADVI)という
アルゴリズムを利用し、近似事後分布を導出する
・variable genesの選択、主成分の数、kNNによる平滑化などの前処理ステップや、遺伝子ごとの独立したvelocityに対する
平滑化、集約などアドホックな後処理が必要ない
biorxiv.org/content/10.1101/2022.09.12.507691v2.full
Pyro : pythonの機械学習ライブラリPyTorchを
ベースにした確率的プログラミング言語
veloVI
・scVeloと同じラボからの論文
・ 深層生成モデル(Deep Generative Model) を用いて、
反応速度パラメータと潜在時間を学習しながら、
すべての細胞と遺伝子間で情報を共有するモデルを介して
RNA velocityの推論を再定式化
・velocityの経験的事後分布(細胞-遺伝子レベル)を出力
→ 内在的な不確実性 + 細胞の近傍間の変動性の両方を
定量化できる
https://github.com/YosefLab/velovi
・数ヶ月以内にscvi-tools に移行 + scVeloでラッパーがビルド
biorxiv.org/content/10.1101/2022.08.12.503709v1.full
DeepVelo
・グラフ畳み込みネットワーク(GCN)を用いて、遺伝子ごと、細胞ごとのRNAスプライシング・分解速度を推定
・異種細胞集団やマルチリネージを持つデータに対して、複雑な分化動態のRNA velocityをモデル化することが可能
biorxiv.org/content/10.1101/2022.04.03.486877v2.full
VeloVAE
・変分ベイズを用いて、各細胞の潜在時間、細胞の状態、
反応速度パラメータの事後分布を推定
・データ適合性と分化方向の推定精度の点で、
従来のアプローチを大幅に上回る
・細胞状態変数と全遺伝子で共有する潜在時間の導入によって
従来の手法では捉えられなかった発現ダイナミクスの
定性的特徴をモデル化できる
(遅延誘導、初期抑制、転写ブースト、分岐など)
biorxiv.org/content/10.1101/2022.07.08.499381v2.full
細胞系統樹
多変量スプライシングモデル
(not velocity)
PhyloVelo spliceJAC
Molecular Systems Biology (2022)
PhyloVelo
・一細胞トランスクリプトーム + 系統樹情報 で
細胞運命の遷移を系統的にマッピングする手法
・細胞分裂に伴う単調発現遺伝子(MEGs)は、
末端細胞の種類に関わらず、系統分岐に沿って
連続的に発現が増減する
・MEGを利用し、細胞系統樹に分解された
scRNA-seqデータからvelocityフィールドを
低次元空間上で後ろ向きに再構築する
biorxiv.org/content/10.1101/2022.10.06.511094v2.full
spliceJAC
Molecular Systems Biology (2022)
A. unspliced mRNAとspliced mRNAのカウント、
細胞のアノテーションを入力とする
B,C. 多変量mRNAスプライシングモデルにより
各細胞状態に特異的な遺伝子-遺伝子相互作用行列を出力
D. 細胞状態間の切り替えを、状態特異的な
遺伝子制御ネットワークによる高次元ランドスケープ上の
遷移として解釈する
E. 安定性解析により、細胞状態間の移行に重要な
“遷移遺伝子 “を予測できる
(F. 各細胞状態は、制御ネットワークに捕捉された遺伝子間の
特異的な相互作用を示す)
まとめ
・scVelo開発チームがMol Syst Biol. 2021にて問題提起した課題について、後継手法はその多くを
克服しつつある
個々の手法での課題
・前処理 → 正確なunspliced RNAの定量など
・既存モデルの拡張 → 確率的ダイナミクスのより良い推論
・生成モデルの活用 → ハイパーパラメータの調整
・ほとんど観測されない一過性の細胞クラスタを持つ、疎な細胞系譜集団でのVelocity推定
etc…
現状、どの手法も従来のscVeloとしか比較していないため、ベンチマーク論文が待たれる
scVeloチームも後継のVeloVIを開発しており、今後Velocity解析の標準はアップデートしていくと予想

Más contenido relacionado

La actualidad más candente

ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門KnowledgeGraph
 
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...Deep Learning JP
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法Tatsuya Shirakawa
 
それでも私が研究を続ける理由
それでも私が研究を続ける理由それでも私が研究を続ける理由
それでも私が研究を続ける理由Hitomi Yanaka
 
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational AutoencoderDeep Learning JP
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 Yuki Arase
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"Deep Learning JP
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?Kazuyuki Miyazawa
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)cvpaper. challenge
 
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIShota Imai
 
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】YutaSuzuki27
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE広樹 本間
 
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement LearningDeep Learning JP
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使うAtsushi Hayakawa
 
PCAの最終形態GPLVMの解説
PCAの最終形態GPLVMの解説PCAの最終形態GPLVMの解説
PCAの最終形態GPLVMの解説弘毅 露崎
 

La actualidad más candente (20)

ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
 
多変量解析
多変量解析多変量解析
多変量解析
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法
 
それでも私が研究を続ける理由
それでも私が研究を続ける理由それでも私が研究を続ける理由
それでも私が研究を続ける理由
 
時系列分析入門
時系列分析入門時系列分析入門
時系列分析入門
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
 
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】
【学会発表】U-Net++とSE-Netを統合した画像セグメンテーションのための転移学習モデル【IBIS2020】
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
 
MIRU MIRU わかる GAN
MIRU MIRU わかる GANMIRU MIRU わかる GAN
MIRU MIRU わかる GAN
 
Visual Studio CodeでRを使う
Visual Studio CodeでRを使うVisual Studio CodeでRを使う
Visual Studio CodeでRを使う
 
PCAの最終形態GPLVMの解説
PCAの最終形態GPLVMの解説PCAの最終形態GPLVMの解説
PCAの最終形態GPLVMの解説
 

Similar a 理解して使うRNA Velocity解析ツール-最近のツール編

ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel弘毅 露崎
 
Data assim r
Data assim rData assim r
Data assim rXiangze
 
20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasyYoichi Shirasawa
 
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーPFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーMatlantis
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベースDNA Data Bank of Japan center
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクスMas Kot
 

Similar a 理解して使うRNA Velocity解析ツール-最近のツール編 (9)

ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel
 
Data assim r
Data assim rData assim r
Data assim r
 
20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy
 
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーPFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
 
ENCODE勉強会
ENCODE勉強会ENCODE勉強会
ENCODE勉強会
 
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdfStatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
hashimoto m
hashimoto mhashimoto m
hashimoto m
 

理解して使うRNA Velocity解析ツール-最近のツール編