Closed ixxmu closed 5 months ago
2024年6月13日,来自Fabian Theis研究团队的Philipp Weiler、Marius Lange和Michal Klein等人在Nature Methods期刊上发表了一篇题为“CellRank 2: unified fate mapping in multiview single-cell data”的研究文章。文章介绍了一种名为CellRank 2的框架,这是一种用于分析多视图单细胞数据以研究细胞命运的新型工具。CellRank 2能够在多种数据模态下统一并可扩展地研究细胞命运,通过结合实验时间点信息和新兴数据模态,如代谢标记数据,准确恢复终末状态和命运概率。该框架的应用展示了其在解析人类造血和内胚层发育中的卓越性能,同时揭示了参与胚咽内胚层发育的基因。CellRank 2还能够从代谢标记数据中估算细胞特异的转录和降解速率,应用于肠道类器官系统中,以勾勒分化轨迹并定位调控策略。这项研究的发布为研究细胞命运决策提供了新的思路和工具,展示了其在单细胞分辨率下解析细胞异质性和复杂分化轨迹的潜力。
关键字:轨迹推断、数据模态整合、广义谱聚类
引言
总之,CellRank 2是一个健壮、模块化且可扩展的框架,能够在多视图单细胞数据中统一研究细胞命运。它不仅克服了现有方法的局限性,还展示了其在解析复杂细胞状态变化和分化轨迹中的卓越性能。研究团队期待未来的工作能够进一步扩展CellRank 2,以适应更多新兴数据模态,并结合干扰数据和因果推断,深入理解分子驱动因素,为科学研究提供更强大的工具。
研究内容
CellRank 2框架在多个数据集上的应用展示了其在恢复终末状态、初始状态、估算命运概率以及识别调控基因方面的卓越性能。在人类造血数据集中,CellRank 2准确地恢复了所有已知的终末状态和初始状态。通过使用伪时间内核和发育潜力内核,研究团队能够构建一个偏向更成熟细胞的最近邻图,并精确估算细胞间的转变概率。此外,实验时间内核结合了跨时间点和时间点内的信息,提供了更细粒度的状态转换,展示了其在解析复杂细胞状态变化中的优势。在胚体形成和胚咽内胚层发育的应用中,CellRank 2成功地恢复了所有终末状态,并识别了参与这些发育过程的潜在调控基因。特别是在胚咽内胚层发育的研究中,CellRank 2不仅识别了已知的终末状态,还发现了新的潜在调控基因,揭示了细胞分化过程中基因表达的动态变化。此外,研究团队开发了一种基于代谢标记数据推断转录和降解速率的方法,并将其应用于肠道类器官系统。结果显示,CellRank 2能够准确识别所有终末状态,并且在细胞类型纯度和TSI评分方面显著优于传统方法。这一方法使得研究团队能够从代谢标记数据中推断细胞特异的转录和降解速率,从而更好地理解细胞分化的调控机制。总之,CellRank 2框架通过其模块化设计和多模态数据整合,展示了在多种生物学应用中的广泛潜力,为研究细胞命运决策提供了强大的工具,并揭示了复杂细胞状态变化和分化轨迹中的新洞见。
研究结果
模块化框架用于研究状态变化轨迹
为了广泛适用,研究团队将 CellRank 2 分为用于基于多视角单细胞数据计算细胞-细胞转移矩阵的内核和用于分析转移矩阵以识别初始和终末状态、计算命运概率和执行其他下游任务的估计器。CellRank 2 提供了一组不同的内核,这些内核基于基因表达、RNA 速度、伪时间、发育潜力、实验时间点和代谢标记数据推导转移概率(图 1a )。根据数据集和生物学问题,研究团队使用单个内核或将多个内核组合成多视角马尔可夫链。为了对恢复的细胞动力学进行初步的定性概述,研究团队引入了一种基于随机游走的可视化方案。
模块化和稳健的设计使 CellRank 2 成为多视角单细胞数据中状态动态概率分析的灵活框架;它能够快速调整计算工作流程以适应新兴数据模式,包括谱系追踪和时空数据,支持使用内核的新数据模式以及使用估计器的新分析。
克服RNA速度的局限性
尽管伪时间可以准确恢复,RNA速度在稳态人类造血过程中由于模型假设被违反而推断出错误的动态。具体来说,传统RNA速度模型所做的恒定速率假设被违反,并且对该系统重要的基因表现出高噪音或低覆盖率。传统伪时间方法在初始条件已知的系统中取得的显著成功,激励研究团队通过开发PseudotimeKernel来规避RNA速度的局限性,该核函数计算基于伪时间的转换概率及相应的矢量场(图2a)。基于Palantir的概念性想法,研究团队的方法推广到任何预计算的伪时间,并使用软加权方案。
研究团队的PseudotimeKernel可以推广到任何伪时间,允许用户选择最适合其数据集的算法。在具有更简单分化层次结构和已知初始状态的系统中,CellRank 2的PseudotimeKernel与经典的伪时间方法相比,为终端状态和命运承诺提供了额外的见解。
从发育潜力中学习向量场
CellRank 2 的 CytoTRACEKernel 使研究团队能够从内胚层发育的快照中推断细胞动力学,而无需为伪时间计算指定初始状态。研究团队恢复了终末状态、已知的驱动基因及其时间激活模式。
图3:CytoTRACEKernel恢复了时间基因激活
增加命运映射的时间分辨率
研究团队的RealTimeKernel结合了实验时间点内和时间点间的基因表达变化。值得注意的是,这些互补的视角使识别出假定的前体群体和比专注于单一数据视角的方法显著更多的相关驱动因子成为可能。
图4:通过时间分辨测量推断状态轨迹
估计代谢标记中的动力学速率和命运
估计的细胞和基因特异性动力学速率使我们能够研究这些谱系相关基因如何通过mRNA转录和降解调控。分析杯状细胞谱系中排名前100位谱系相关基因的已知调控因子和标记物的调控策略揭示了两种不同的调控策略(图5e)。第一种策略在降解率减少的情况下增加转录率(例如,Spdef、Sytl2和Fcgbp),而第二种策略同时增加转录和降解率(例如,Atp2a3、Tff3和Rassf6);这两种策略与先前发现的合作(情况1)和破坏性(情况2)调控策略一致。尽管目前还无法在单细胞测序协议中直接测量转录和降解速率,但转录速率的增加与这些基因作为杯状细胞谱系调控因子和标记物的角色一致。类似地,在肠细胞谱系中,这组相同的基因主要表现为(1)转录率减少伴随降解率增加(合作性),或(2)转录和降解率的同时增加/减少(破坏性;图5f)。
图5:通过代谢标记量化特定谱系的调控策略
结论
识别潜在的驱动基因是可以在未来工作中扩展的另一个方面。目前,研究团队通过将命运概率与基因表达相关来排名潜在的驱动基因。尽管这种方法已在各种应用中证明有效,但仅基于相关性。为了揭示分子特性和变化与命运决策的因果机制,可以将干扰数据和因果推断与CellRank 2结合使用。这种组合最终将提高对基础分子驱动因素的理解。总的来说,随着单细胞数据集规模和多样性的增长,研究团队预计他们的框架在理解和概念化命运选择中将至关重要。
链接
引文:Weiler, P., Lange, M., Klein, M. et al. CellRank 2: unified fate mapping in multiview single-cell data. Nat Methods (2024).
如果有帮助记得关注+收藏~
原文链接:https://doi.org/10.1038/s41592-024-02303-9
代码链接:CellRank 2:https://github.com/theislab/cellrank和https://zenodo.org/doi/10.5281/zenodo.10210196;基于代谢标记数据推断动力学速率的实现:https://github.com/theislab/scvelo;复现论文结果的代码:https://github.com/theislab/cellrank2_reproducibility 和https://doi.org/10.5281/zenodo.10809425。
数据链接: https://doi.org/10.6084/m9.figshare.c.6843633.v1
启发
这项研究通过开发和应用CellRank 2框架展示了多视图单细胞数据分析中的新方法,但进一步改进和提升这些方法依然存在潜力。一个改进方法向是结合深度学习中的图神经网络(Graph Neural Networks, GNNs)和强化学习(Reinforcement Learning, RL),以进一步提升多模态数据整合和细胞命运决策的准确性和效率。具体而言,图神经网络能够更有效地处理单细胞RNA测序数据中的复杂图结构。通过利用GNNs,我们可以捕捉到细胞之间的高维相互关系和更深层次的结构信息,这对于精确建模细胞状态转变和命运决策至关重要。此外,图神经网络的扩展性和灵活性使其能够处理更大规模的数据集,从而提供更广泛的生物学应用。同时,将强化学习引入轨迹推断过程,可以通过试探和优化策略不断提升模型的性能。强化学习模型可以通过不断学习和调整,找到最优的细胞状态转变路径,从而更准确地预测细胞的最终命运。这种方法特别适用于动态变化和高复杂度的生物系统,在多模态数据整合过程中具有显著优势。结合这两种先进方法的模型不仅能够捕捉更丰富的细胞间关系,还能通过优化策略提升预测准确性和效率。例如,使用GNNs可以更精确地构建细胞间的转变概率矩阵,而RL可以优化这些转变路径,使得最终的细胞命运预测更加准确和可靠。这样的结合方法能够克服现有方法在数据整合和动态变化捕捉上的不足,提供更全面和精确的细胞命运分析。
合作和投稿事宜请联系微信或邮箱
合作请加微信:l2195711724 投稿邮箱:advancebc@163.com
AdvanceBC科研群聊微信扫码,备注好地区-单位(选填)-昵称,广告勿扰
https://mp.weixin.qq.com/s/t9zfkyL-sExGqHtNazdgJA