Closed ixxmu closed 1 month ago
2024年8月26日,来自Qing Nie研究团队的Axel A. Almet、Yuan-Chen Tsai和Momoko Watanabe在Nature Methods期刊上发表了一篇题为“Inferring pattern-driving intercellular flows from single-cell and spatial transcriptomics”的研究文章。文章中,作者介绍了一种名为FlowSig的方法,能够从单细胞RNA测序和空间转录组数据中推断出驱动模式的细胞间流动。通过图形因果建模和条件独立性测试,FlowSig不仅能够揭示细胞间通信如何驱动信息流,还能捕捉到在疾病进展或外部刺激下的细胞间流动变化。该研究的亮点在于其通过生成的数学模型和实验数据验证了FlowSig的准确性,并展示了其在多种研究中的应用,例如解析胰岛素分泌、COVID-19严重程度与细胞间流动的关系,以及胚胎发育过程中的模式生成。
空间转录组学 | 细胞形态学 | TESLA算法
图1:FlowSig模型描述
图2:合成验证的FlowSig
图4:将FlowSig应用于被干扰的人胰腺岛细胞的非空间scRNA-seq
图5:将FlowSig应用于来自患有中度或重度COVID-19的人的人类BALF的scRNA-seq
图6:将FlowSig应用于小鼠胚胎发生E9.5阶段的空间Stereo-seq数据
研究团队开发了FlowSig,一种能够推断细胞间通信活动的工具,这些活动可能通过协调的GEMs相互依赖。FlowSig的核心在于构建能够测量细胞间信息(接收和发送)或细胞内信息的变量。通过将图形因果建模和因果结构学习应用于scRNA-seq和ST数据,FlowSig为高维组学数据的分析提供了一个前瞻性的框架。随着这些数据的持续积累,研究领域将逐步转向更具预测性的分析,而因果推断和因果结构学习模型将成为这一转变中的关键工具。
FlowSig与现有的多细胞表示程序构建方法互为补充,例如DIALOGUE和MOFAcellular等方法。这些方法各有侧重,FlowSig特别在推断通信驱动的细胞间流动方面展现了独特的优势。未来,随着新型数据模式的出现,如Phospho-seq等测量翻译后反应的数据,将为FlowSig的验证和进一步优化提供更多机会。
尽管FlowSig在推断细胞间流动方面具有显著的优势,但其也存在一定的局限性。首先,FlowSig使用基于部分相关性的条件独立性不变性测试,这要求数据集必须具有足够大的样本量,以确保依赖关系的统计显著性。此外,部分相关性假设数据分布符合线性高斯模型,而在实际应用中,这一假设可能并不总是成立。随着变量数量的增加,FlowSig使用的图学习算法可能会推断出更多的假阳性关系。
对于非空间应用,准确学习细胞间流动还需要确保扰动能够显著改变一个或多个变量的分布。然而,当扰动完全抑制信号变量的表达或诱导对照条件下未表达的变量时,部分相关性测试将无法进行。此外,FlowSig当前推断的是静态图,而细胞间流动本质上是动态的。因此,将FlowSig扩展到捕捉时空流动是未来的一个重要挑战。
在应对这些挑战的过程中,研究团队可能需要探索结合新的数据分析方法和工具,如SCENIC或测量开放染色质可及性的数据,以进一步完善FlowSig的推断能力。这将帮助研究人员更好地理解和模拟复杂的细胞间通信网络,并推动该领域的进一步发展。
我们可以进一步发展结合多模态数据融合和深度学习的方法,来提升当前基于图形因果建模的FlowSig方法。我们可以引入多模态神经网络,将单细胞RNA测序、空间转录组学数据与其他类型的生物数据进行深度融合。这种方法能够通过学习各类数据之间的复杂非线性关系,更加全面地捕捉和表征细胞间的信号流动。结合生成对抗网络(GANs)或变分自编码器(VAEs)等生成模型,还可以生成更高质量的虚拟数据,以弥补实验数据中因样本量不足或数据缺失所导致的局限。这些生成模型能够学习并生成符合生物学规律的虚拟数据,使得推断模型在训练时能够更加准确地识别和模拟真实的生物系统。此外,考虑引入自监督学习和注意力机制,进一步增强模型在异质性生物数据上的鲁棒性和可解释性。自监督学习可以通过设计特定的预训练任务,充分利用未标注数据,提升模型的特征提取能力;注意力机制则能够动态聚焦于关键的生物学信号,使得模型在处理高维度数据时能更精确地识别出关键的调控路径。
合作和投稿事宜请联系微信或邮箱
合作请加微信:l2195711724 投稿邮箱:advancebc@163.com
AdvanceBC科研群聊微信扫码,备注好地区-单位(选填)-昵称,广告勿扰
https://mp.weixin.qq.com/s/cIDVGyFXn5xS4yX_mpzpBA