ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
106 stars 30 forks source link

NetAct:利用基因活性构建核心转录因子调控网络 #3172

Closed ixxmu closed 1 year ago

ixxmu commented 1 year ago

https://mp.weixin.qq.com/s/yz81TE9aB9aEdOxNd_fwdQ

ixxmu commented 1 year ago

NetAct:利用基因活性构建核心转录因子调控网络 by 生信宝库

前言

利用转录因子(TF)调控网络来分析动态的生物过程,是系统生物学的一个热门研究领域。特别是基于单细胞数据,在更精细的层面上分析核心转录因子的调控网络可以揭示很多重要的生物学问题。但是由于单细胞测序深度的问题,以及捕获的转录本的偏好性,我们经常无法直接通过转录因子的表达来找到具有功能差异的转录因子。因此基于基因调控网络(GRNs)的理念被提出,即通过比较某一转录因子上下游基因的表达情况来反推该转录因子的活性。SCENIC作为单细胞转录因子分析的代表软件近些年被广泛使用,但是它使用起来十分笨重,而且可分析的内容有限,因此目前急需新一代的单细胞转录因子分析软件。

今天,Immugent就来介绍一款轻便的基于单细胞数据进行转录因子分析的软件--NetAct,相关研究成果已于去年在Genome Biology杂志上发表,题目为“NetAct: a computational platform to construct core transcription factor regulatory networks using gene activity”。在这项研究中,作者提出了NetAct计算模型,即利用推算出来的基因活性来创建调控核心网络模型。在高通量数据集上,作者展示了NetAct创建的核心网络模型,成功分析了上皮细胞间质化(EMT)和巨噬细胞极化等生物模型。



主要内容

文章的第一幅图就是介绍了NetAct的工作流程,主要有三个步骤:首先从独自建立的包含TF-目标基因关系的综合集数据库找到有显著作用(差异表达)的TFs。作者借鉴了GSEA算法,并且利用自助抽样法(Bootstrapping)的精髓来找到关键的转录因子,这些转录因子是呈现差异表达的在对比实验的分组之中。第二个步骤是计算转录因子的活性。对每一个找到的差异表达的转录因子,NetAct把其调控的靶向基因成员分成了两组对应激活/抑制两个调控方向。分组是运用了纽曼的社区发现算法(Newman’s community detection algorithm)来分组。进而再在得到的每一个分组中把非信息性的基因成员过滤掉。

然后,利用剩下的基因成员的表达量和调控方向,来推算(希尔方程)出转录因子的活动,这一步也是NetAct算法的核心。最后,基于算出来的转录因子的活动,NetAct利用互信息演算出核心的调控网络并且运用模拟器来核实推断出来的调控网络的动态性和准确性。

为了评估推断的TF活性的准确性和稳健性,作者进行了大量的基准测试,并且将NetAct与其他现有方法进行比较。首先,作者对模拟数据进行基准测试,因为TF活动通常不能直接测量。一个TF的活性可以与其蛋白质水平或特定的翻译后修饰水平有关,如磷酸化。因此,从实验数据集中获取TF活动的ground truth是非常困难的。在这个基准测试中,作者依靠数学建模来模拟合成TF-目标网络中每个TF的表达和活动。此外,作者使用这些模拟数据,将NetAct与其他方法进行基准测试。通过对比测试的结果,作者证实了NetAct的性能远远优于其它同类软件。

随后,作者通过NetAct在一个时间序列的DNA微阵列数据集上,成功的构建了乙型转化生长因子诱导的上皮细胞间质化(TGF-β-induced EMT)。整体来说,NetAct高亮选择的转录因子和利用RACIPE模拟器软件精确的解释了丛E态到M态的转移。在这个分析过程中有一个亮点是,计算出来的基因活性要比原来的基因表达量要更具有清晰的变化。作者发现这些被选出来转录因子大都是被TGF- β诱导所引起的变化,但也有像STAT1/3这样的链接其他细胞信号传送通路的比如HGF, PDGF, IGF1, 和FGR。另外,NetAct还找到了DNA损伤应答通路和细胞循环通路。

最后,作者还利用NetAct在不同时间的RNA-seq上来分析骨髓源性巨噬细胞。这是一个较为复杂的体系,其中包括干扰素-γ(IFNγ)诱导成为的M1状态和白细胞介素-4(IL4)诱导成为的M2状态,还有被这两种细胞因子共同影响的M状态。原来的基因表达量和计算出来的基因活性在低纬度上,都清晰展现了这三个状态。总之,作者利用了NetAct详细阐发了这三个状态的转化。有意思的是,作者发现Myc虽然在IL4和IL4+ IFNγ诱导的状态下呈现出高表达量,但是Myc的活动(activity)只是在IL4状态下比较高。再通过RACIPE来实验认证,作者惊奇的发现M态是介于M1和M2之间的一个功能混合的状态。



说在最后

总的来说,NetAct并没有构建一个全方位的转录调控网络,而是专注于建模一个仅在关键tf之间相互作用的核心调控网络。潜在的假设是,这些tf和相关的调控相互作用在控制不同细胞状态的基因表达和状态转换模式中起着主要作用。利用NetAct识别出核心网络后,我们可以进一步使用RACIPE等数学建模算法进行仿真,分析核心网络的控制机制。这些模拟使我们能够产生新的假设,这些假设可以通过实验进一步验证。验证数据可以进一步帮助改进模型。理想情况下,这需要一个迭代的过程来完善核心网络模型,因此这是另一个有趣的研究方向。

在本文的开头Immugent介绍NetAct时,说它一大优势是使用起来十分轻便,至于如何轻便是通过文字无法表述的。因此,本期推文Immugent只是对NetAct的整体工作框架进行了介绍,后续会专门推出一篇推文对NetAct进行代码实操演练,敬请期待。

好啦,本期分享到这就结束了,我们下期再会~~


[参考文献]

Su K, Katebi A, Kohar V, Clauss B, Gordin D, Qin ZS, Karuturi RKM, Li S, Lu M. NetAct: a computational platform to construct core transcription factor regulatory networks using gene activity. Genome Biol. 2022 Dec 27;23(1):270. doi: 10.1186/s13059-022-02835-3. PMID: 36575445; PMCID: PMC9793520.



关注下方公众号下回更新不迷路