ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
103 stars 30 forks source link

ScienceAdvances:从单细胞多组学数据发现顺式调控元件并构建调控网络 #4269

Closed ixxmu closed 8 months ago

ixxmu commented 8 months ago

https://mp.weixin.qq.com/s/L686c0_gV7RHMsm8JMfsdQ

ixxmu commented 8 months ago

ScienceAdvances:从单细胞多组学数据发现顺式调控元件并构建调控网络 by 作图丫

导语

     单细胞多组学数据的出现为研究控制细胞身份的转录调控机制提供了前所未有的机会。然而,如何使用这些数据集在单细胞水平剖析顺式调控元件(CRE)与基因的关系仍然是一个重大挑战。在这里,我们提出了 DIRECT-NET,一种基于梯度增强的机器学习方法,用于从并行单细胞基因表达和染色质可及性数据或单细胞染色质可及性中识别全基因组 CRE 及其与目标基因的关系仅数据。通过使用独立的功能基因组学数据广泛评估和表征 DIRECT-NET 预测的 CRE,我们发现与现有方法相比,DIRECT-NET 大大提高了推断 CRE 与基因关系的准确性。DIRECT-NET 还能够揭示细胞亚群特异性和动态的调控联系。总体而言,DIRECT-NET 提供了一种从单细胞多组学数据预测转录调控代码的有效工具。

背景介绍




今天小编为大家带来一篇从单细胞多组学数据发现顺式调控元件并构建调控网络发表在10分+ Science Advances的新思路。题目为DIRECT-NET: An efficient method to discover cis-regulatory elements and construct regulatory networks from single-cell multiomics data
研究设计




DIRECT-NET是一种检测功能性CRE、将CRE与其靶基因联系起来并构建TF-to-CRE-to-gene调控网络的工具。对于每个基因(黄色矩形),其转录起始位点(TSS)上游500bp内的任何峰被定义为启动子(即绿色矩形),而启动子区域之外但在启动子区域内的其他开放染色质区域被定义为启动子(即绿色矩形)。用户指定的邻域(默认为两侧250kb)被定义为远端候选功能区域。DIRECT-NET采用并行scRNA-seq和scATAC-seq数据或scATAC-seq数据作为输入。为了解决单细胞测序数据的稀疏性,特别是对于近乎二元的 scATAC-seq 数据,聚合通常被用作一种有效的对策。因此,DIRECT-NET首先聚合相似细胞的二元表观基因组信号或转录组和表观基因组图谱,这些信号是根据输入数据的学习低维表示中的最近邻居推断出来的。其次,DIRECT-NET 通过回归特定基因的表达水平(平行scRNA-seq和scATAC-seq)或启动子的可及性得分(scATAC-seq)来识别CRE,使用其所有可能峰的可及性得分通过基于高效集成梯度增强机器的模型 XGBoost 进行邻域分析。第三,我们的DIRECT-NET模型然后通过从XGBoost模型学到的重要性分数来选择功能性CRE。最后,我们通过将 CRE-TF与CRE-基因关系整合来构建TF-基因调控网络,其中TF与使用公共数据库中已知基序模式推断的预测功能CRE结合。

结果解析




1. DIRECT-NET从单细胞多组学数据中揭示细胞状态特异性调控元件
细胞状态特异性CRE的识别对于剖析细胞命运决定至关重要。为了评估 DIRECT-NET检测细胞状态特异性CRE的能力,我们首先使用19个细胞簇的 11,909 个人外周血单核细胞 (PBMC),测量相同细胞中的转录组和染色质可及性概况。
通过根据从高到低的推断权重将调控链接分为五组,我们观察到具有较高重要性得分的调控链接与启动子捕获 HiC (PCHiC)连接表现出更高的一致性。重要性分数为零的峰值在 PCHiC 数据中几乎没有联系。另一方面,我们发现PCHiC连接最容易被重要性得分较高的监管链接所回忆,这表明 DIRECT-NET 能够区分非功能性开放染色质区域和功能性 CRE。
为了研究 DIRECT-NET 揭示细胞状态特异性调控元件的能力,我们首先将峰分为高置信度 (HC) CRE、中置信度 (MC) 区域和低置信度 (LC) 区域。在本研究中,我们将 HC CRE 视为功能性 CRE。我们发现 HC CRE 能够区分每种细胞状态,而 MC 区域显示一些混合细胞状态,例如T reg(调节性T细胞)、CD4 T CM(中央记忆T细胞)和CD4 T EM(效应记忆 T 细胞),并且细胞与UMAP(均匀流形近似和投影)空间上的LC区域完全混合。接下来,我们根据局部逆辛普森指数 (LISI) 和 Silhouette 指标对性能进行了定量比较。HC CRE 显示出比 MC 和 LC 区域更高的 LISI 和 Silhouette 值,通过单侧 Wilcoxon 秩检验。为了检查 HC CRE 是否在最容易接近的峰中富集,我们使用Seurat中的逻辑回归检验确定了最容易接近的峰。在确定的26,139个最容易接近的峰、80,740个HC CRE和29,162个纯 HC CRE(从所有 HC CRE 中删除与 MC 或 LC 区域重叠的峰)中,我们发现85%最容易接近的峰是HC CRE,38%最容易接近的峰是纯HC CRE。此外,通过使用 Fisher 精确检验,纯 HC CRE 在最容易接近的峰中显着富集 ( P < 2.2 × 10 -16 )。然后,我们应用先前研究中可用的天然CD4 T细胞、天然CD8 T细胞和天然B细胞的PCHiC数据来验证预测的细胞状态特异性CRE。这里,HC CRE和启动子之间的连接称为HC功能连接,而LC区域和启动子之间的连接称为LC连接。对于这三种细胞状态中的每一种,与 LC 链接相比,相应的 PCHiC 数据对所识别的 HC 功能链接进行了高度验证 。另一方面,与 LC 链接和 MC 链接相比,细胞状态特定 PCHiC 数据中的连接在 HC 功能链接中被高度回忆。我们合并了这三个PCHiC的重要交互。然后,我们根据合并的PCHiC数据和幼稚B细胞、CD4幼稚T细胞和CD8 幼稚 T,计算了通过 PCHiC 连接验证的链接比率以及通过这三种不同细胞状态的标记链接召回的 PCHiC 连接比率。单独的细胞特定 PCHiC 数据。我们发现,通过合并 PCHiC 数据验证的链接比率比相应细胞状态特异性标记的细胞状态特异性 PCHiC 数据显着增加。然而,召回的合并 PCHiC 连接的比率和召回的细胞状态特定 PCHiC 连接的比率具有可比性。


2. 从时间进程并行scRNA-seq和scATAC-seq数据构建动态基因调控网络
接下来,我们评估了DIRECT-NET从并行scRNA-seq和scATAC-seq数据的动态过程中学习 CRE 和重建基因调控网络的能力。我们对2641个肺腺癌来源的 A549 细胞进行 100 nM 地塞米松 (DEX) 处理 0、1 和 3 小时后应用 DIRECT-NET,其中包括在相同细胞中测量的基因表达和染色质可及性特征。为了检测 DEX 治疗过程中的监管变化,我们重点关注三个时间点差异表达基因的CRE。与上述 PBMC 数据集中的观察结果类似,具有高重要性分数的监管链接与从ENCODE下载的HiC连接显示出高度一致性,而具有零重要性分数的链接与 HiC 数据几乎没有一致性。通过 HiC 数据,HC CRE 与靶基因之间的联系比 MC 和 LC 区域的联系得到更高程度的验证。此外,HC CRE 比 MC 和 LC 区域更能回忆起 HiC 连接,说明了 DIRECT-NET 区分标记基因附近的功能区域和功能较少区域的能力。此外,DIRECT-NET 的 AUC 值显着高于 Cicero、Spearman、Lasso、Ridge、ElasticNet、Distance 和 CloseGene 方法。与 Cicero 相比,DIRECT-NET根据 HiC 数据召回了更多监管环节。超过 60% 的链接在高重要性和高共同可达性的链接之间重叠。
接下来,我们从以下三个方面探讨了DIRECT-NET是否能够捕获CRE的生物学意义。首先,通过使用PHATE对HC CRE 的染色质可及性数据进行降维,我们发现三个时间点的细胞在低维空间中很好地分离。相反,0小时和1小时的细胞混合,峰值重要性值等于0,表明CRE具有剖析细胞异质性的能力。其次,与之前的结果类似,我们进一步比较了已发现的 HC CRE 和 LC 区域的跨种群和跨物种保守性。正如预期的那样,与使用 PCAWG 变体的 MC 和 LC 区域相比,HC CRE 在罕见变体中显着富集。第三,HC CRE 显示出显着高于 MC 和 LC 区域的 PhastCons 分数。总之,这些结果表明 DIRECT-NET 可以在动态过程中从并行 scRNA-seq 和 scATAC-seq 数据中产生可解释且具有生物学意义的 CRE。
为了进一步证明 DIRECT-NET 预测与动态过程相关的CRE的能力,我们检查了已识别的与 NR3C1 相关的 HC CRE 的 ChIP-seq 信号,NR3C1 是治疗后早期事件的众所周知的标志物。正如预期的那样,HC CRE 在 0 小时时没有 NR3C1 信号,但在 1 小时时具有最高的 NR3C1 信号,这与 NR3C1 作为治疗后早期激活标记物的作用一致。此外,HC CRE 在1小时和3小时时表现出比MC和LC区域更高的 NR3C1 信号,并且在所有时间点都表现出比 MC 和 LC 区域更高的H3K27ac 信号。这些结果表明DIRECT-NET成功识别了与动态流程相关的功能性CRE。

3.从成人大脑的 scATAC-seq 数据中检测细胞状态特异性神经系统疾病相关的调控元件

CRE 鉴定对于了解疾病机制至关重要。为了评估DIRECT-NET检测与脑部疾病相关的CRE的能力,我们使用了成人大脑七个脑区的70,631个单个细胞的 scATAC-seq 数据。基于无偏迭代聚类和基于Harmony的批量校正方法,识别了18个不同的簇。具有较高重要性值的链接往往与 HiChIP 连接表现出更高的一致性。

首先,我们通过以下四个标准证明了所鉴定的HC CRE的生物学意义。首先,大多数细胞状态(例如小胶质细胞、同皮质抑制性和同皮质兴奋性)由 UMAP 空间上的 HC 和 MC 区域来区分。HC CRE 在分化海马兴奋性和 OPC(少突胶质祖细胞)方面比 MC 区域具有更好的性能,而细胞与 LC 区域完全混合。其次,基于 HiChIP 数据,HC CRE 显示出比 MC 和 LC 区域更高的验证率。此外,HC CRE 比 MC 和 LC 区域召回更多的 HiChIP 链接第三,稀有变异在HC CRE中比在MC和LC区域中显着富集此外,发现HC CRE比MC和LC区域更保守第四,与 MC 和 LC 区域相比,细胞状态特异性标记基因的 HC CRE 表现出最高的 H3K27ac 信号。例如,黑质OPC簇的标记基因的HC CRE显示比MC和LC区域更强的黑质H3K27ac信号黑质星形胶质细胞和纹状体星形胶质细胞簇的 HC CRE 具有强烈的星形胶质细胞 H3K27ac 信号。接下来,我们将 DIRECT-NET 与其他方法在识别与 HiChIP 重叠的环路方面进行比较与其他方法相比,距离具有最高的 AUC 值,这与监管链接往往是邻近的事实一致。DIRECT-NET、Spearman 和 ArchR 的 AUC 值高于 ElasticNet、Circero 和 CloseGene此外,DIRECT-NET 还可以调用更近端的 HiChIP 连接DIRECT-NET 经 HiChIP 验证的链接数量比 Cicero 和 ArchR 更多。

为了探索 HC CRE 是否可以揭示神经系统疾病变异,我们计算了这些 CRE 中精神疾病自闭症相关疾病的GWAS单核苷酸多态性 (SNP) 的连锁不平衡 (LD) 评分回归。我们发现纹状体抑制1和纹状体抑制2簇的HC CRE在与自闭症相关的变异中显着富集。FEV(ETS 家族成员)是血清素能神经元的发育和功能所必需的,并且它是与自闭症相关的关键转录因子。我们注意到FEV在纹状体抑制2中高表达,并通过基因调控网络调节一些纹状体抑制2特异性标记物(NAT14、RGS14、DEGS2、PCP4L1和CCDC39)。先前的研究表明,两个患有自闭症的兄弟携带 FEV 纯合停止增益突变。在这里,我们重点关注FEV的调控环节,发现两个自闭症SNP rs78146971和rs111227810位于一个HC CRE附近。此外,CRE 在纹状体抑制 1 中的可及性比纹状体抑制 2 中的可及性弱(log 2倍数变化 = 1.57)。因此,DIRECT-NET 有潜力揭示与脑部疾病相关的微小细胞亚群特异性 CRE。

讨论




在本研究中,我们的目标是从单个细胞状态(例如幼稚 B 细胞、幼稚 CD4 T 细胞和幼稚 CD8 T 细胞)中提取验证数据,而不是仅分析未排序的 PBMC 数据。我们观察到,在所有这些数据集中,DIRECT-NET 在识别这些验证链接方面的特异性都超过了 0.8。随着单细胞 3D 基因组组织图谱技术(例如单细胞 HiC)的快速发展,将有更多数据可用于基准测试和优化方法。虽然还有很大的改进空间,但 DIRECT-NET 已经提供了一种检测功能性 CRE 和构建基因调控网络的有效方法,解决了从单细胞数据中提取细胞异质性和调控机制信息的迫切需求。


往期推荐


分析专辑


单细胞scRNA | R包绘图 | 免疫浸润分析 | 肿瘤纯度评估工具 | 数据库


文章解读专辑


多区域进化文章精读 | 高分文章精读 | 免疫微环境文献解读


招聘信息


招聘


点击红字即可进入专栏!

文字均为原创,欢迎读者分享或转发到朋友圈,任何公众号或其他媒体未经许可不得私自转载或抄袭。
由于微信平台算法改版,公众号内容将不再以时间排序展示,建议设置“作图丫”公众号为星标,防止丢失。星标具体步骤为:
(1)点击页面最上方“作图丫”,进入公众号主页;
(2)点击右上角的小点点,在弹出界面选择“设为星标”即可。


点个在看你最好看