ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
103 stars 30 forks source link

YuLab JC | 小鼠大脑皮层细胞多样化的分子逻辑 #4164

Closed ixxmu closed 9 months ago

ixxmu commented 9 months ago

https://mp.weixin.qq.com/s/3qM4Yslzy-2ZGBNgMWD-eQ

ixxmu commented 9 months ago

YuLab JC | 小鼠大脑皮层细胞多样化的分子逻辑 by YuLabSMU

在过去的几十年里,哺乳动物大脑皮层的发生发育得到了深入的研究。然而,依然存在很多未知:控制细胞分化和调控分化机制依然没有充分了解确定细胞类型的时间点以及谱系分支确立的调控机制尚未明确

解答这些问题需要对所有皮质细胞的发育过程进行一个全面的观测,以探索大脑皮质细胞分化的分子机制为此,研究者采用scRNA-seq、scATAC-seq、slide-seq三种测序技术,建立了一个全面的单细胞转录和表观遗传学图谱,捕获了整个小鼠皮质发生过程中所有细胞类型的发育过程以加深对大脑皮层发育过程的理解。

技术路线: 

   

结果: 

皮层细胞类型随时间的变化情况 

研究人员从E10.5、E11.5、E12.5、E13.5、E14.5、E17.5、E18.5、P1、P4这9个时间点分别进行采样并进行单细胞转录组测序。在胚胎发育早期,大脑皮层主要存在顶端祖细胞和中间祖细胞(Fig 1b),从E12.5以后,祖细胞开始分化为投射神经元,例如皮质投射神经元(CFuPN)和胼胝体投射神经元(CPN)(Fig 1 b, c),少突胶质前体细胞和星型细胞在E17.5这一时间点开始出现,这种现象与已有研究相一致。

Figure 1. a大脑皮层细胞类型随时间的发育情况。CRCajal-Retzius细胞CP皮层板SV亚脑室下区VZ脑室区。b,所有时间点不同细胞类型UMAP可视化。c,不同细胞类型比例随时间的变化d, 所有时间点细胞的UMAP可视化    

皮层细胞的空间分布情况 

为了进一步探讨细胞类型的空间分布规律,研究人员分别在E12.5, E13.5, E15.5和P1四个时间点对大脑皮层进行空间转录组测序,并使用Tangram算法将scRNA-seq的单细胞标签映射到空间转录组的细胞,细胞所在的位置与既往研究相一致(Fig 2a)。分析空间转录组数据还定位到了瞬时的细胞状态,例如神经元从丘脑下区径向迁移到中间带,研究人员对E15.5这一时间点的兴奋迁移神经元和未成熟的神经元进行进一步的聚类,发现这些神经元主要分为5个亚类,这些亚类在空间上具有一定的分布规律,呈现从顶端到远端的规律性的一个分布(Fig 2b)。        

 

Figure 2. a, 左图展示了空间转录组切片不同细胞类型的分布情况,不同颜色代表不同的细胞类群。    

右图展示了使用Tangram算法预测的细胞类型的概率值。DV, dorso-ventral; ML, medio-lateral

b, 左图展示了E15.5这一时间点上迁移兴奋神经元重新聚类的结果,右上图展示了不同迁移兴奋神经元亚型的空间分布情况,右下图展示了不同细胞亚型marker基因的表达情况。

神经皮层细胞分化轨迹推断 

为了进一步探索神经皮层细胞分化轨迹,使用URD算法,根据细胞之间基因表达的相似性进行分化轨迹推断(Fig 3a),为了进一步验证轨迹推断的有效性,研究者同时使用了其他轨迹推断算法,包括monocle3等其他算法,发现不同轨迹推断算法计算出的结果基本一致(Extended figure 4b),并且将推断出的发育时间与实际发育时间进行比较,发现URD算法推断出的发育时间与实际发育时间基本一致。研究人员将细胞基因转录谱映射到发育树发现,神经元发育早期共同下调了细胞周期相关基因(Gadd45g),瞬时表达了神经发育相关基因(Neurog2)以及迁移相关基因(Sstrs2, Neurod1),并且上调了神经元相关的一些基因(Neurod2, Tubb3)(Fig 3b)。随后细胞类型特异的基因表达程序(SCPN(大脑下投射神经元):Bcl11b, Sox5, Thy1, Ldb2J;CPN:Cux1, Satb2, Plxna4, Cux2)开始表达。为了进一步刻画神经皮层细胞的发育过程,采用非负矩阵分解算法(NMF)识别不同发育时期激活的基因模块,不同的基因模块之间采用以下方法连接在一起:

1.根据每个模块的前25个基因进行加权的交集运算,以确定相邻时间点基因模块之间基因的重叠程度。

2.去掉两个相邻时间点中重叠少于20%的基因模块

3.连接两个相邻时间点的基因模块,如果相邻时间点没有找到对应的基因模块,则计算与其他时间点的基因模块的重叠程度,如果重叠程度较高,则连接这两个基因模块

4.从最后的时间点(P4)开始,将每个模块连接到与之相邻较早时间点的具有最高重叠水平的基因模块    

研究人员由此构建了基因程序(genetic programs)从不同角度刻画皮质发育过程(Fig 3c),分析基因程序发现发育早期主要出现的是一些共同的发育过程例如神经元发生以及神经元迁移,在E13.5这一时间点,神经细胞谱系特定的基因程序开始出现分化。(Fig 3c)

为了进一步探索与谱系分化相关的基因,采用以下方法识别谱系发育分支节点的决定性基因:

1、选择分支节点前后0.04个发育时间单位的细胞

2、使用Seurat包提供的FindMarkers函数(参数min.pct=0.1, logfc=0.2,Wicoxon秩和检验)识别母分支与子分支细胞的差异基因

3、对于每一个分支节点使用多重线性回归模型筛选高可变基因,得到与发育时间正相关或者负相关的高可变基因

4、使用第1,2步发现的基因,研究人员训练了一个梯度上升的分类器用于区分分支和其他分支以及母分支,并对每一个基因的分类性能进行打分(Friedman mean squared error, MSE)

对这些基因进行富集分析发现,这些基因富集到与DNA结合相关的蛋白,随着分化继续进展,这些基因更多的富集到细胞黏附和细胞骨架相关蛋白,反映了发育形态的变化。研究人员还发现排名靠前的基因包括一些决定细胞最终分化类型的转录因子,例如(Bcl11b, Fezf2, Satb2)。    

Figure 3. a, URD算法预测的神经皮层细胞分化发育树,根节点代表E10.5的初始祖先细胞,叶节点代表P4时间点的终末细胞,不同颜色代表不同细胞类型。b, 胝胼体投射神经元(CPN)和脑下投射神经元(SCPN)两种细胞谱系基因表达热图,每一行的基因根据其最大表达水平进行归一化,并按照其表达起始和峰值表达时间进行排序。c, 使用NMF算法识别到的基因表达程序,左图展示不同时间点的模块,每一个圆点代表特定时间点的基因模块。右图展示发育树上细胞谱系特异的基因模块的表达。d, 不同分化分支节点与细胞分化有关的前10个基因,根据重要性分数进行排序,颜色代表基因表达量,大小代表Friedman mean squared error(MSE)分数。     

 

    

Extended figure 4. a, 对所有时间点的细胞进行UMAP降维,细胞颜色代表时间信息。b, URD算法计算得到的发育时间和其他算法计算得到的发育时间的相关性

神经皮层发育表观组与转录组具有较高一致性 

为了探究表观遗传调控是否呈现相似的发育轨迹,在E13.5、E15.5和E18.5三个时间点进行转座酶可及性染色质测序(scATAC-seq),探索单细胞染色质可及性在发育中的变化。研究者使用signac包中提供的GeneActivity函数统计基因体上游2kb的peak数目并进行归一化作为基因的活性评分来描述基因染色质的可及性,在同一个UMAP空间中同时整合基因活性评分和单细胞转录组数据,(Fig 4a,底部),发现两种组学识别的细胞模态基本重合,表明染色质可及性捕捉到基因转录组所确定的完整细胞类型谱系。

然后使用URD算法,根据基因活性评分进行细胞轨迹推断。(Fig 4b)。在这棵树中,细胞类型随推断的发育时间的变化而变化,并且与实际发育时间和分化程度相关(fig 4b,c),与根据转录组数据构建的相同的三个时间点的简化分化轨迹树的结构相似。值得注意的是,近端投射神经元是唯一的在两棵树中被分配到不同分支的细胞类型(将fig 4b 和fig 3a进行比较),这表明这些神经元可能在分子层面上与CFuPN和CPN都相关。染色质可及性至少在一些基因上优于基因表达。 

神经皮层分化过程中的顺式调控 

为了确定在整个皮层发育过程中顺式调控元件(cis-regulatory elements, CRE)如何变化,研究者采用以下方法识别在发育过程中可变的顺式调控元件:

1、使用R包SCDC 从每一种细胞类型中不放回的随机抽取若干样本构建假的bulk-ATAC样本    

2、对于每一个时间点,使用R包DESeq2进行两两分组比较(筛选标准:fold change 大于2; adjusted P 小于0.05),识别每种细胞类型中可及性显著差异的peaks

3、对于每一个时间点,收集所有两两比较有差异的结果作为当前时间点细胞类型之间差异可及的顺式调控元件集合

细胞类型之间差异可及的顺式调控元件随着时间的增长而增加。研究者提取了不同时间点共同出现的顺式调控元件,并在每个时间点对其进行k均值聚类得到不同的顺势调控元件簇,从而识别细胞类型分化相关的模式(Fig 4e)。许多元件在整个发育过程一直在同一类的细胞类型中保持开放状态。例如,在E13.5这一时间点,顶端祖细胞开放的顺式调控元件中,76%在E18.5时间点的一个与祖细胞、早期神经元和星形胶质细胞相关的簇中出现。这个结果与顶端祖细胞是一个共享分子特征、并产生不同类别的投射神经元和星形胶质细胞的连续体的观点相一致。在E13.5或E15.5时在顶端祖细胞出现的顺式调控元件中,仅有少数在之后的时间点变为神经元选择性开放(分别为7%和8.5%)。

最后,研究者试图确定潜在的在个体谱系和分支点中起作用的转录因子。研究者使用ORA过表征的富集分析算法识别在特定细胞类型的顺式调控元件中过表征的已知转录因子的结合位点,其相应的转录因子在scRNA-seq数据中的相应细胞中表达。这在不同时间点鉴定了已知和新的确定细胞类型决定的调控因子(fig 4d)。例如,发育早期显示了在顶端祖细胞相关的增强子中出现了Dmrta2 motif的富集,该基因编码的转录因子在小鼠E12.5的祖细胞中表达。在较晚的阶段出现了细胞亚型特异性富集,包括layers 2&3 CPN中的Cux1、Cux2和Pou3f2的motif;CFuPN中的Bcl11b、Tbr1和Fezf2,以及Nfe2l3、Nfia和Hivep2;以及星形胶质细胞中的Hes5、Sox9和Klf3(fig 4e, Extended figure 10f)。    

研究者特别关注了RNA树中的CPN与CFuPN分支点。通过重要性评分排名的前40个基因的预测顺式调控元件富集了不同的转录因子结合位点:CFuPN分支点富集了Fezf2和Bcl11b,而CPN分支点富集了Pou3f2和Pou3f1(Extended figure 10 d)。与神经发生和神经元分化相关的转录因子(例如Neurog2、Neurod2)的motif在两个谱系中都富集,这个结果与已有研究相一致。

Fig 4 a, 对每一个时间点的scATAC-seq数据进行UMAP可视化。上图细胞颜色代表整合单细胞转录组和scATAC-seq组数据预测的细胞类型,下图细胞颜色代表scATAC-seq预测的细胞模态

b, c.使用URD算法构建的染色体可及性分化树,根节点代表E13.5时间点的祖细胞,叶节点代表E18.5时间点终末细胞类型。d, 不同发育阶段转录因子motif的富集结果,点的大小代表富集倍数,颜色代表基因表达量。上图展示不同分支转录因子motif富集情况,下图展示叶节点转录因子motif富集情况。    

Extended fig 10 d, 在CPN与CFuPN分支点细胞的可及位点上转录因子结合位点的富集结果。f, Slide-seq基因表达显示了几种转录因子(TFs)的表达情况   

 

Fezf2 转录因子控制CFuPN和CPN的细胞命运选择 

为了进一步验证发育分子图谱在阐明影响皮层发育的功能丧失小鼠模型中表型变化方面的有效性,研究者选择了Fezf2进行突变,因为该基因的缺失导致SCPN的完全丧失,关于SCP丧失的机制,以及SCPN产生的机制,依然知之甚少。   

 

    

研究者在E15.5和P1两个时间点对Fezf2突变小鼠的大脑皮层进行了单细胞RNA测序,分别得到了17,344个对照(Het,杂合)和16,117个基因敲除细胞。研究者应用了NMF算法识别基因模块以鉴定两种基因型之间的差异。在E15.5这个时间点,之前分析中出现的所有模块在Fezf2数据集中均存在。Fezf2在SCPN和CThPN特异的基因模块中排名较高(Fig 5a),并且,在Fezf敲除后,SCPN和CThPN特异的基因模块在敲除细胞中特异性下调(Fig 5b),这些模块中的前100个排名最高的基因约70%也是如此(Fig 5b)。

在Fezf2敲除小鼠中,SCPN和CThPN被一个敲除特异性群体所替代(Fig 5c, d)。为了定义这些细胞的最接近的细胞类型,研究者基于野生型细胞转录组数据训练了多分类随机森林分类器,并使用这个分类器预测敲除特异性细胞最接近的细胞类型。大多数敲除特异性细胞被分配到CThPN或layers 5&6 CPN(Fig 5e)。尽管22%的敲除特异性细胞在E15.5被分类为SCPN,但在P1时只有1%,这表明一部分细胞短暂地表达了一种与独立于Fezf2的CFuPN/SCPN基因表达程序。敲除特异性的CThPN样细胞上调了CPN基因。敲除特异性的CPN样细胞与控制组的CPN和SCPN都有明显差异。

分析显示,Fezf2的丧失在CThPN中上调了CPN基因,并导致SCPN被一种类似但与layers 5&6的CPN不同的细胞替代。这表明Fezf2在发育中CFuPN中抑制了CPN基因程序。异常的细胞群体不是停滞在不成熟阶段的细胞,而是与内源性细胞类型不同的新细胞类型。   

 

    

Fig. 5 Fezf2阻止CFuPN分化为胝胼体神经元。a, 基因模块表达程序,颜色代表Fezf2评分。

b,受影响的模块在E15.5这一时间点中的表达情况。按基因型计算SCPN和CThPN模块的前30个基因在顶端祖细胞(AP)、中间祖细胞(IP)和兴奋性神经元(N)中的平均表达。对照组(Het)和敲除神经元之间的差异表达进行了统计检验(双侧Wilcoxon秩和检验,Bonferroni校正)。c,对E15.5对照组和敲除组大脑皮层的单细胞进行UMAP可视化,左图细胞颜色代表基因型,右图细胞颜色代表细胞类型。d,不同细胞类型基因型比例的分布情况。e,使用野生型图谱训练的分类器主要将敲除特异性聚类(UMAP插图中的红色)分配给CThPN和layers 5&6 CPN。DL neurons,深层神经元。

         

 

在过去三十年的广泛研究中,已经鉴定出一些控制新皮质主要神经元发育的关键基因。然而,大脑皮质如何产生其细胞多样性的机制仍然不清楚。这项工作全面收集了每个皮质细胞谱系在时间上的所有分子状态,并开始识别潜在的分子和调控元件,这些因素潜在地影响着细胞命运的确定。这种类型的数据有助于遗传学试验筛选候选基因进行功能性研究,这种方法还可以应用到其他哺乳动物大脑区域。