ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
125 stars 31 forks source link

“我的眼睛就是尺!”人类视网膜遗传变异全解析! #4738

Closed ixxmu closed 8 months ago

ixxmu commented 8 months ago

https://mp.weixin.qq.com/s/km68J6grz8XflLFqs5hMEg

ixxmu commented 8 months ago

“我的眼睛就是尺!”人类视网膜遗传变异全解析! by 生信人

ps:亲爱的读者,微信公众号又改版了,如果没有星标,公号文章就会渐渐沉底,错过生信热门知识。

给生信人一个星标,让我们每天都能见面。方法如下 :👇 👇


新一年要有新思路!遗传变异、多组学、单细胞、转录因子······众多研究热点汇聚到了今天小编为大家带来的这篇文章中,本文讲述了人类视网膜的单细胞多组学揭示遗传变异对基因调控的细胞类型特异性介导影响的分层转录因子协同作用。文章题目是Single-cell multiomics of the human retina reveals hierarchical transcription factor collaboration in mediating cell type-specific effects of genetic variants on gene regulation,于2023年11月28日发表在Genome Biology(IF=12.3)上,思路新颖全面,十分值得学习~



文章总览

背景:基因调控是细胞类型依赖的,而基因变异在个体之间的调控过程中起到重要作用,是复杂性状和疾病的主要因素,但其在细胞类型特异性背景中调控基因表达的机制仍然不清楚。bulk测序对于解析基因调控的细胞类型效应能力有限,而单细胞组学技术的进展可以填补这个空白,不过基因变异的细胞类型/状态特异性效应的机制仍然不清楚。


思路:作者结合基因组测序和单细胞多组学的基因表达和染色质可及性分析,以获得进一步的见解(图1a)。


图1a


研究分为以下几步:

首先,对20个健康人员的视网膜细胞进行了全基因组测序(WGS)、单细胞RNA测序(snRNA-seq)和转座酶可及性染色质测序(snATAC-seq)。


其次,对主要视网膜细胞类型进行了单细胞表达性状定量性状位点(sc-eQTL)、单细胞染色质可及性定量性状位点(sc-caQTL)、单细胞等位基因特异性表达(sc-ASE)和单细胞等位基因特异性染色质可及性(sc-ASCA)的定位(图1a)。


然后,通过整合这些结果,在全基因组范围内鉴定和表征基因调控元件以及在特定细胞类型背景中影响染色质可及性和基因表达的遗传变异。


进而通过大规模平行报告基因检测验证了这些推测的顺式调控性元素,并结合转录因子(TF)和组蛋白修饰的染色质免疫共沉淀测序(ChIP-seq)数据进行分析。在这一步作者发现大多数鉴定出的单细胞QTLs具有单一细胞类型特异性,这表明相当一部分变异以细胞类型依赖的方式调控基因表达和染色质可及性。


进一步分析表明,基因变异的细胞类型特异性效应可以归因于调控因子的细胞类型特异性表达和受影响顺式调控性元件的染色质可及性的调节(通过调控基因变异对TF结合的干扰)。


最后,通过整合单细胞多组学数据、遗传关联结果和全基因组关联研究(GWAS),作者确定了富集的细胞类型、精细映射的候选致病变异和基因,并揭示了GWAS位点的调控机制。


结果解读

1. 20个健康人类供体视网膜的单核多组学分析

为了在细胞类型特定的背景下探索基因表达和染色质可及性,研究对20名健康人类供体的视网膜进行了snRNA-seq和snATAC-seq分析(图1a)。对于snRNA-seq,经过质量控制(QC)后,共将192,792个细胞核聚类成10个主要视网膜细胞类别,包括棒状感光细胞(Rod),锥形感光细胞(Cone),双极细胞(BC),星形细胞(AC),水平细胞(HC),穆勒胶质细胞(MG),视网膜节细胞(RGC),星形胶质细胞(Astro),内皮细胞和微胶质细胞。同时,对同一组供体视网膜进行了snATAC-seq。在QC后,共合并了245,940个细胞核聚类成9个主要视网膜细胞类别(图1b)。


图1b


与细胞类型注释一致,典型的细胞类型标记基因分别在snRNA-seq和snATAC-seq的相应细胞簇中显示出特异性表达和基因活性(图1c)。此外,两种方法得到的样本中细胞类型比例的分布高度一致,范围从2.5%的RGC到55.2%的Rod(图1d)。


图1c


图1d


研究从snATACseq数据中共识别出430,567个开放染色质区域(OCRs),每个细胞类型在48,764个到199,666个之间不等。为了评估这些OCR的质量,作者将其与批量ATAC-seq检测到的OCR进行了比较。snATAC-seq OCRs表现出很高的敏感性,捕获到了大部分由批量ATAC-seq鉴定出的OCR。为了进一步评估snATAC-seq OCRs,研究调查了每种细胞类型的OCR内的TF结合位点的富集情况(图1e)。一致地,许多已鉴定的TF先前被证明在视网膜中发挥细胞类型特异性作用,如感光细胞中的OTX2,水平细胞中的CRX,MEF2D,ONECUT2,及NFIA,NFIB,NFIX和 LHX2在星形胶质细胞中都被发现。接下来,研究基于多组学数据集,通过将OCR的可访问性与附近(±250 kb)的启动子可访问性或基因表达进行相关性分析,作者鉴定出相关的顺式调控元素(CREs)以及其靶基因,并将这些OCR称为关联CREs(LCREs,图1f)。


图1e、f


约16.6%(71,274个)的OCR与13,405个目标基因相关联,平均每个细胞类型的基因有5.9个LCREs。此外,LCREs高度富集于活性增强子。例如,在感光细胞中,81.8%的LCREs具有活性增强子的表观遗传修饰,即共同的H3K4me2和H3K27ac修饰,相比于所有OCR显示出2.1倍的富集(图1g)。对于每种细胞类型,平均有5.9%的LCREs位于特定细胞类型的OCR中,62.1%的LCREs来自多个细胞类型共享的OCR,而32.0%的LCREs位于恒定的OCR中(图1g),即LCREs往往位于更动态的OCR中。


图1g


2. 在视网膜中,很大比例的sc-eQTL具有细胞特异性

作者对每个供体进行了WGS以分析遗传变异,经过质控后共得到980万个遗传变异位点。下一步对每一种主要视网膜细胞类型进行了sc-eQTL定位,以确定哪些遗传变异对基因表达产生影响。以等位基因频率≥0.1和位于基因周围OCR(基因转录起始位点附近,±250 kb)内为筛选条件共获得了421,004个变异位点,每个基因平均有59.9个变异位点,每个细胞类型的OCR平均有2.8个变异位点。


本次共14,377个sc-eQTL被识别出来(FDR < 10%),并根据连锁不平衡(LD,r2 > 0.5)及与其eGenes的关系进行分组,得到5688个独立的sc-eQTL,与4069个sc-eGene相关,每个细胞类型的sc-eQTL组数量在704到1175个之间(图2a、b)。大多数的sc-eQTL都是特定于某个细胞类型的,87.0%至92.3%的sc-eQTL仅在一个细胞类型中被鉴定出来(图2a)。


图2a、b


一致地,sc-eQTL在细胞类型之间的影响与细胞类型的相似性有关(图2c),例如,杆状细胞和锥状细胞之间观察到了更强的相关性(Pearson相关系数r=0.6)。


图2c


这些结果表明遗传变异对于基因调控在具有相似转录程序的密切相关细胞类型之间具有更一致的影响。作者还发现在非启动子OCR中定位的sc-eQTL,与单个细胞类型共享的sc-eQTL通常比特定于某个细胞类型的sc-eQTL具有更大的效应大小(例如杆状细胞,双侧Wilcoxon秩和检验,p=1.88×10-5,图2d)。一致地,在非启动子OCR中定位的sc-eQTL,与多个细胞类型共享的sc-eQTL比特定于某个细胞类型的sc-eQTL更接近与其eGene的TSS(例如杆状细胞,双侧Wilcoxon秩和检验,p=9.75×10-11,图2e)。


图2d、e


3. 用bulk eQTLs 和sc-ASE验证sc‑eQTLs

作者将sc-eQTLs与之前 GTEx的全转录组测序在视网膜和其他组织中鉴定的bulk eQTLs进行比较后发现sc-eQTLs富集于bulk eQTLs。平均而言,有35.6%的sc-eQTLs与bulk视网膜eQTLs重叠,并且有56.0%与来自49个组织的bulk eQTLs重叠(图2f)。重叠比例在不同细胞类型之间有所变化。最丰富的细胞类型Rod的重叠比例最高(63.9%),而HC的重叠比例最低(49.0%)(图2f)。


图2f


而eQTLs的效应方向在不同的细胞类型和组织之间基本一致(图2g)。图2h显示了相关细胞类型中重叠的sc-ASEs(X轴)和sc-eQTLs(Y轴)的效应大小。皮尔逊相关系数和p值在图中提示重叠的sc-eQTLs和sc-ASEs之间呈正相关(Pearson相关系数r为0.68-0.77,p < 2.2×10 -16),大多数(82.5%-94.2%)重叠变异的效应方向相同。


图2g、h


4. 细胞类型特异性sc-eQTL通常存在于多种细胞类型共享的OCR中

研究识别到大多数的sc-eQTLs(87.0-92.3%)仅存在于一个细胞类型中,而相关的sc-eGenes (94.6-98.9%) 几乎总是在多个细胞类型中表达 (图2a和3a)。同一个细胞类型中的同一sc-eGene通常出现不同的sc-eQTLs (总sc-eQTL的36.4%,图3b),而这些sc-eQTL通常位于不同的OCR内。仅有很小一部分 (11.4%) 的sc-eQTL位于与sc-eQTL特异性相匹配的OCR内 (图3c)。


图3a、b、c


例如,变异位点rs10793810被鉴定为MG特异性的sc-eQTL,影响SLC27A6的表达。预测结果显示,该变异位点增强了FOXP2与SLC27A6的MG特异性LCRE的结合(FOXP2在MG中高表达,图3d)。这个变异很可能会破坏NR3C1与一个在Rod和Cone中均可访问的LCRE的结合(图3e)。


图3d、e


此外,基因变异扰乱的TF的基序往往在表达有sc-eQTL效应的细胞类型中的表达水平更高,相比之下,在OCR中含有sc-eQTLs的细胞类型中,则没有这种影响(图3f)。


图3f


5. 在视网膜中,sc-caQTLs具有显著的细胞特异性

作者与sc-eQTL分析并行进行了sc-caQTL分析识别影响染色质可及性的遗传变异,即针对每个主要视网膜细胞类型分析每个OCR中的常见变异与之间的关联。总共分析了174,419个OCR和同一组被sc-eQTL检测的遗传变异,总共鉴定出23,287个sc-caQTLs (FDR < 10%)。以LD ( r2>0.5 )筛选sc-caQTLs为12,482个独立的sc-caQTL集合,映射在10,298个OCR上,每个细胞类型的sc-caQTLs集合数量在391至4789之间(图4a,b)。


图4a,b


与sc-eQTLs类似,大多数sc-caQTLs是与单个细胞类型特异性相关的,62.3%至85.7%的sc-caQTLs仅在一个细胞类型中存在。sc-caQTLs的效应大小在细胞类型之间存在相关性,较为相关的细胞类型之间的相关性更强(图4c)。


图4c


与细胞类型之间sc-eQTL效应大小的相关性相比,sc-caQTLs的相关性较小。这表明与基因表达相比,sc-caQTLs的效应显示出更高的细胞类型特异性。与非启动子OCR中的sc-eQTLs类似,展示在多个细胞类型中共有的sc-caQTLs比仅在一个细胞类型中特异性的sc-caQTLs显示出更显著的效应(例Rod,双侧Wilcoxon秩和检验,p = 1.09×10 -132, 图4d)。


图4d


为了评估已识别的sc-caQTL的质量,作者将它们与sc-ASCA进行了比较。在8.7%至41.8%的sc-caQTL中检测到具有sc-ASCA。与背景变异相比,平均富集了15.9倍的变异。sc-ASCA的效应大小和方向与重叠的sc-caQTL呈正相关,其中大多数(82.4-100%)重叠的变异显示相同的效应方向(图4e)。


图4e


6.细胞类型特异性sc-caQTLs通常存在于多种细胞类型共享的OCR中

与sc-eQTLs类似,大多数(62.3-85.7%)的sc-caQTLs也是特定于某一种细胞类型的,而大多数(74.8%)的sc-caPeaks在多种细胞类型中都是共享的(图4a,f)。


图4f


作者发现变异位点rs12447029在MG中通过增强NFE2L2(在多个细胞类型中高表达)与其所在OCR的结合而表现出sc-caQTL效应,该OCR特异性地在MG中出现(图5a)。一致的是,相应的OCR是GRIN2A的LCRE,rs12447029是GRIN2A在MG中的sc-eQTL。另一方面,许多sc-caQTLs的细胞类型特异性不能完全归因于所在OCR的细胞类型特异性。大部分(68.3%)的sc-caQTLs是特定于一种细胞类型的,但存在于多种细胞类型共享的OCR中,这表明遗传变异调控染色质可访问性通常依赖于细胞类型,并可能通过干扰细胞特异性TF(Fig. 4f)的结合来实现。例如,变异位点rs6859300在Rod中特异性地影响其所在OCR的染色质可访问性,尽管该OCR在多种细胞类型(即Rod、Cone和BC)中都是可访问的(图5b),可能通过增强EPAS1在Rod中的结合而实现,而该转录因子在Cone和BC中表达较低。


图5a、b


此外,由遗传变异扰动的TF结合位点倾向于在表现出sc-caQTL效应的细胞类型中具有较高的表达水平,与对其没有效应的细胞类型相比,即使包含sc-caQTLs的OCR在两种细胞类型中都是可访问的。这一结果支持TF在驱动细胞特异性sc-caQTL效应在全基因组范围内发挥作用(图5c)。


图5c


7. OCRs之间的相互作用

作者为了探索元件之间的互作,鉴定了与1942个主元件相关联的2511个依赖区域。其中,与427个同一基因的依赖区域相关的360个主元件是LCRE元件。在此期间作者观察到与依赖OCR相关联的sc-caQTLs以及与依赖的LCRE相关联的sc-caQTLs,这表明sc-caQTL/主元件和依赖元件之间的关联并非随机事件(图6a)。


图6a


此外,59.7%的主OCR与至少一个相应的依赖OCR具有共同可及性,与背景相比有2.8倍的富集度,进一步支持主和依赖OCR之间的相互作用。sc-caQTLs对主区域和依赖区域的效应大小呈正相关,并且大多数(65.0-82.0%)的sc-caQTLs在主和依赖区域上具有相同的效应方向(图6b)。


图6b


此外,研究还观察到与依赖区域相比,主区域在DARs上富集程度稍高。与LCRE相关的caPeaks富集了活跃增强子表观修饰(图6c)。


图6c


虽然大多数(66.5-87.7%)的主区域与一个依赖区域相关,但有些主区域与多个依赖区域相关。例如sc-caQTL的变异rs7596259增加了其所在主区域的可及性,并且还与Rod中的其他三个依赖区域的可及性增加有关(图6d)。


图6d


这表明与效应方向相反的相关的顺式元件之间的补偿效应可能会中和它们对基因表达的影响。例如,sc-caQTL变异rs1493699降低了其所在主区域(chr15:77664198-77665218)的可及性,并且与MG中的一个依赖区域(chr15:77873253-77874263)的可及性增加有关(图6e)。尽管这两个元件都是PEAK1的LCREs,但这个sc-caQTL并不是PEAK1的sc-eQTL,这表明这两个LCRE可能互相补偿,导致基因表达总体上没有变化(图6e)。


图6e


8. 含有sc- eQTLs的OCRs的大规模并行报告分析

为了验证关联研究的结果,研究进行了大规模并行报告分析(MPRAs),评估了931个包含在人类杆状细胞中鉴定出的指标sc-eQTLs的OCR的调控活性。这些序列在出生后的第0至8天的小鼠视网膜中进行了测试,该阶段主要由杆状细胞组成(图7a)。


图7a


在进行MPRA实验后,作者计算了每个文库序列的活性分数,并基于基础Crx启动子的活性对其进行了归一化处理。结果鉴定出了258个增强子和66个抑制子,它们的活性至少比基础活性(即Crx基础启动子的活性,q值<0.05)高出或低于两倍,并且鉴定出了607个无活性序列,其活性在基础活性的两倍变化范围内或与基础活性没有显著差异(q值≥0.05,图7b、c)。


图7b


图7c


通过将MPRA结果与成年人类视网膜的批量ChIP-seq数据整合,研究观察到经验证的增强子明显富集于感光细胞特异性TF的结合位点,如OTX2、CRX和MEF2D,而与无活性序列相比则表现更高(图7d)。这些结果为OCR中包含sc-eQTLs的序列是活性CREs的实验证据,暗示遗传变异扰乱这些元素可能导致基因表达的改变。经验证的增强子相对于无活性元素在早期谱系决定因子OTX2与至少一种特定于细胞类型/环境的TF(即CRX、MEF2D和NRL)的共结合中富集(图7e)。这一结果表明OTX2可能作为一种先导因子的潜在作用。这些发现也表明先导因子/早期谱系决定因子与特定于细胞类型/环境的因子之间的协作对于基因调控至关重要。


图7e


9. 优先考虑GWAS位点的因果变异和细胞类型背景

在这一步,作者提出单细胞多组学数据为在细胞类型特异性环境中对GWAS位点进行精细定位提供了独特的机会。首先,通过利用单个细胞类型的染色质可及性和基因表达,对与11种眼部特征或疾病相关的GWAS位点进行了细胞类型的富集分析。染色质可及性和基因表达的分析揭示了GWAS位点的一致性细胞类型富集模式(图8a、b)。


图8a、b


为了在细胞类型特异性环境中确定GWAS位点的潜在候选变异和靶基因,作者对三种眼部疾病进行了GWAS变异的精细定位,包括青光眼、老年性黄斑变性和屈光度误差/近视。将变异的功能注释(包括来自单细胞多组学数据的OCR和LCRE)纳入考虑以提出潜在的GWAS潜在致病变异。结果共鉴定出816个后验概率(PIP)>0.1的变异,其中包含潜在的致病变异,并对调节区域的变异进行了优先排序。其中,38个位点位于28个连锁不平衡(LD)块上,与sc-caQTL、sc-eQTL和sc-ASCA有重叠。在这38个位点中,作者进一步关注了在其各自LD块内具有最高PIP值的28个位点(图8c)。


图8c


在这28个位点中的22个(78.6%)位于具有表观遗传修饰的区域内,如H3K27ac和/或H3K4me2,支持其具有调控作用。为了确定目标基因候选者,作者进一步通过sc-eQTLs、LCREs和基因注释将其中的20个位点与24个靶基因联系起来,进行了进一步的分析与解读。后续的综合分析提供了GWAS位点下的细胞类型特异性调控机制的见解(图8d)。例如,rs1328363是与屈光度和近视有关的精细映射位点(PIP=0.30),也是GPC6的单细胞等位基因特异性表达和特异性地在Rod细胞中显著的sc-caQTL。此位点可能通过增强感光细胞特异性转录因子CRX与GPC6的一个可在多个细胞类型中可及的LCRE的结合来发挥Rod细胞特异性效应(图8d)。


图8d


讨论总结

本文思路流畅、设计规整、分析全面,概括来说,研究通过综合单细胞多组学分析,探索常见的遗传变异如何调节人类视网膜主要细胞类型的基因表达和染色质可及性。研究结果强调了遗传变异对基因调控影响的背景依赖性。许多遗传变异存在于多种细胞类型可触及的基因组区域中,但仅在特定细胞类型中发挥作用。这些观察结果表明,TF之间的分层协作在遗传变异对基因调控的细胞类型特异性影响中起着至关重要的作用。本次综合研究为细胞分辨率下基因调控的核苷酸水平机制提供了新的见解,为理解和治疗人类疾病提供了启示。与此同时,作者也为我们进行单细胞多组学整合分析打开了一扇新的大门,指出了一个新的方向,这样的分析思路很值得学习借鉴,只要套用得好就可以轻轻松松发高分!


更贴合临床的生信分析定制


往期热点 (点击标题跳转)

01

肿瘤免疫逃逸新机制

02

孟德尔随机化

03

生信+实验结合

04

单细胞空间转录组

05

肿瘤相关巨噬细胞(TAM)

06

细胞死亡

07

耐药



文章转载请联系 | 15510012760(微信)

喜欢的话,点个「在看」,分享给身边好友~