ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

8+分思路:基于通路聚类对胃癌进行分子分型 #1667

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/FMMXEJQQZSK5UHVE3uoxVw

github-actions[bot] commented 2 years ago

8+分思路:基于通路聚类对胃癌进行分子分型 by 珠江肿瘤

大家好,今天小编给大家带来的文献是发表在《NPJ Precision Oncology》上的Identification of gastric cancer subtypes based on pathway clustering


Part1关于胃癌

  1. 胃癌是全世界癌症死因中排名第二的癌种,常发生于亚洲东部人群,胃癌在免疫微环境、基质微环境、基因组完整性以及致瘤特征中都具有高度异质性。目前为止,胃癌有如下几种分型
  • 病理组织学分型:肠型、弥漫性、混合型。

  • TCGA分型:EB病毒感染型(EBV),微卫星不稳定型(MSI),基因组稳定型(GS),染色体不稳定型(CIN)。

  • ACRG分型:微卫星稳定(MSS)/上皮间质转化(EMT)型,MSI型,MSS/p53+型,MSS/p53-型。

  1. 传统的治疗策略有手术切除,化疗和放疗,但是对于难治性的转移性胃癌来说,这些疗法疗效非常有限。胃癌的靶向治疗如靶向HER2、EGFR、FGFR、KIT、c-MTE、VEGFR和CLDN18.2等尚处于研究中,然而目前的结果显示,大部分都疗效甚微或者易产生耐药性。
  2. 随着免疫治疗的兴起,许多难治性恶性肿瘤都通过该疗法取得了较好的疗效,胃癌中部分MSI突变患者同样对免疫治疗有良好的应答,然而,并不是每一个胃癌患者应用免疫治疗都是有效的,所以,为了更好地提高免疫治疗的疗效,筛选出免疫治疗获益人群,许多学者提出了一系列免疫治疗预后标志物,包括PD-L1表达水平、DNA错配修复缺陷或者微卫星不稳定(MSI)、肿瘤突变负荷(TMB)以及肿瘤免疫浸润程度等。

Part2文章引言

本文作者也提出了一种基于通路聚类的胃癌分子分型方法,将胃癌分为ImD型,StE型和ImE型。与其它胃癌分型不同的是,该分型考虑到了胃癌在免疫微环境、基质微环境、基因组完整性和致瘤特征中的高度异质性,在分型时结合分析了包含免疫通路、基质通路、DNA损伤修复通路以及致瘤通路四种类型在内的15条通路,同时,作者也在本文中提出了一个新的预后风险评估模型:IDOScore,即基于15条通路的ssGSEA评分构建的IDOScore,其预测能力在多个测试集中得到了验证。下面,就让我们一起来看看这篇文章吧!

1通路聚类确定三种胃癌亚型

首先,作者选取了4种类型的15条具有代表性的KEGG通路

通路类型通路名称
免疫通路natural killer cell-mediated cytotoxicity, antigen processing and presentation, T cell receptor signaling, B cell receptor signaling, and Fc gamma R-mediated phagocytosis
基质通路ECM–receptor interaction, focal adhesion, and tight junction
DNA损伤修复通路p53 signaling, mismatch repair, and homologous recombination
致瘤通路PI3KAkt signaling, Wnt signaling, TGF-β signaling, and cell cycle

然后,在TCGA-STAD, ACRG-STAD, 和GSE84437三个胃癌数据集中,基于这15条通路做了ssGSEA分析,得到每个患者每条通路的ssGSEA分数,用以量化各通路的富集水平,正态化ssGSEA分数后,画热图,再用一致性聚类的方法对胃癌患者进行聚类,结果显示,三个数据集的聚类高度相似。


下面是三个数据集基于各通路ssGSEA分数的PCA分析,也显示可聚类为三类


作者将聚类分析得到的这三种亚型命名为ImD(免疫缺失型)StE(基质富集型)ImE(免疫富集型),各亚型的通路富集特点如下

亚型
上调通路下调通路
ImD(免疫缺失型)DNA损伤修复和细胞周期通路免疫、基质和其他致癌通路(PI3K-Akt、Wnt和TGF-β)
StE(基质富集型)基质PI3K-Akt通路Wnt、TGF-β通路以及DNA损伤修复和细胞周期通路
ImE(免疫富集型)免疫、DNA损伤修复和细胞周期通路基质、PI3K-Akt、Wnt、细胞周期通路和转化生长因子-β信号通路

2肿瘤微环境特征分析

作者基于肿瘤免疫特征和基质特征的基因表达谱,用ESTIMATE算法,比较了各亚型的免疫分数、免疫细胞溶解活性、淋巴细胞浸润百分比、基质分数、基质细胞百分比、上皮间质转化(EMT)的活性以及肿瘤纯度,用来说明肿瘤微环境的免疫特征、基质特征以及肿瘤纯度。

  • 免疫细胞溶解活性:代表细胞毒性T细胞及自然杀伤细胞的抗肿瘤活性,用肿瘤组织中GZMA和PRF1基因的平均表达水平表示。

  • 肿瘤纯度:基于免疫评分和基质评分之和的余弦函数,用ESTIMATE来计算。

  • 淋巴细胞浸润百分比和基质细胞百分比:来源于TCGA GC pathological slides data

2.1 免疫特征

  1. 免疫分数:ImD < StE < ImE

  1. HLA基因的表达水平:ImD < StE < ImE (补充图1)
  2. 免疫细胞溶解活性:ImE中最高,ImD中最低(P < 0.001)

结果1:上述免疫分数、HLA基因的表达水平以及免疫细胞溶解活性的结果,说明了ImE型的抗肿瘤免疫能力最强,ImD中的抗肿瘤免疫能力最弱。

  1. 淋巴细胞浸润百分比:ImE高于ImD(P = 0.043) 。

  1. 作者又用CIBERSORT算法,计算并比较了三种亚型中22种免疫细胞比例:StE与ImE相比,静息CD4记忆T细胞、静息肥大细胞和免疫抑制M2巨噬细胞较多,但激活的CD4记忆T细胞和免疫刺激M1巨噬细胞的比例低(补充图1)。StE与ImD相比,StE的静息肥大细胞和M2巨噬细胞比例显著高于ImD,激活肥大细胞的比例显著低于ImD 。此外,StE中免疫刺激与免疫抑制特征的比值(促炎/抗炎细胞因子和M1/M2巨噬细胞)显著低于ImE和ImD(补充图1c)。

结果2:相比较于其它两种亚型,StE可能有更强的免疫抑制特征

2.2 基质特征

  1. 基质分数:ImD < ImE < StE (P < 0.001)

  1. 基质细胞百分比:StE型最高

  1. EMT生物过程的激活可能会改变肿瘤微环境,从而激活基质特征,而EMT活性在StE中最高

  1. 194个基质基因的表达水平:大部分都在StE中高表达(补充图2)。

结果:StE型具有最强的基质特征。

2.3 肿瘤纯度

  1. 肿瘤纯度:ImD > ImE > StE (P < 0.05)

2.4 胃癌亚型预测肿瘤微环境特征

作者建立了三个预测因子(StE、ImE和肿瘤纯度)的logistic回归模型来预测三个数据集中的免疫评分、基质评分和EMT特征评分,用以校正肿瘤纯度对GC亚型与免疫评分、基质评分和EMT特征相关性的影响。发现StE和ImE都是免疫评分的显著阳性预测因子,StE是基质评分和EMT特征的显著正向预测因子(补充图2)。

结果:GC亚型与免疫特征和基质特征之间有显著关联,且与肿瘤纯度无关。

3基因组特征

基因组不稳定性(GI)在肿瘤的发生和发展中扮演着及其重要的角色, GI包括小规模GI和的大规模GI,小规模GI导致TMB增加,大规模GI导致**肿瘤非整倍性水平(TAL)**增加。同源重组修复缺陷(HRD)可能导致大规模的GI。

  1. TCGA-STAD数据集中,TMB:ImD型和ImE型显著高于StE型,ImD型和ImE型则没有统计学上的区别。

  2. TAL:ImD>ImE>StE

  3. HRD: ImD的HRD分数显著高于其它两个亚型


由于MSI肿瘤具有较高的TMB,且在ImE型中最普遍,所以作者又在排除了MSI肿瘤后比较了三种亚型的TMB,TCGA-STAD数据集结果仍然与上述相同。

随后,作者又进行了sCNA(体细胞拷贝数变异)分析,并比较三个亚型MSI肿瘤的比例,计算瘤内异质性(ITH)。

  1. arm-level和focal-level里的SCNAs比较:ImD>ImE>StE


  1. MSI肿瘤比例:ImE>ImD>StE

  1. ITH瘤内异质性:ImD>ImE>StE。GI常导致瘤内异质性(ITH),即肿瘤内的遗传和表型变异,ITH与肿瘤进展、免疫逃避和耐药性有关。该结果提示大规模GI可能比小规模GI引起更高的ITH。

结果:综上所述,ImD和ImE比StE的基因组更不稳定,ImD和ImE都具有大规模和小规模GI特征。

4突变谱

癌症驱动基因改变可以影响多种关键细胞内功能,从而促进癌症的发生发展。作者在TCGA-STAD数据集中比较了172个基因的突变频率,

  1. TP53突变率:ImD>ImE>StE

p53的功能主要是维持基因组的稳定性,P53突变的结果与上文中提到的GI结果相符合。

  1. ARID1A突变率:在ImE中最高。

ARID1A是一个重编码复杂SNF/SWI的ATP依赖的染色质组分,有研究报道胃肠道肿瘤ARID1A突变和MSI呈正相关,作者的结果进一步证实了这一点。

  1. PIK3CA、CASP8以及CR1突变率:ImE中最高

之前已有研究证明PIK3CA和CASP8突变与免疫浸润增加有关,这与ImE中高度富集的抗肿瘤免疫特征相符合。

  1. ZBTB20, CSMD1, HLA-B, DCLK1, NWD1, DMXL2,EAF2, ERBB3, CNTLN, OR2G6, BCLAF1, PLEKHA6, 和ZNF676在ImD和/或ImE中的突变率高于StE(补充图)。

作者还有一个有趣的发现,ARID1A, B2M, CASP8, CIC, and RNF43这些基因在ImE中有更高的突变率,且Samstein队列(接受ICI治疗的胃肠道肿瘤患者)中这些基因突变的患者有更好的OS,但在TCGA-STAD队列中(没有接受ICI治疗)却没有这种区别。这样的结果表明,ImE型患者可能对ICI治疗更敏感,这也与ImE型有最高的免疫浸润以及PD-L1表达水平相符合。

5甲基化谱

接下来作者分析TCGA-STAD数据集的甲基化数据,其中,StE中的一些促EMT基因(ZEB1, ZEB2, TWIST1, VIM, CDH2 )的甲基化程度最低,而抑制EMT的基因如CDH1和CLDN1的甲基化程度则最高,这些结果表明,EMT启动子在StE中上调,EMT沉默子在StE中下调。这与StE有最强的EMT特征相符合。StE中,一些DNA修复基因如MLH1和MSH3,甲基化水平最低。


然后,作者做了上述基因表达水平与其甲基化程度相关关系的分析,发现MLH1和MSH3的表达水平与其甲基化水平呈负相关


进一步比较三个亚型的MLH1基因CPGI岛甲基化水平,发现StE的MLH1基因CpG岛中的17个CpG位点的甲基化水平明显低于ImD和ImE。


同时,这些CpG位点的甲基化水平与MLH1的表达水平呈显著负相关。

img

结果:StE型有更强的DNA修复功能来维持它的基因组稳定性,之前结果里提到的StE型有最低的TMB也与此结果相符合,进一步分析TMB和MLH1的关系,发现TMB与MLH1基因甲基化水平呈明显的正相关,与MLH1基因的表达呈明显的负相关关系。

img

6蛋白谱

在这一部分,作者基于TCGA蛋白表达谱数据,分析三个亚型中219个蛋白的表达水平。

  1. StE中,维持基因组稳定性的蛋白表达水平高(BRCA2, p21, and p27_pT157) 。这可能可以解释为什么StE型有刚强的基因组稳定性;一些致瘤蛋白和基质蛋白也表达得比较多(FOXO3a_pS318_S321, c-Kit, mTOR_pS2448, PKC-alpha, PKC-alpha_pS657, PKC-delta_pS664, STAT3_pY705, VEGFR2, MYH11, 和Stathmin);调控Hippo通路的几个蛋白(TAZ, YAP, and YAP_pS127)表达水平较高,这与Hippo通路促进基质特征以及保护基因组稳定性的作用相一致。

  2. 一些DNA修复蛋白如MSH2, MSH6, 和PCNA  的表达水平在StE中表达较低。这与StE型有较高的基因组稳定性相符合。

  3. 上皮细胞钙黏蛋白,促进细胞粘附,抑制细胞运动,在StE中表达下调。肿瘤抑制蛋白Rb_pS807_S811 在StE中低表达。这些可能导致更差的临床预后,



  1. p53的作用是维持基因组的稳定性,在ImD型中表达量最高,而ImD有大规模GI的特征。p53的代偿性激活可能可以解释为什么p53表达量增高,而且,之前的基因组分析也提到TP53突变在ImD中最多。FoxM1是FOX家族的一个转录因子,上调可以诱导GI,其表达水平:ImD>ImE>StE。

  2. ImD中HER2的表达最高,提示HER2扩增的胃癌更有可能属于ImD型。

  3. Annexin-1是一种免疫调节蛋白,其表达与免疫分数和免疫溶解活性成正相关(这与其在病理条件下表达水平增加可能增加T细胞的超活化的论据相符),在ImD中表达量最低,又因为ImD是免疫丧失型, 这提示Annexin-1的表达量可能与免疫应答之间成正相关

  4. Caspase-7 是caspase家族的一个蛋白,诱导凋亡的重要蛋白,在ImE中表达最高,Bax的表达结果也一样,这与凋亡能力和抗肿瘤免疫成正相关的结论相符,

  5. GAPDH是糖酵解第六步的催化酶,在ImE中表达量最高,这与之前的报道增加糖酵解促进抗肿瘤免疫的结论相符。

  6. Jak2是Janus激酶家族的成员,在ImE中表达量高于ImD和StE,JAK-STAT通路激活是癌症中抗肿瘤免疫的正向调节因素。



结果:以上结果从蛋白表达水平的层面进一步验证了三个亚型的不同亚型特征。

7临床特征

首先,作者做了三个队列中各分型的生存分析


ImE的OS和PFS都显著高于其它两型,StE型预后最差,这也与之前的分子分析相符合,因为抗肿瘤免疫特征与预后呈正相关,基质特征与预后负相关。

此外,作者做了各分型的肿瘤分期比较,发现StE型有更高比例的晚期肿瘤。


然后,作者比较了TCGA-STAD数据集中的化疗应答率(涉及30种化疗药物),其应答率(CR+PR的比例):ImE (75%) > StE (64%) > ImD (56%) ,与抗肿瘤免疫反应与化疗有效性之间成正相关的结论相符。又分别比较了四种化疗药物的反应率,其中三种药物的结果与之前一样,顺铂除外,它在ImD型中反应率最高,可能是与ImD型中HRD普遍存在,而HRD能够促进铂类药物治疗的敏感性有关。


进一步使用TIDE算法来预测三个数据集中患者对ICIs的应答率。应答率高低:ImE > ImD > StE,结果说明,ImE型对免疫治疗的应答率最好,而StE最差。


8基因本体论

首先,作者用WGCNA分析在ACRG-STAD数据集中确定了九个基因模块:

Organic hydroxy compound metabolic process有机羟基化合物的代谢过程
Oxidoreductase activity, acting on CH-OH group of donors作用于CH-OH基团的氧化还原酶活性
Cell cycle细胞周期
Synapse突触
Adaptive immune response适应性免疫应答
Innate immune response固有免疫应答
Extracellular matrix细胞外基质
Activation of immune response免疫应答的激活
Cytokine activity细胞因子活性

分别比较三个亚型的基因模块的富集程度,又做了各亚型各模块之间以及与预后变量之间的批量相关分析,可以看到,

  1. 代表免疫应答的模块在ImE中富集程度最高,在ImD中最低;

  2. 代表基质特征的细胞外基质模块在StE中高度富集,细胞周期模块则显著下调;

  3. 有机羟基化合物代谢模块在ImD中显著上调,而ImE中显著下调;

  4. 突触模块与StE的相关性最强,且与预后呈显著负相关;

  5. 细胞周期模块与StE显著负相关,且与预后显著正相关;

  6. 固有免疫应答模块与ImE的相关性最强且与预后正相关。


结果:基因本体论分析从基因聚类出发,分析三个亚型之间的表达差异,并纳入了预后数据做批量相关性分析,进一步验证了ACRG-STAD数据集中,StE型预后最差,ImE型预后最好。

9StE型的高致瘤特征

在这一部分,作者着重分析了致瘤通路在各亚型中的调控情况,发现:

  • StE中,Wnt, mTOR,PI3K-Akt, JAK-STAT, RAS, MAPK, Hedgehog, Notch, HIF-1, TGF-β,和VEGF 致瘤通路活性显著增强,而这些致瘤通路在ImD中的富集水平均显著低于ImE((补充图5)。

其中,Wnt、JAK-STAT、Hedgehog和Notch信号通路在发育和干性调控中发挥关键作用,并与癌症相关。最近的一项研究表明,Wnt信号在胃癌的弥漫性亚型中被高度激活,这与作者在下文中提到的弥漫性亚型以StE为主的结果一致。肿瘤间质中Hedgehog信号的激活为肿瘤的发展提供了良好的微环境;PI3K/Akt/mTOR、RAS、MAPK等信号通路在推动肿瘤细胞生长中发挥重要作用;HIF-1、TGF-β和VEGF通路通过调节TME在促进肿瘤进展和转移中发挥重要作用

结果:StE型具有的高致瘤特征,可能是该亚型预后差的原因。致瘤通路抑制剂可能可以应用于临床,且对StE型效果最好,对ImD效果最差。

10基于通路聚类的分型方法和其它分型方法之间的联系

前面也提到过三种经典分型,那么,这些经典分型与作者新提出的分子分型有什么联系呢?作者分析了TCGA-STAD和ACRG-STAD数据集,发现肠型胃癌以ImD和ImE为主,而弥漫型胃癌以StE为主,提示肠型胃癌既可表现为免疫富集,也可表现为免疫缺失,而弥漫性胃癌具有丰富的间质特征。

在TCGA-STAD数据集中,TCGA亚型与作者提出的分子分型比较,ImE以MSI型和EBV相关型为主;ImD则以CIN型为主;StE以GS型为主。

在ACRG-STAD数据集中,ACRG亚型与作者提出的分子分型比较,StE以EMT亚型为主。


结果:可以用其它经典分型的特征进一步验证基于通路的GC亚型的特征:ImE的特点是免疫富集,ImD是由于染色体/基因组不稳定性而导致的免疫缺失,StE的基因组稳定且基质特征丰富。

11基于通路聚类的分型方法的预测能力

作者以TCGA-STAD作为训练集,用ACRG-STAD和GSE84437作为测试集,使用XGBoost算法预测三种亚型,训练集的十倍交叉验证准确率为90.4%,ACRG-STAD和GSE84437分类准确率分别为80.3%和81.3%。加权敏感性、特异性和F1评分在训练集中均超过90%,在两个测试集中均超过80%。


结果:基于通路的GC亚型分类方法具有稳健的可重复性和可预测性。

12基于通路的预后模型IDOScore

为了进一步证明四种通路与预后以及免疫治疗疗效之间的相关性,作者建立了一个基于4基因表达水平的线性模型(IDOScore)来评估胃癌患者的预后风险,包括TAP2, SERPINB5, LTBP1, 和LAMC1 , IDOScore = -0.497 × Exp(TAP2) - 0.166 × Exp (SERPINB5) + 0.154 × Exp (LTBP1) + 0.571 × Exp(LAMC1)

方法:在ACRG-STAD队列中,基于15条通路的ssGSEA分数,用Lasso回归COX风险比例模型筛选出了5条通路,包括天然杀伤细胞介导的细胞毒性、抗原处理和呈递、TGF-β信号转导、p53信号转导和ecm受体相互作用。然后对5条通路中的基因做与ssGSEA分数的spearman相关分析,排在前20的基因被挑选出来,最终用单因素COX模型挑选出7个显著基因,多因素风险比例模型显示这7个都与OS显著相关,最后,在多因素风险比例模型中用向后逐步选择法挑选出了4个基因,即TAP2, SERPINB5, LTBP1, 和LAMC1,且这四个基因分别包括在免疫通路、DNA损伤修复通路、致瘤通路和基质通路中。

这四个基因参与了用于聚类GC的四种通路,即免疫(抗原处理和呈递过程中的TAP2),DNA损伤修复(p53中的SERPINB5信号通路)、致瘤(TGF-β中的LTBP1信号通路)和基质(ECM -受体相互作用中的LAMC1信号通路)信号通路。

IDOScore是一个不良预后因素,因为免疫特征和DNA损伤修复特征与预后呈正相关,而致瘤特征和基质特征与预后呈负相关。结果显示,StE中IDOScore最高,ImE中IDOScore最低。


并且在三个队列中,IDOScore与OS呈负相关;在ACRG-STAD队列中,IDOScore与DFS 呈负相关。


此外,作者还研究了其他29个TCGA癌症队列的IDOScore与生存预后之间的关系。29个癌症队列(ACC、BLCA、BRCA、GBM、KICH、KIRP、LGG、LIHC和READ)中有9个队列的IDOScore与OS呈负相关,4个队列(ACC、GBM、KICH和LGG)的IDOScore与DFS呈负相关。


然后,对于四个接受ICI治疗的队列(Hugo队列(黑色素瘤)和Riaz队列中(黑色素瘤),Nathanson队列(黑色素瘤),和Ascierto队列(肾细胞癌)),作者又分析了IDOScore与ICIs应答之间的相关性,发现低IDOScore(<中位数)组的应答率高于高IDOScore(>中位数)组。


结果:上述结果合理,因为免疫和DNA损伤修复特征可能与PD-1/PD-L1/ CTLA-4免疫治疗疗效呈正相关

Part3小结

  • 总结图

  • 本文首次提出来在胃癌患者中用基于通路聚类的方法进行分子分型,综合分析多组学数据,多方法、多层面的验证了该分子分型的稳健性,最后还提出了IDOScore预后风险评估模型,在多种癌种中都有良好的预后和免疫治疗疗效预测能力。与其它经典分型方法比较,该分子分型方法将基质特征、肿瘤免疫微环境特征、基因组稳定性特征以及致瘤特征的综合异质性考虑在内,在验证阶段还联系了多数据集免疫治疗及化疗的治疗应答率。总的来说,该分型方法是胃癌分型方法里非常全面的了,对胃癌患者的精确管理具有潜在的临床意义。好了,今天的分享就到这里啦~我们下次再见!