ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

没有外部验证的预测模型为什么也可以发6分+SCI? #317

Closed ixxmu closed 4 years ago

ixxmu commented 4 years ago

https://mp.weixin.qq.com/s/VHP4TsC4yJbcBy7gUsRlvw

github-actions[bot] commented 4 years ago

没有外部验证的预测模型为什么也可以发6分+SCI? by 生信发文助手

大家好!今天跟大家分享的是2020年9月发表在Genomics(IF =6.205)上的文章。文章利用了从TCGA数据库中搜集的上皮性卵巢癌(epithelial ovarian cancer,EOC)表达谱数据进行了免疫相关基因表达分析,利用Cox回归分析及Lasso算法分别针对总体生存期(OS)和无病生存期(DFS)构建了免疫基因相关特征模型,并通过验证数据集进行了验证,后续利用CIBERSORT算法和免疫相关基因表达情况进一步分析了模型与肿瘤微环境的关系,为EOC提供了的潜在预后指标和治疗靶标。


题目:Identification of a prognostic signature of epithelial ovarian cancer based on tumor immune microenvironment exploration

基于肿瘤免疫微环境探索上皮性卵巢癌预后特征模型

生信分析定制服务

请扫描下方二维码

也可直接添加小编微信:keyan-zhishi2沟通

摘要

本文旨在开发一种免疫相关基因(IRG)的预后特征模型,对上皮性卵巢癌(EOC)患者进行分类。首先通过测序数据确定了EOC特定的332上调和154下调IRG,筛选后的候选IRGs分别用于构建总体生存和无进展生存的预后模型。该模型的风险评分经验证可作为预后的风险因素,并用于构建整合的列线图。根据IRG预后模型,将EOC患者分为高危组和低危组,并进一步探讨其与肿瘤免疫微环境(TME)的关系。CIBERSORT算法在低风险组中显示出较高的巨噬细胞M1细胞,T细胞滤泡辅助细胞和浆细胞浸润水平。此外,与高风险组相比,低风险组具有更高的免疫评分和独特的突变特征。这些发现可能为新型免疫生物标志物的开发和EOC靶向治疗提供启示。


流程图


1. 数据的获取和整理

从TCGA数据库中下载了579个卵巢浆液性膀胱腺癌EOC样品的RNA测序数据作为实验组;从GTEx数据库中下载了89个正常卵巢组织的RNA测序数据作为对照组;从TCGA检索到的相应临床数据也被整合到进一步分析中;用于研究的IRG清单来自ImmPort数据库。

2. 筛选EOC的差异表达IRG并功能注释

本文得到了7255个差异表达基因(DEG),其中3790个基因被上调而3465个基因被下调(图1A)。通过EOC中的DEG和免疫相关基因做交集,得到了332个上调的DE-IRG和154个下调的DE-IRG(图1B)。GO分析表明,这些DE-IRGs在以下生物过程中显著富集:白细胞迁移、激活免疫应答和调节细胞表面受体信号传导;细胞成分(CC)分析显示,这些IRG富集在质膜、受体复合物和血液微粒外侧;分子功能(MF)分析显示,这些基因同时还富集在受体-配体活性和抗原结合中(图2A)。KEGG分析表明,这些基因主要参与细胞因子与细胞因子受体的相互作用(图2B)。

图1 鉴定差异表达的免疫相关基因


图2 差异表达IRGs的功能富集分析


3. 建立预后差异IRG和差异TF的调节网络

通过整合TCGA数据库中患者的mRNA表达和临床信息,分别获得了针对OS和DFS的351份样品和321份样品。本文应用p值小于0.05的单变量Cox回归分析,筛选了73个(OS)和81个 IRG(DFS)进行下一步分析。基于EOC的预后差异表达IRG和118个差异表达转录因子(TF),本文分别构建了OS和PFS的TF和IRG的相互作用网络。


4. 建立预后特征模型

具有完整OS和DFS信息的患者分为训练数据集,测试数据集和完整数据集,以构造和验证EOC的预后基因风险特征模型。首先,在训练数据中应用单变量Cox回归筛选出了60(OS)和31 IRGs(DFS)。之后,进行LASSO 算法和多元Cox回归以筛选候选基因,最终得到了11个OS相关的预后IRG和9个DFS相关的预后IRG。从结果中提取系数后,本文基于11个OS-IRG和9个DFS-IRG建立了OS和DFS的预后风险特征模型。


5.验证预后风险特征模型

为了评估这两种风险模型的预后预测能力,本文同时使用了训练,测试和整体数据集进行分析。基于OS模型,本文计算了训练数据集中EOC患者的风险评分并进行了排名,并在点图上标记了每个患者的生存状态以进行分布显示。同时,根据中位风险评分将患者分为OS和DFS预后的高危组和低危组。KM生存曲线分析显示,训练数据集(图3A,4A)、验证数据集(图3B,4B)以及整个数据集(图3C,4C)中两个风险组之间的OS和RFS(无复发生存率)显著不同。对于OS预测模型,1年、3年和5年的ROC曲线下面积(AUC)在训练数据集中分别为0.75、0.708、0.81,在测试数据集中分别为0.672、0.552、0.599,在整体数据集中分别为0.671、0.642、0.72(图3A-C)。对于DFS预测模型,训练数据集的1年,3年和5年的AUC为0.748、0.822、0.925,验证数据集的为0.636、0.661、0.52,整体数据集的分别为0.697、0.749、0.673(图4A-C)。为了评估该模型是否可以作为EOC的独立OS / DFS预测因子,进行了包括临床因素和风险评分在内的单变量和多变量Cox回归分析。结果表明,该预后预测模型可以作为EOC患者OS / DFS的独立预后指标。

图3 OS预测模型的KM分析、风险评分分析和ROC分析

图4 DFS预测模型的KM分析、风险评分分析和ROC分析


6. 预测列线图的构建

本文建立了列线图来预测患者的OS,该OS具有三个独立的预后因素,包括年龄,阶段,等级和风险评分(图5A)。校准图表明,列线图可以准确估计死亡率(图5B)。1年、3年和5年OS列线图的AUC为0.70、0.653、0.723(图6A-C)。与单一临床因素相比,组合模型预测的1年、3年和5年OS具有最大AUC,这可能有助于预测患者的临床预后情况。

图5 基于OS预测EOC患者的总体生存的列线图
图6 基于OS列线图的时间依赖性ROC


7. 基因集富集分析

通过GSEA分析了高危组和低危组患者的转录信息。在OS模型和DFS模型中,高危组均在以下生物学通路中有富集:灶性粘连、Hedgehog信号通路和ECM受体相互作用。在两种模型中,自身免疫性甲状腺疾病、移植物抗宿主疾病、 IgA产生的肠道免疫网络、原发性免疫缺陷和I型糖尿病在高危组患者中均有富集。低危组患者中富集的生物学通路与免疫相关,提示免疫过程可能对低危组患者起保护作用(图7)。

图7 基因集富集分析


8. 两个高危人群中肿瘤浸润免疫细胞的差异

为了揭示基于IRG的预后模型与肿瘤免疫微环境(TME)之间的相关性,本文分析了目前基于IRG的预后模型所界定的风险组之间的肿瘤浸润和免疫细胞之间的差异。结果表明,OS模型中高风险组巨噬细胞M0的丰度、肥大细胞激活和NK细胞静息的含量明显增加。但是,巨噬细胞M1,T细胞CD4记忆激活,浆细胞,T细胞CD8和T细胞滤泡辅助显示相反的结果。结果还显示,在高危组中肥大细胞激活且单核细胞有更多富集,而在DFS模型的低危组中巨噬细胞M1、浆细胞和T细胞滤泡辅助细胞有更多富集。某些免疫细胞的入侵在OS和DFS模型中均表现出相同的趋势(图8)。

图8基于OS的风险人群之间肿瘤浸润免疫细胞的差异


9. 免疫相关的风险特征和突变特征

利用体细胞突变数据评估突变特征与特征之间的关系。高风险和低风险组中最常见的突变基因如图9A-B所示。低危组患者的TMB较高,并伴有较长的OS(图9C-D)。本文进一步发现TMB在低危组患者中也表现出更高的表达,并伴有更长的DFS(图9E-H)。

图9 基于OS的低风险和高风险人群之间的突变谱和TMB


10.  ICI(免疫检查点抑制因子)与风险特征模型的关联

本文探讨了EOC患者中IPS与本文的免疫特征之间的关联。IPS、IPS-CTLA4、IPS-PD1 / PD-L1 / PD-L2和IPS-PD1 / PD-L1 / PD-L2 + CTLA4值可以评估患者在ICI上的潜力。在OS和DFS中,标志性低风险组的IPS均显著增加(图10A和10B)。对于OS或DFS,低危组中PD1,PDL1,PDL2和CTLA4的表达较高(图11)。这表明显示较高IPS的低危组具有更高的免疫表型。

图10 IPS和免疫疗法的基因表达分析
图11 低危和高危人群中PD1,CTLA4,PD-L1和PD-L2的基因表达

结语

本文首次基于IRGs建立了预后特征模型,并将EOC患者分为两组。两组患者的生存结局在统计学上不同,这可能与肿瘤免疫微环境的失衡有关。这些发现可能为新的免疫生物标记物和靶向疗法的发展提供见解。

本文的研究还存在一些局限性:需要进行基础实验来验证预后特征和免疫浸润之间的关系;将来需要对本文的预后特征及其与免疫浸润物的关系进行更大样本量的进一步研究;本研究未基于其他可用数据库进行外部验证。但是,将当下比较火热的免疫疗法与功能分析关联了起来是文章的一个亮点,也是其能发在没有外部验证数据的情况下发较高分文章的原因。


公众号最近改版,以防失联,加个星标吧!

课程推荐


多点好看,少点脱发