ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
110 stars 30 forks source link

结合免疫组库纯生信数据挖掘——预测模型玩出新高度(12+) #2584

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/iv-lENGvMth8M9CrXQ7oZA

github-actions[bot] commented 2 years ago

结合免疫组库纯生信数据挖掘——预测模型玩出新高度(12+) by 医学僧的科研日记

今天与大家分享一篇2022年3月份发表在Cancer immunology research上的一篇文章,与以往常规套路不同,作者着眼于B细胞和免疫球蛋白等特征构建模型,研究了膀胱癌患者不同亚群中肿瘤内免疫球蛋白谱系的结构,并开发了一种基于肿瘤RNA序列的预测肌层浸润性尿路上皮癌抗PD-L1治疗反应的指标。具体是怎么实现的呢,我们一起来学习一下吧~ 



1

研究概述

1.数据来源

①TCGA-BLCA数据集

②IMVigor210数据集


2.根据不同免疫特征进行生存预测

①Ig克隆性与生存预测

②IgG1/IgA表达率与生存预测,以及与免疫特征关系探索

③CD8+免疫细胞signature的预后价值,以及与IgG1/IgA表达率结合的预后价值


3.构建预测模型

①随机森林建模

②SHAP来探索输入特征的重要性和交互作用


2

研究内容及结果


1、免疫球蛋白同种型组成和克隆性

作者研究了来自 TCGA 的具有不同基于 mRNA 表达的分子亚型的 BLCA 患者队列,以识别更有可能具有良好预后同时表现出高肿瘤内 IgG1/IgA 比率的患者(图 1A)。当根据 IgG1/IgA 比率分层时,基底鳞状细胞和管腔浸润分子亚型与患者存活率最显着相关,高 IgG1/IgA 比率与较低的 IgG1/IgA 比率相比,存活率更高(图 1B)。接下来,作者使用 MiXCR研究了从 BLCA RNA-seq 数据中提取的 IgG 库的克隆性。最佳预后与高 IgG1/IgA 和低免疫球蛋白克隆性相关(图 1C)

①MiXCR:快速准确分析T细胞和B细胞受体库序列数据的通用工具。用于处理从原始序列到定量克隆型的大免疫组数据。

②本研究中 IGH、IGK、IGL、TRA、TRB、TRG和TRD受体的V和J序列取自IMGT数据库。

③免疫球蛋白克隆性计算为(1-标准化的香农-维纳指数)。

Fig1

2、CD8+ 效应T细胞特征和IgG1/IgA的预后价值

作者将先前研究报道的 CD8+ T 细胞特征应用于基底鳞状细胞 TCGA-BLCA 亚群时,该特征的高表达与更好的患者存活率相关(图 1D)。而使用标准化的 CD8+ T 细胞特征可以更准确地与预后相关联(图 1E)。与单独的 CD8+ T 细胞特征相比,IgG1/IgA 比率和标准化 CD8+ T 细胞特征的组合具有更大的预后价值,最佳预后与高 IgG1/IgA 比率和高标准化 CD8+ 特征相关(图 1F)

Fig1

3、预测生存和对免疫治疗的反应

单独的 IgG1/IgA 比率仅对排除的免疫表型对atezolizumab 的反应具有显着预测价值(图 2A),对整个 IMVigor210 队列的治疗患者的总生存期具有显着的预后价值(图 2B)。高免疫球蛋白克隆性与接受治疗的患者亚组的阴性预后显着相关(图 2C)。低免疫球蛋白克隆性结合高 IgG1/IgA 比率与整个 IMVigor210 队列的最佳预后相关(图 2D)。原始 CD8+ T 细胞特征对反应的预测能力较差(图 2E-H),但针对泛白细胞基因的标准化提高了预测能力(图 2I-K)。标准化的 CD8+ T 细胞特征与 IgG1/IgA 比率的组合产生了最佳预后值(图 2L)

Fig2

4、预测抗PD-L1免疫治疗反应的模型

IMVigor210 试验使用针对 PD-L1 C 末端的抗体测量 PD-L1,评分系统 (ICA) 计算为给定肿瘤区域中 PD-L1+ 免疫细胞的百分比。一线治疗的临界值为 5% (IC2/3),但 PD-L1 评分的预测值相对较低(图 3)

Fig3

作者使用了随机森林模型,通过嵌套交叉验证方法评估性能(图 4)。使用原始 CD8+ T 细胞特征对模型进行了训练。得到的 AUROC 类似于建立在特征值上的 AUROC(比较图 2G图 4A),这与随机患者选择没有区别接下来,使用标准化的 CD8+ T 细胞特征训练模型。AUROC 大于原始特征的 AUROC,并且类似于未使用模型的归一化签名的 AUROC(比较图 2K图 4D

最后,作者整合了细化的标准化 CD8+ T 细胞特征(CXCL9、CXCL10、CD8A、GZMB)、IgG1/IgA 同种型比率以及与 TCGA-BLCA 患者的高 IgG1/IgA 比率相关的特征,包括 KLRC-NK 特征(KLRC2、KLRC3、KLRC4)、IL21 和 GNLY 表达(均针对泛白细胞基因标准化),以及非标准化 TGFB1 表达。生成的 PRIMUS 模型的性能优于在标准化 CD8+ T 细胞特征上训练的模型(图 4D-I)。与 PD-L1 IHC 相比,PRIMUS 可以更好地预测反应并产生更大的预后价值(图 3B-D;图 4G)。基于标准化 CD8+ T 细胞特征或高/低 IgG1/IgA 同种型比率和标准化特征的组合,PRIMUS 的预后也优于预测(比较图 2I-L 与图 3D)

Fig4

5、特征重要性和互作分析

接下来,作者使用 SHAP探索输入特征的重要性和相互作用。归一化的 CD8+ T 细胞特征与响应具有最显着的关联(图 5A 和 B)。作者还确定了变量之间的相互作用。具体而言,高 IgG1/IgA 比率更能预测与高 IL21 表达相结合的反应(图 5C),CD8+ T 细胞特征的高表达与高 IL21 表达之间的相互作用(图 5D)

①SHAP是一种博弈论方法,用于解释机器学习模型,并通过量化每个特征对模型做出的预测的贡献来理解决策过程

②图A横坐标是shap-value即影响的权重, 左侧的标签是特征,并且它们也是按照重要性排序的,每一点都代表一个真实的样本。对于每一组(每一行)来说,数据点的颜色是由特征的值决定的。特征的值越大,点的颜色越红。区域分布越宽说明它的影响力越大,因此这个图一般是上宽下窄(影响大的放在上面)。

Fig5

6、预测沙漠亚型患者的免疫治疗反应

在三种肿瘤免疫表型(发炎、排除和沙漠)中,“沙漠”亚组的治疗反应尤其难以预测。而PRIMUS 能预测来自 IMVigor210 试验的免疫“沙漠”患者的反应(图 6A)。为了进一步验证 PRIMUS 模型可以有效预测“沙漠”肿瘤表型的反应,作者使用 IMVigor210 队列训练 PRIMUS,将 41 名具有“沙漠”表型的患者指定为保留集。PRIMUS 成功预测了这些患者的反应(图 6B),因此证明了 PRIMUS 在预测抗 PD-L1/PD1 免疫治疗反应方面的效用。

Fig6


3

结论


作者分析了浸润B细胞在膀胱癌中的作用,发现IgG1/IgA比率是一个预后指标。高的IgG1/IgA比率与细胞毒性基因信号、T细胞受体信号和IL21介导的信号显著相关。接下来,作者结合了TME的T细胞、NK细胞和B细胞参数,并考虑了各种免疫过程的相对代表性,开发了一种基于肿瘤RNA-seq的预测因子(PRIMUS),用于预测肌肉浸润性尿路上皮癌中的抗PD-L1治疗反应。

该文章涉及一些免疫组库相关数据和研究方法,或许小伙伴们对此有些陌生,但近年来免疫组库分析的生信文章发表分数非常可观,有兴趣的小伙伴可以去探索一下哦~

偷偷告诉你,我们在B站还有优质文章分享视频哦~

写在后面
医学僧的心愿是为医学僧的支持者和科研爱好者营造一个勤学好问、互帮互助、共同进步的优良环境。但是人多了难免鱼龙混杂,良莠不齐,群里不乏有真心实意、脚踏实地的科研人,我们很尊重并欢迎他们,因此不希望被少数来发广告的、划水的、看热闹的、占个坑的所打扰,最终我们的心意付之东流,大家的热情消磨殆尽。为了解决这个问题,我们决定提高入群的门槛——收费进群,这样,愿意进群的同志相信也是个圈内活跃用户,圈内人相互交流,岂不快哉!
因此,为了提升大家的效率,调动大家的积极性,吸收真正的科研爱好者,形成一个良好的学习交流氛围,我们决定增加群的数量,并细化群的功能,暂时增加以下几个主题群:
  • 文献下载-医学僧

  • 机器学习(分类)-医学僧

  • ggplot可视化-医学僧

  • 热图可视化-医学僧

  • TCGA挖掘-医学僧

  • GEO挖掘-医学僧

  • 肿瘤预后模型-医学僧

  • 肿瘤分子亚型-医学僧

欢迎小伙伴们进群👏👏👏,每个群收费15元。请联系小编微信yixuesengkyrj或扫描下面二维码: