ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
106 stars 30 forks source link

胃癌的免疫亚型和景观并基于全视野数字切片使用深度学习进行预测 #2557

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/8ksdlSVjovr-5RIu9gV80g

github-actions[bot] commented 2 years ago

胃癌的免疫亚型和景观并基于全视野数字切片使用深度学习进行预测 by 医学僧的科研日记

今天和大家分享一篇于2021年6月在frontiers in Immunology上发表的一篇影响因子8+的生信文章" The Immune Subtypes and Landscape of Gastric Cancer and to Predict Based on the Whole-Slide Images Using Deep Learning ",作者基于TCGA数据库中的胃癌的肿瘤浸润免疫细胞的丰度进行共识聚类,从而得到3种具有不同特征的免疫亚型,进而分析了不同亚型的免疫景观,对比了不同亚型的免疫细胞比例,临床,分子,功能特征。最后开发了一个基于全视野数字切片的深度学习模型,用于预测免疫亚型,其对指导临床预测的预后提供了一种新的思路。具体是如何实现的呢,让我们一起来学习一下吧!


1

研究背景

  1.   胃癌是第五大常见恶性肿瘤,也是全球第三大癌症相关死亡原因,尽管在治疗方面取得了重大进展,但进展期患者的5年总体生存率(OS)仍为20% ,患者行根治性切除加围手术期化疗,5年OS仍低于40%。因此很需要更有效的系统治疗。

  2. 近年来,包括胃癌在内的多种实体瘤的免疫治疗备受关注。对于进展期胃癌,只有一小部分患者(10-20%)对细胞毒性T淋巴细胞相关蛋白4 CTLA4抗体(ipilimumab)和程序性细胞死亡蛋白1 PD1抗体(nivolumab, pembrolizumab)有反应。因此,需要开展研究以确定免疫检查点抑制的反应和抵抗机制,并筛选可能受益的潜在患者。

  3. 然而,由于肿瘤微环境(tumor microenvironment, TME)的复杂性使我们对其在免疫应答中的作用仍不完全了解。肿瘤微环境是一个由细胞外基质、细胞因子、趋化因子和非肿瘤细胞组成的复杂系统。肿瘤浸润免疫细胞(tumor infiltration immune cells, TIICs)是TME中非肿瘤细胞的重要组成部分,与促进或抑制肿瘤生长有关。TME中存在与肿瘤相关的CD8+ T细胞、CD4+T细胞、T滤泡辅助细胞(T follicular helper cells, Tfhs)、自然杀伤细胞(natural killer, NK)等,提示免疫应答被激活,预后较好,而抑制免疫应答的调节性T细胞(regulatory T cells, Tregs)、B细胞、巨噬细胞、肥大细胞和浆细胞则提示预后较差。因此本文对胃癌中基于TIICs的免疫亚型的认识很有意义。

  4. 深度学习作为一种阅读病理图像的技术表现出色。病理扫描全视野数字切片(WSIs)的出现为深度学习提供了平台。一般认为组织病理学图像包含有价值的TME信息。因此,深度学习可以从标准医学图像中提取高维数据,用于临床应用,如区分免疫亚型。此外,深度学习在肿瘤微卫星不稳定性、免疫细胞类型和预后预测方面也有好的表现。


2

研究方法

1. 研究队列

     a.TCGA数据库中收集了375个胃癌样本

    b.GEO数据库中GSE84437中收集了433个胃癌样本  

    c. UCSC Xena中五种泛癌数据乳腺癌(n=1108), 食管癌 (n=185), 结直肠癌 (n=383), 肝癌 (n=375), 和胰腺癌 (n=179)

2. 免疫细胞定量

       基于基因表达谱,使用CIBERSORT算法定量22种肿瘤浸润免疫细胞。本研究筛选出发现队列共194个GC样本,验证队列共299个GC样本。最后 ,我们获得了22个类型的免疫细胞,包括B细胞(初始B细胞和记忆B细胞)、CD8 + T细胞、初始CD4 + T细胞、静息记忆CD4 + T细胞、激活记忆CD4 + T细胞、T滤泡辅助细胞(Tfh),调节性T细胞、自然杀伤细胞(静息NK细胞,激活NK细胞)、巨噬细胞(M0、M1和M2)、树突细胞(静息DC和活化DC)、肥大细胞(静息肥大细胞和激活肥大细胞)、浆细胞、γδT细胞单核细胞、嗜中性粒细胞和嗜酸性粒细胞。

3. 探索并验证免疫亚型

       为了确定基于肿瘤浸润免疫细胞的肿瘤间异质性进行无监督共识聚类来确定免疫亚型,通过“ConsensusClusterPlus”包实现。然后用“clusterRepro”包计算IGP,衡量免疫亚型在两个队列之间表现出良好的一致性。

4. 分析亚型相关临床分子细胞特征

       我们首先使用Kruskal-Wallis统计评估了免疫相关细胞特征与免疫亚型的相关性。接下来,我们描述了免疫亚型的人群分布、临床病理特点和分子特征,包括年龄、性别、Lauren的分类、病理分化状态、肿瘤位置、分期、TCGA分子亚型以及基于ESTIMATE算法的基质免疫评分。最后采用log-rank检验和多因素Cox回归来确定以OS为终点的免疫亚型的预后价值。

5. 泛癌验证

      基于泛癌数据集(数据来自UCSC Xena) (乳腺癌、食管癌、结直肠癌、肝癌、胰腺癌)中的患者,使用22个TIICs进行一致性聚类。而对于那些样本太少的队列,我们选择了P<0.1作为截断点,再进行共识聚类和Kaplan-Meier分析,以说明本文的免疫亚型的可行性。

6. 功能富集分析

       使用R包“limma”确定任意两种免疫亚型之间的差异表达基因,以log2(fold change)绝对值>1和FDR adjusted p-value<0.05作为选择差异选择基因的阈值,本文基于差异表达基因DEGs分别进行GO、KEGG和GSEA分析。

7. 深度学习

       深度学习可以识别病理图像的宏观内容,包括TIICs核大小、核位置、核形态等。甚至可以识别肉眼无法分辨的高维数据,如颜色矩阵、直方图矩阵、高阶矩阵等。因此,我们开发了一个带有深度残差学习(基于ResNet-18)模型的卷积神经网络,利用从全视野数字切片(WSIs)中分割出的补片来检测免疫亚型。首先筛选没有明显干扰因素(包括出血、折痕、坏死和模糊区域)的高质量WSIs,并按5:3:2的比例划分为训练集、验证集和测试集,进行进一步处理。接下来,WSIs上的肿瘤感兴趣区域(ROIs)由专业病理学家划定。所有WSIs在20x物镜下进行数字化处理。然后,ROI随后被分割成512像素x 512像素的补片。最后经过随机切割、随机水平翻转、随机仿射变换、中心裁剪(224像素x 224像素)、归一化等预处理后,将补片放入基于ResNet-18的深度学习模型中。


3

结果展示

1. 共识聚类确定了胃癌的三种免疫亚型

       基于22个肿瘤浸润免疫细胞使用来自TCGA数据库的194个胃癌样本,通过无监督共识聚类确定最佳聚类数是3,(图1A-C)。基于此我们确定了三种免疫亚型,IS1、IS2、IS3,为了评估免疫亚型的可重复性,我们对来自GSE84437的299个胃癌样本执行了相同的算法,我们发现最佳聚类数也是3(图1D-F)。tSNE分析很好地代表了3个聚类的离散分布以及发现队列和验证队列的一致性(图1G、H)。此外计算了组内比例IGP,发现免疫亚型在两个队列之间表现出良好的一致性。




2. 分析亚型之间肿瘤浸润免疫细胞成分的不同

       这三种免疫亚型在发现队列中均表现出不同的免疫细胞表达模式,发现与验证队列高度一致。在IS3中有最高的CD8+ T细胞和M1巨噬细胞丰度(图2A)。IS3还具有激活CD4+ T记忆细胞丰度最高的特征(图2C)。然而,IS3的静息CD4+ T记忆细胞和M2巨噬细胞的丰度最少(图2B)。此外,IS3中Tfh和NK细胞丰度最高(图2H, J), B细胞和肥大细胞丰度最低(图2D、G)。此外,IS3中DC和Tregs的表达在三个免疫亚型中是中等(图2E、I)。而IS1表现出丰度最高的静息CD4 + T记忆细胞、B细胞、DC细胞和Tregs (图2B、D、E、I)和丰度最低的巨噬细胞和Tfh细胞(图2F、 H)。

       IS1的CD8+ T细胞表达在三种免疫亚型中居中(图2A)。与IS1和IS3相比,IS2中巨噬细胞的丰度最高(图2F),同时CD8+ T细胞、DC和Tregs丰度最低(图2A、E、I)。而IS2的CD4+ T记忆静息细胞、B细胞、Tfh的表达在三种免疫亚型中居中(图2B、D、H)。最后,我们发现IS3表现出最低的基质评分和最高的免疫评分(图2K、L),而IS1表现出最高的基质评分(图2K)和IS2表现出最低的免疫评分。

       IS3具有最强的免疫活性,伴有较弱的免疫抑制(免疫炎症表型),而IS1具有中等的免疫反应,同时伴有较强的免疫抑制(免疫排斥表型),而IS3具有免疫缺陷(免疫沙漠表型)的特征。




3. 亚型特征分析

1)临床特征:IS2男性占比相对较高(图3A),中位年龄相对较大(图3B), IS3与较低的贲门/胃底癌发病率相关(图3D),但其病理分化较差。三种免疫亚型间TNM分期比例无显著差异(图3C)。

2)分子特征:IS3比1和2有更多的EVB(EB病毒阳性型)和MSI(微卫星不稳定型),而CIN (染色体不稳定型)和GS (基因组稳定型)比IS1和IS2更少(图3G)

3)预后特征:在TCGA和GEO队列中显示出显著的预后影响,IS3预后最好,IS1预后相对较差(图3H、I)。



4. 泛癌验证

      基于泛癌数据集(乳腺癌、食管癌、大肠癌、肝癌、胰腺癌)中的患者,使用22个TIICs进行共识聚类,我们观察到,最优聚类数为肝癌4个、结直肠癌2个、乳腺癌4个、食管癌2个、胰腺癌2个。只有肝癌和胰腺癌有显著的统计学差异。



5. 功能富集分析

1)在IS1和IS2中TGF-β信号显著富集,提示免疫抑制(图5F、I)。IS3与T细胞受体信号、抗原处理和呈递信号显著上调相关,提示活动性炎症和免疫浸润(图5D、E、G、H)。

2)经典的肿瘤抑制信号P53在IS3中富集,典型的致癌信号JAK-STAT在IS1-2中富集。这一结果与免疫亚型之间免疫细胞浸润的差异相一致(图5F、I)。

3)与IS1-2相比,IS3中PD1、PDL1、CTLA4等免疫检查点和TP53的表达较高,而JAK1的表达较低,这与功能富集分析结果一致。

4)以上结果大致可以解释IS3比IS1和IS2预后更好。



6. 深度学习

去除低质量病理图像后,将169例WSIs样本分为训练组(84例)、验证组(51例)和测试组(34例),然后将肿瘤ROI分割成512 × 512个补片。然后补片被应用于ResNet-18深度学习模型预测免疫亚型,并在测试队列中测量了其性能(图6)。该模型在胃癌的预测准确性在训练、验证和测试组大约分别是85.71%,80.39%,76.47%。




4

讨论总结

小结

  1. 本文提出了三种胃癌的免疫亚型,并且观察到每种亚型有不同成分的肿瘤免疫细胞浸润,亚型之间在功能定位、分子特征和临床特征等方面存在差异

  2. 免疫热型3的预后较好,而免疫冷型1、2的预后较差

  3. 对泛癌队列的验证增强结果的可信度

  4. 本文提出了一种基于全视野数字切片的深度学习模型,该模型能够较好地预测胃癌免疫亚型

  5. 本研究对指导免疫治疗和预测预后具有潜在价值

本文也存在一定的局限性

  1. 只关注了TME中的肿瘤免疫浸润细胞,而没有关注其中的其他成分

  2. 免疫浸润细胞来自基因表达谱,这意味着无法进一步分析免疫细胞的位置信息

  3. 不能排除本回顾性研究中存在选择偏倚的可能性,以及样本量小的问题

  4. 胃癌是一种高度异质性的癌症, 3种亚型可能还不够预测免疫治疗应答

  5. 无法获得深度学习用于区分亚型的准确参数

偷偷告诉你,我们在B站还有优质文章分享视频哦~

        写在后面

       医学僧的心愿是为医学僧的支持者和科研爱好者营造一个勤学好问、互帮互助、共同进步的优良环境。但是人多了难免鱼龙混杂,良莠不齐,群里不乏有真心实意、脚踏实地的科研人,我们很尊重并欢迎他们,因此不希望被少数来发广告的、划水的、看热闹的、占个坑的所打扰,最终我们的心意付之东流,大家的热情消磨殆尽。为了解决这个问题,我们决定提高入群的门槛——收费进群,这样,愿意进群的同志相信也是个圈内活跃用户,圈内人相互交流,岂不快哉!

      因此,为了提升大家的效率,调动大家的积极性,吸收真正的科研爱好者,形成一个良好的学习交流氛围,我们决定增加群的数量,并细化群的功能,暂时增加以下几个主题群:

文献下载-医学僧

机器学习(分类)-医学僧

ggplot可视化-医学僧

热图可视化-医学僧

TCGA挖掘-医学僧

GEO挖掘-医学僧

肿瘤预后模型-医学僧

肿瘤分子亚型-医学僧

欢迎小伙伴们进群👏👏👏,每个群收费15元。请联系小编微信yixuesengkyrj或扫描下面二维码: