Closed ixxmu closed 2 months ago
基于 Transformer 的结肠直肠癌组织学生物标志物预测:一项大规模多中心研究
深度学习 (DL) 可以加速从结直肠癌 (CRC) 的常规病理切片中预测预后生物标志物。然而,目前的方法依赖于卷积神经网络 (CNN),并且大多已在小规模患者群体中得到验证。在这里,我们开发了一种新的基于Transformer的管道,用于从病理切片中进行端到端生物标志物预测,方法是将预训练的Transformer编码器与用于补丁聚合的Transformer网络相结合。与当前最先进的算法相比,我们基于Transformer的方法大大提高了性能、通用性、数据效率和可解释性。在对来自 16 个结直肠癌队列的 13,000 多名患者的大型多中心队列进行训练和评估后,我们对手术切除标本微卫星不稳定性 (MSI) 的预测实现了 0.99 的灵敏度和超过 0.99 的阴性预测值。我们证明仅对切除标本进行训练在内窥镜活检组织上达到了临床级性能,解决了长期存在的诊断问题。
结直肠癌 (CRC) 的精准肿瘤学需要评估遗传生物标志物,例如微卫星不稳定性 (MSI) 以及BRAF4和 NRAS/KRAS9 基因突变。这些生物标志物通常通过聚合酶链反应 (PCR)、测序或免疫组织化学测定进行评估。
模型描述作者的生物标志物预测流程包括三个步骤(图 1):i)数据预处理流程(图 1A),ii)基于Transformer的特征提取器,以及 iii)基于Transformer的聚合模块,该模块从全幻灯片图像 (WSI) 的所有块的嵌入中产生最终预测(图 1B)。
在预处理流程中,使用 RGB 阈值和 Canny 边缘检测对组织区域进行分割,以检测背景和模糊区域。模型描述作者的生物标志物预测流程包括三个步骤(图 1):i)数据预处理流程(图 1A),ii)基于Transformer的特征提取器,以及 iii)基于Transformer的聚合模块,该模块从全幻灯片图像 (WSI) 的所有块的嵌入中产生最终预测(图 1B)。CTransPath 首先由三个卷积层组成,以促进局部特征提取并提高训练稳定性,然后是四个 Swin Transformer 阶段。作者使用 5 倍交叉验证和域内验证和测试进行了所有实验。在此交叉验证变体中,域内验证和测试集在患者级别从完整数据集中分离出来,留下 3 倍用于训练。作者进一步在数据集之外的外部队列上评估模型以进行域外测试。为了考虑不同的队列大小,作者每 500 次迭代评估一次单个队列上的模型,每 1000 次迭代评估一次多个队列上的模型
基于 Transformer 的 MSI 预测优于最先进的方法作者通过两种方式在 CRC 患者手术切除队列(图 1)中测试了 MSI 预测流程:首先,作者在单个队列上训练模型,并在保留的测试集和所有其他队列上进行测试。该模型对于早发性 CRC(即 50 岁以下患者的 CRC)实现了接近 0.9 AUROC 的高性能(图 S2B)。作者将这一表现与 Echle 等人的工作进行了比较。作者的方法在所有四个队列中都优于基于 CNN 的方法。使用 CTransPath 作为特征提取器在大型队列上比基于 CNN 的方法产生更高的性能,但在较小队列 TCGA 上训练的外部验证中结果部分较低。作者观察到在超过 1,000 名患者的数据集上训练的模型具有性能更高和泛化更好的趋势。不同的群体遗传学或载玻片扫描仪的类型等因素会影响训练数据集大小以外的泛化能力
精准肿瘤学在 CRC 患者中的推广有望延长预期寿命。使用基于深度学习的组织病理学切片分析来提取肿瘤生物标志物已成为 2018 年研究环境中的常见方法。 反过来,这最近导致监管机构批准了多种临床使用的算法。这些示例包括 Paige(美国纽约州纽约市)的乳腺癌生存预测算法、DoMore Diagnostics(挪威奥斯陆)的 CRC 生存预测方法、Owkin(法国巴黎和美国纽约州纽约市)的 CRC MSI 状态预测方法等。这些示例包括 Paige(美国纽约州纽约)开发的乳腺癌生存预测算法、DoMore Diagnostics(挪威奥斯陆)开发的预测结直肠癌生存率的方法、Owkin(法国巴黎和美国纽约州纽约)开发的预测结直肠癌 MSI 状态的方法等。 现有的深度学习生物标志物有一些关键限制:人们对其性能是否足以进行大规模使用存在争议,它们不一定适用于任何患者群体,并且它们未被批准用于活检材料,因为将深度学习算法应用于活检通常会导致比应用于手术标本低得多的性能。
深度学习 (DL) 可以加速从常规结直肠癌 (CRC) 病理切片中预测预后生物标志物。当前的方法依赖于卷积神经网络 (CNN),并且大多已在小型患者队列中得到验证。作者通过将预训练的 Transformer 编码器与用于补丁聚合的 Transformer 网络相结合,开发了一种新的基于 Transformer 的管道,用于从病理切片中进行端到端生物标志物预测。与当前最先进的算法相比,作者基于 Transformer 的方法大大提高了性能、通用性、数据效率和可解释性。在对来自 16 个结直肠癌队列的 13,000 多名患者的大型多中心队列进行训练和评估后,作者在预测手术切除标本的微卫星不稳定性 (MSI) 方面实现了 0.99 的灵敏度和超过 0.99 的阴性预测值。作者证明,仅针对切除标本的训练在内窥镜活检组织上达到了临床级性能,解决了长期存在的诊断问题
与往期文献推荐帖一致点赞👍过100出配套代码复现文章👀!有好的文献推荐可以在后台私信小编哈~
DOI: https://doi.org/10.1016/j.ccell.2023.08.002
https://mp.weixin.qq.com/s/vOc_WzHlb6awLiexHvaWWQ