ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
124 stars 30 forks source link

综述精读 | 计算免疫基因组学方法预测癌症免疫疗法的反应 #5700

Closed ixxmu closed 1 month ago

ixxmu commented 1 month ago

https://mp.weixin.qq.com/s/9SUcWmqfHNukADZuQiHVoA

ixxmu commented 1 month ago

综述精读 | 计算免疫基因组学方法预测癌症免疫疗法的反应 by BioJournal Link

Basic Information

  • 英文标题: Computational immunogenomic approaches to predict response to cancer immunotherapies
  • 中文标题:计算免疫基因组学方法预测癌症免疫疗法的反应
  • 发表日期:31 October 2023
  • 文章类型:Review Article
  • 所属期刊:Nature Reviews Clinical Oncology
  • 文章作者:Venkateswar Addala | Nicola Waddell
  • 文章链接:https://www.nature.com/articles/s41571-023-00830-6

Abstract

  1. 癌症免疫基因组学是一个新兴领域,它连接着基因组学和免疫学。
  2. 大规模基因组合作努力的建立以及新的单细胞转录组技术和多组学方法的发展,使得许多癌症类型的突变和转录组特征得以表征,并有助于识别具有临床操作性的改变以及预测和预后生物标志物。
  3. 研究人员已经开发出计算方法与机器学习算法,以从来自大量组织或单个细胞的基因组和转录组测序数据中准确获取临床上有用的信息,并探索肿瘤及其微环境。
  4. 测序和计算方法的快速增长导致了对理解其在改善接受免疫疗法治疗的癌症患者管理中的真正潜力和限制的未满足需求。
  5. 在这篇综述中,我们描述了目前可用于分析来自癌症、间质和免疫细胞的大量组织和单细胞测序数据的计算方法,以及如何最好地选择最合适的工具来回答各种临床问题,并最终改善患者结局。

Key points

  1. 研究人员正在开发各种免疫基因组学工具,以预测接受免疫检查点抑制剂(ICIs)治疗的癌症患者的反应,这些工具基于可通过测序识别的癌症内在和癌症外在特征,包括肿瘤突变负荷、新抗原和免疫细胞的存在。
  2. 用于从全基因组测序、全外显子测序和RNA测序进行HLA分型的计算工具已经非常成熟;长读长测序是一项有前景的技术,预计将提高HLA分型的性能。
  3. 已经开发出多种方法来识别免疫原性新抗原,主要关注体细胞单核苷酸变异;然而,从非典型来源识别新抗原对于全面理解新抗原负荷至关重要。
  4. 解卷积工具可以估算肿瘤微环境中的免疫细胞比例,但在识别低丰度细胞类型和亚群方面存在局限性;因此,使用这些工具需要仔细考虑潜在的技术和生物因素。
  5. 在大规模肿瘤样本队列中基于分子和临床特征训练的多组学机器学习模型可以改进对患者免疫治疗反应的预测,并揭示关键的预测特征。
  6. 功能验证的方法整合了基因组内肿瘤异质性、HLA基因型、新抗原运输及表达和免疫原性等特征,可能会改进对ICIs反应的预测。

Introduction

para
  1. 识别出导致癌症患者出现具有药物靶点修饰的体细胞改变,为某些癌症类型的生存率提高提供了可能。
  2. 然而,并非所有患者都有可操作的改变,即使有这些改变的患者也常常会疾病复发和/或产生治疗耐药性。
  3. 利用免疫系统疗法作为一种有希望的新选择出现了;其中一种方法涉及使用免疫检查点抑制剂(ICIs),它们经常针对PD-1–PD-L1轴或CTLA4。
  4. 免疫检查点PD-1和CTLA4抑制T细胞活化,因此,阻断它们与配体的相互作用的目标是释放抗肿瘤免疫。
  5. ICIs已成为几种肿瘤类型的一线治疗选择。
  6. 然而,患者仍然可能会复发和/或产生治疗耐药性。
  7. 因此,确定哪些患者可能从ICIs中受益仍然是免疫治疗中的主要挑战之一。
  8. 在某些肿瘤类型中,肿瘤PD-L1表达被用作伴随生物标志物,以选择接受ICIs的患者。
  9. 然而,PD-L1是一个不完美的生物标志物,并带来了需要解决的挑战,包括建立阳性的阈值以及解决最佳阈值对于ICI反应是否在不同肿瘤类型和/或不同的PD-L1抗体之间有所不同。
  10. 这些挑战在11个III期试验的PD-L1报告总结中得到了强调,该总结说明了评分方法和主要终点截止值的不同。
  11. 肿瘤突变负担(TMB),即癌症细胞中每兆碱基(Mb)的体细胞突变数,是另一个提出的预测性生物标志物。
  12. TMB高的患者(>10个突变/兆碱基(mut/Mb))更有可能对ICIs有反应,因此,TMB被FDA批准作为选择适合接受pembrolizumab的患者生物标志物。
  13. 特定基因表达谱(GEP)特征与对ICIs的反应有关,也被描述和提议作为生物标志物。
  14. 然而,对一种抗PD-1抗体pembrolizumab的四项临床试验中超过300名患者的样本分析显示,TMB、PD-L1状态或GEP特征单独与22种肿瘤类型的ICI反应仅有适度相关性;这些特征被定义为独立的预测生物标志物。
para
  1. 免疫检查点抑制剂(ICIs)反应的稳健预测生物标志物的缺乏激发了计算免疫基因组学方法的发展,以确定哪些患者可能从这些药物中受益,并量身定制ICI组合。
  2. 许多影响ICIs反应的癌症固有(在癌细胞内)和癌症外在(与肿瘤微环境(TME)相关)特征可以通过计算免疫基因组学方法探索,该方法用于分析来自批量组织和单个细胞的DNA测序(DNA-seq)和RNA测序(RNA-seq)数据(图1)。

Fig. 1: Computational approaches to interrogate cancer-intrinsic and cancer-extrinsic immune phenotypes in bulk tissue samples.

  • 研究人员已经开发出各种计算工具,用于分析肿瘤DNA和RNA测序数据。
  • 免疫基因组学研究已经利用这些方法来表征癌症的免疫特征并预测患者对免疫检查点抑制剂(ICIs)的反应。
  • 这些计算方法可以分为研究癌症固有特征、癌症外在特征以及单细胞方法等。
  • 其中一些工具与癌症免疫周期的步骤相交(在这里显示为一个七步骤周期)。
  • 该图提供了迄今为止已开发的工具的概述。
  • APC,抗原呈递细胞;DC,树突状细胞;ITH,肿瘤内异质性;MHC,主要组织相容性复合体;scRNA-seq,单细胞RNA测序;scDNA-seq,单细胞DNA测序;TCR,T细胞受体;TMB,肿瘤突变负荷;TME,肿瘤微环境。
  1. 在本篇综述中,我们讨论了计算方法的发展,用以确定TMB和HLA基因型等,以及估计突变诱导的neoantigen负荷、TME的细胞组成和GEP特征。
  2. 我们强调了这些计算方法在可以测量的癌症内在和外在特征背景下的可靠性和局限性,这些特征来自接受ICIs治疗的临床试验患者的组学数据。

Analysis of cancer-intrinsic features

Tumour purity and genomic ITH

肿瘤纯度与基因异质性

para
  1. 肿瘤纯度是肿瘤组织样本中癌细胞的比例或百分比,因此它影响了用于分析癌症内在和外在免疫基因组特征的计算方法的表现。
  2. 已经开发出各种计算方法来测量从DNA-seq和RNA-seq或DNA甲基化分析数据中的肿瘤纯度,以及综合共识方法(图1),并且这些方法通常显示出彼此之间有很好的一致性。
para
  1. 基因组肿瘤内异质性(ITH)出现在大多数肿瘤中,指的是肿瘤细胞的克隆结构和基因组差异,这些差异可能存在于个体亚克隆之间。
  2. ITH与治疗抵抗、复发和患者生存期减少有关。
  3. 已经开发出大量的计算工具,用于从基因组测序数据估计基因组的ITH,包括Pyclone、SciClone、Battenberg、HATCHet和FastClone等。
  4. 一些研究已经比较了这些算法和其他算法的性能,并发现它们的性能和准确性可能会有所不同,且随着测序深度的增加而提高。
  5. 对每个肿瘤的多个样本进行测序,以捕捉空间和时间上的变化,能够更好地理解ITH和肿瘤的演变。
  6. 一些工具,如HATCHet(它推断亚克隆的拷贝数变化和全基因组复制),已经被开发用于分析同一肿瘤的多个样本。

Tumour mutational burden

肿瘤突变负荷

para
  1. 癌症细胞中发生的体细胞基因改变包括单核苷酸变异(SNVs)、多核苷酸变异、小插入和缺失(indels)、拷贝数改变(CNAs)以及大染色体结构变异。
  2. TMB并不反映所有的体细胞改变:大多数商业上可用的评估面板通常考虑的是肿瘤样本中体细胞非同义(即影响蛋白序列)的SNVs的数量,或者伴随同义(即不影响蛋白序列)SNVs,某些情况下也包括indels,并以mut/Mb50表示。
  3. 高TMB与ICIs的响应性有关,例如,由于紫外线辐射的强烈诱变作用,皮肤黑色素瘤往往具有高TMB,并且患有这种恶性肿瘤的患者通常对ICIs有良好的反应。
  4. 在KEYNOTE-158试验中,据报道,高TMB与良好的反应有关,在该试验中,高TMB(>10 mut/Mb)的患者中有29%有客观反应,而低TMB的患者中只有6%。
para
  1. 尽管这是一个简单的概念,但TMB的估计与癌症类型、样本制备、测序方法、用于召唤突变的生物信息学方法以及用于计算TMB的突变选择等众多注意事项相关。
  2. 癌症类型可以有不同范围的SNV数量,因此不同癌症类型之间的高TMB阈值可能不同。
  3. 样本可以以不同的状态制备,包括新鲜冷冻或福尔马林固定的石蜡包埋(FFPE)组织,这将影响DNA产率和质量,进而影响后续的序列质量和变异检测。
  4. 肿瘤纯度和基因组的异质性影响含有一种或多种特定突变的DNA的比例,但这种比例在样本之间并不一致,从而影响突变的检测。
  5. 测序的深度和全基因组测序(WGS)、全外显子测序(WES)、综合基因面板或目标面板测序方法的选择也会影响突变检测,因为体细胞突变在癌细胞基因组中并非均匀分布。
  6. 对生物信息学测序和数据过滤方法的较大规模实验室间比较显示,在变异检测上有显著差异。
  7. 随后,另一个小组评估了实验和分析元素对体细胞变异检测的影响,并制定了最佳实践建议,以改进从WGS和WES数据中检测突变的可重复性和准确性。
  8. 此外,测序的DNA是否来自配对的癌症和非恶性细胞样本(这使得生物信息学减去生殖细胞变异)或来自癌细胞(通过序列读数中包含变异的比例或群体数据库中未检测到变异来确定癌症特异性突变,如GnomAD),这影响了体细胞突变检测的敏感性和准确性。
  9. 因此,当测序来自那些在群体数据库中通常代表性不足的个体,如非洲人、亚洲人或第一民族人的癌症样本时,研究者应该考虑测序一个匹配的非恶性样本。
para
  1. 有多种方法可用于测序样本或选择突变。
  2. 例如,研究人员使用全基因组测序(WGS)计数所有体细胞突变(单核苷酸变异和插入缺失),从而确定了一个包含77名黑色素瘤患者的临床数据集中的肿瘤突变负荷(TMB)。
  3. 另一个研究小组通过全外显子测序(WES)识别的编码区的体细胞错义突变,计算了312名非小细胞肺癌(NSCLC)患者样本中的TMB。
  4. 其他研究人员通过测序基因面板识别的编码区内体细胞非同义突变来计算TMB,包括1552名NSCLC患者和403名晚期癌症患者(7种不同癌症类型)。
  5. 尽管使用这些方法计算的TMB估计值可能相关,但给定肿瘤样本的绝对值的变化可能导致肿瘤不能始终被划分为高于或低于定义的阈值,这对于使用TMB确定ICIs的适用性是一个重要的考虑因素。
  6. FDA批准pembrolizumab用于具有高TMB的实体肿瘤患者,其中包括使用FoundationOne CDx检测(使用FFPE肿瘤样本)作为伴随诊断工具。
  7. TMB是一个连续变量,因此是否应该对所有癌症类型使用10 mut/Mb的硬阈值仍然不清楚。
  8. 研究人员必须仔细考虑样本、技术和生物信息学相关变化对突变检测准确性的影响,这反过来又会影响TMB。
para
  1. TMB协调项目是为了制定关于TMB量化和使用指南而成立的。
  2. 这些指南推荐了一种针对全外显子组测序(WES)分析的统一TMB计算方法,包括中位覆盖度为300×,参考变异位点的读段深度对齐(≥25),变异计数≥3,变异等位基因频率的截止值为5%,并排除了同义变异。
para
  1. 研究人员认为,具有高肿瘤突变负荷(TMB)的肿瘤具有更大的潜力编码新抗原,这些新抗原是肿瘤特异性的‘新型’抗原,由癌细胞中的体细胞突变产生,并构成免疫效应细胞的潜在靶点。
  2. 然而,高TMB是否使肿瘤更具免疫原性,因为它增加了被免疫系统识别的新抗原的数量,或者因为存在少数强烈的无宿主耐受的新抗原,仍有待阐明。
  3. 这一考虑对未来计算方法的设计至关重要,可能会使得选择有前景的新抗原以包含在新抗原疫苗中成为可能。

HLA genotype

HLA基因型

para
  1. HLA基因编码主要组织相容性(MHC)分子,这些分子向T细胞呈递抗原,包括肿瘤特异性新抗原。
  2. MHC I类(MHC I)分子向CD8+细胞毒性T淋巴细胞(CTLs)呈递抗原,而MHC II分子向CD4+辅助或调节性T(Treg)细胞呈递抗原。
  3. 因此,MHC分子在感染、炎症条件、自身免疫疾病和抗肿瘤免疫反应中具有关键作用,并且如果无法加载新抗原,可能是免疫逃逸的一种假定机制。
  4. 实际上,HLA多样性越大,导致的MHC分子种类越多,可以向免疫细胞呈递更多变异肽类,与某些癌症的发病风险降低有关,并且与对ICIs的更好反应有关。
  5. 相反,肿瘤相关杂合性缺失(LOH)在HLA区域中可能会模拟降低HLA多样性,并可能通过使强新抗原"隐藏"在宿主免疫反应中而有助于免疫逃逸。
  6. 对超过1500名接受ICI治疗的黑色素瘤或非小细胞肺癌(NSCLC)患者的HLA基因型分析显示,具有HLA杂合性的患者的总生存期(OS)显著优于具有一个或多个同型HLA I类(HLA-I)等位基因的患者。
  7. 在TRACERx队列中,40%的早期NSCLC患者存在HLA区域的LOH,这与亚克隆新抗原负担增加显著相关,可能是免疫逃逸的潜在贡献因素。
  8. 一些证据表明,特定的HLA-I基因型影响对ICI的反应。
  9. 例如,在黑色素瘤患者中,HLA-B44(等位基因频率:0.45)超型等位基因与改善的OS相关,而HLA-B62(等位基因频率:0.15)超型等位基因与OS不良相关。
  10. 鉴于这些结果,研究者们提出了一个HLA-I进化分歧(HED)评分,用于计算HLA-I等位基因多样性对ICI疗效的影响,较高的HED评分表明有更好的反应。
para
  1. 拥有准确的HLA识别方法至关重要。
  2. 传统的HLA基因分型是通过血清学和基于PCR的体外技术进行的,能够达到2到4位数的HLA基因型分辨率。
  3. 研究人员已经开发出从下一代测序(NGS)数据中进行HLA基因分型的方法,其中一些方法能够以快速、高通量的方式确定6到8位数的HLA基因型(补充表1)。
  4. 从全基因组测序(WGS)、全外显子测序(WES)和RNA-seq数据中进行HLA基因分型的计算工具基于两种方法:比对,即通过将序列读段与参考等位基因序列对齐并通过概率模型预测基因型;以及从头组装,即首先组装HLA区域内的读段,然后与最佳的已知HLA等位基因参考序列进行比对(补充表1)。
  5. 与PCR相比,用于确定HLA基因型的计算方法被描述为99%的准确度;然而,序列读段深度和样本肿瘤纯度会不同程度上影响每种方法,因此需要改进的方法和基准研究。
  6. 对几种HLA基因分型算法的比较显示,基于比对的OptiType在估计来自WES或WGS数据的HLA-I基因型方面具有最高的准确度,当使用平均读深度为20×的测序数据对HLA和侧翼内含子区域进行HLA-I基因分型时,准确度达到100%。
  7. 长读测序是一种新兴且令人兴奋的方法,能够通过测序长读段(>10 kb)解析高度多态性的HLA区域,从而实现HLA等位基因的全长测序和基因型预测。

Neoantigen prediction

新抗原预测

  1. 癌症特异性抗原处理和呈递是一个复杂的过程,涉及基因改变转录、翻译、保留作为裂解肽的基因改变以及MHC结合,以便在细胞表面呈递。
  2. 随后,MHC结合的新抗原被免疫系统‘识别’;这个信号是产生T细胞介导的抗肿瘤免疫的第一步。

Prediction of immunogenic neoantigens

预测免疫原性新抗原

  1. 通过使用先进的生物信息学算法分析基因组测序数据,可以预测肿瘤特异性候选新抗原呈现的可能性,这涉及到对体细胞突变和HLA基因型的表征。
  2. 从测序数据中鉴定新抗原是一个多步骤的过程,包括检测体细胞突变、预测蛋白质裂解以及肽-MHC结合亲和力和稳定性的计算(图2a)。
  3. 用于预测蛋白酶体裂解、肽运输到内质网以及MHC-肽结合亲和力的算法受到用于训练它们的数据集的限制。
  4. 用户需要对这些限制进行考量,以对大型数据集进行准确分析。
  5. NetChop工具3.1版通过使用1260个HLA等位基因的公开可用数据(仅使用C端裂解数据)或来自计算机模拟数据集的20S裂解数据进行训练。
  6. NetCTL89是一个估计新抗原运输的工具,它通过整合蛋白酶体C端裂解、抗原处理相关转运体(TAP)复合物转运效率以及MHC-新抗原结合效率的预测来进行估计,它使用了一个数据库进行训练,该数据库中的肽按照与12个MHC I超类型中一个的亲和力进行分组。
  7. MHC结合亲和力工具NetMHC90的4.0版使用了一个包含81个HLA等位基因的数据集进行训练,其他方法如NetMHCpan91和MHCflurry92也被开发用于预测与任何已知MHC的结合亲和力。
  8. 许多肽-MHC结合预测算法使用人工神经网络(ANNs),这是一种机器学习方法,使用从免疫表位数据库(IEDB)93、PRIDE94和SysteMHC95中存档的实验数据手动整理的结合亲和力数据训练,这些数据包含来自T细胞表位的1141280个肽。
  9. 因此,基于ANN的模型显示出对选择类似病毒表位的偏向,并且大多数是使用最频繁的HLA等位基因(例如,HLA-A02:01和HLA-B07:02)进行训练的。

Fig. 2: Computational approaches to identify cancer neoantigens from various sources.

  • 研究人员已经开发出方法,在新生抗原处理的不同阶段,包括从合成到在主要组织相容性复合体(MHC)分子上的呈现,来识别癌症特异性新生抗原。
  • 常见的研究新生抗原的来源包括规范来源,如体细胞点突变,以及小插入和/或缺失(indels),还包括非规范来源的体细胞新生抗原,例如基因融合、结构变异、转座元件、内含子保留和异常基因拼接。
  • 此外,具有一定相似度的微生物肽可以避免或转移免疫反应。
  • 图解周围的方框包括了预测源自内层所示来源的新生抗原的计算方法。
  • ER,内质网;IC50,半最大抑制浓度;LOH,杂合性缺失;RNA-seq,RNA测序;TAP,与抗原处理相关的转运蛋白;TMM,M值的修剪平均值;TPM,每百万转录本;WES,全外显子测序;WGS,全基因组测序。
para
  1. 计算性新抗原预测管道已经发展出来,以整合大量针对新抗原呈现每个步骤的特定算法(图2a和补充表2)。
  2. 新抗原预测的一个主要问题是候选事件的优先级排序,这些事件能够引发免疫应答。
  3. 只有1-5%的计算预测的MHC I结合新抗原被证明能引发免疫应答,因此这些方法的性能相当差。
  4. 研究人员开发了一种改进的计算工作流程,以增强新抗原预测,该流程考虑了肽与MHC I分子结合的锚定位点。
  5. 为了估计新抗原形成及被T细胞识别的可能性及其临床相关性,Łuksza等人提出了一个基于新抗原-MHC结合亲和力以及候选新抗原与已知抗原之间的非线性依赖序列相似性的新抗原适应性模型。
  6. 该模型将接受ICIs的胰腺癌、肺癌或黑色素瘤患者分配到低新抗原适应性组与高新抗原适应性组,这两组在总生存期(OS)上存在统计学上的显著差异。
  7. 这些结果表明,免疫介导的选择压力可能潜在地塑造T细胞识别的新抗原景观。
para
  1. 大多数新抗原结合预测工具都是用新抗原与MHC I分子结合的数据进行训练的。预测与MHC II分子的结合甚至比MHC I-新抗原结合预测更不可靠,部分原因是MHC II呈递的复杂性增加,其中呈现的肽段更长(16至21个氨基酸残基,而MHC I为8至11个),以及MHC II-肽结合的‘多态性’和用于训练预测算法的数据集数量有限。
  2. 已经开发了各种计算方法,包括NetMHCII、NetMHCIIpan、MULTIPRED2和MHCPred,它们使用人工神经网络(ANNs)来预测MHC II结合表位。
  3. MARIA是一个深度学习模型,它使用自然呈现的MHC II肽段的质量光谱数据进行了训练。
  4. 在对抗已知的MHC II结合抗原进行交叉验证时,MARIA在一个黑色素瘤数据集上的表现超过了NetMHCIIpan,但其性能尚未在独立研究中得到验证。
para
  1. 为了克服与训练数据集相关的挑战,研究人员使用了质谱确定的 数据。
  2. 然而,蛋白质组学方法的灵敏度较低;实际上,对29个健康组织的深度蛋白质组分析仅检测到在外显子水平上检测到的2.4%的突变变体。
  3. 研究人员将16个来自七名患者的黑色素瘤样本的WES数据与MHC结合肽的质谱分析相结合,鉴定出五个新抗原,其中三个引起了免疫反应。
  4. 通过全球联盟的努力将三个可用数据库(IEDB,PRIDE和SysteMHC)整合并添加阳性对照数据,将提供大量表位信息源,有助于研究人员开发和测试新的工具和算法。
  5. 这种数据的开发和共享将提供有价值的信息,可能提高新抗原预测工具的准确性,并使设计基于新抗原的疫苗成为可能。
para
  1. 新抗原预测算法很受欢迎;然而,用户在将选定的计算方法应用于大型数据集之前(补充表3),应该了解这些方法的优点和局限性。
  2. 例如,新抗原的预测在计算上具有挑战性,通常需要很长的计算时间。
  3. 根据我们的经验,对于具有高TMB的肿瘤,估计MHC I分子的新抗原负荷可能需要超过400个CPU小时。
  4. 对于特定应用来说,最佳的算法将取决于研究的具体需求;每种算法都有其特定的优点和缺点。
para
  1. 当前方法的挑战在于,它们并未设计用来考虑基因组异质性(ITH),而这是免疫检查点抑制剂(ICIs)耐药的主要决定因素。实际上,基因组ITH以及肿瘤发展过程中和/或治疗期间亚克隆的出现可以解释肿瘤如何逃避免疫系统。
  2. 与这一原理一致,研究人员报告称,接受抗PD-1抗体治疗的非小细胞肺癌(NSCLC)或黑色素瘤患者,若主要携带克隆性新抗原,其预后比那些主要携带亚克隆事件的患者要好。
  3. 目前需要整合基因组ITH、新抗原转运、克隆性、新抗原的表达和免疫原性的工具。

Neoantigens from non-canonical sources

来自非典型来源的新抗原

para
  1. 大多数旨在识别候选新抗原的方法会分析体细胞错义单核苷酸变异(SNVs)。
  2. 然而,在一些通常具有低肿瘤突变负荷(TMB)的肿瘤类型中,如胶质母细胞瘤或间皮瘤的患者中,已报告使用免疫检查点抑制剂(ICIs)具有临床益处,表明SNVs不是抗原的唯一来源。
  3. 新抗原的潜在非常规来源包括创建新开放阅读框的移码插入或缺失突变,体细胞结构变异(包括那些破坏基因位点的变异),基因融合事件,异常基因剪接(包括内含子保留),RNA编辑,长非编码RNA,其他癌症特异性转录事件和内源性反转录元件(见图2b)。
para
  1. 在2020年代之前,并没有计算方法来识别来自非规范来源的新抗原。
  2. 随后,研究人员开发了NeoSplice128、IRIS129和ASNEO130来预测由剪接事件产生的新抗原。
  3. 这一来源特别有吸引力,因为一项泛癌症分析表明,由剪接产生的新抗原预测与MHC结合的数量至少是那些由SNVs121产生的两倍。
  4. 然而,目前尚不清楚,由剪接产生的新表位相较于其他来源产生的新表位,触发的免疫反应是更可能还是更不可能,这部分是由于RNA处理的复杂性,这给准确识别剪接产生的新抗原候选物带来了挑战。
para
  1. 癌症特异性转座元素也作为新抗原的来源受到关注。
  2. 来源于非常规剪接(使用外显子和转座元素之间的连接处)的多肽可以产生MHC I呈递的癌症特异性抗原,从非小细胞肺癌患者中分离出了对这种抗原反应的T细胞。
  3. 这些多肽成为癌症疫苗的具有前景的靶点。
  4. 另一组研究人员利用癌症基因组图谱(TCGA)的泛癌症数据,开发了TEProf2流程,以识别2000多个转座元素转录本,包括在分析的15%肿瘤中发现的反复事件L1P2_STK31,它导致了一个具有新抗原潜力的嵌合蛋白的产生。
para
  1. 研究人员开发了NeoSV135来分析全基因组测序数据,并预测源自基因位点内的体细胞结构变异的MHC I特异性新抗原。
  2. NeoSV组装了源自结构变异的新转录本,通过计算将其翻译成蛋白质,并使用所谓的滑动窗口方法来确定所有潜在的短肽。
  3. 选择了包含至少一个突变位点的肽段,这些突变会导致氨基酸序列的改变,从而可能产生癌症特异性新肽段,并使用NetMHCpan预测MHC I结合亲和力。
  4. 在使用结构变异事件进行新抗原预测时,一个挑战是大多数结构变异断点发生在基因组的编码序列之间,因此,仅使用全基因组测序数据预测这些结构变异对转录的影响在计算上通常是具有挑战性的。
  5. LENS136是一种全面的方法,它使用RNA-seq和DNA-seq数据来预测源自各种基因改变(包括SNVs、indels、自身抗原(如癌症睾丸抗原1;也称为NY-ESO1)和非典型来源,如融合事件、剪接变异、病毒和内源性反转录病毒)的癌症特异性抗原。
  6. LENS是一种有前景的方法,需要进一步的测试来验证检测的准确性。
  7. 预测新抗原的完整景观将需要全面的基因组分析,如长读全基因组测序或全长RNA-seq,并结合计算方法的验证,以可靠地注释和检索可能结合到MHC I或II分子的氨基酸序列。

Neoantigen-derived cancer vaccines

新抗原来源的癌症疫苗

para
  1. 现有的计算算法能够准确确定患者特异性的HLA基因型,但无法有信心地预测所有潜在的免疫原性新抗原;因此,基于新抗原的疫苗开发进展缓慢。
  2. 尽管如此,候选新抗原有可能是治疗性癌症疫苗的有效靶点。
  3. 这类疫苗几乎总是需要个性化定制,因为每个患者的肿瘤表达不同的新抗原。
para
  1. 基于新抗原的疫苗已经在众多早期临床研究中进行了测试,单独使用或与ICIs联合使用;其中一些已被证明是安全的,并且耐受性良好。
  2. 在撰写本评论时,ClinicalTrials.gov上列出了超过150项临床试验,其中包括搜索词‘癌症’和‘新抗原’。
  3. 过去几年里,胰腺癌疫苗的发展取得了几项进展。
  4. 在一篇病例报告中,一位患有胰腺导管腺癌(PDAC)的患者在接受了针对由反复出现的KRASG12D突变产生的新抗原的HLA-C*08:02限制性T细胞受体(TCRs)治疗后,6个月后肿瘤持续消退,且没有报告任何毒性。
  5. 工程化的T细胞在血液中保持功能。
  6. 在一项I期临床试验中,16名接受手术切除的PDAC患者先后接受了抗PD-L1抗体atezolizumab、一种包含最多20个主要由单核苷酸变异(SNV)衍生的新抗原的mRNA-脂质基新抗原疫苗,然后15名患者接受了联合化疗(叶酸、氟尿嘧啶、伊立替康和奥沙利铂(mFOLFIRINOX))。
  7. 在临床有反应的8名患者中,对至少一种新抗原有强烈的T细胞反应,并且在中位随访18个月时未出现疾病复发,而在没有检测到疫苗扩增T细胞的患者中,中位无复发生存期(RFS)为13.4个月(P = 0.003)。
  8. 黑色素瘤患者也报道了进展。
  9. 在II期临床试验中,与仅接受pembrolizumab治疗的患者相比,接受了含有最多34个新抗原的新抗原疫苗和pembrolizumab治疗的切除黑色素瘤患者的18个月RFS有所改善(78.6%对62.2%;HR 0.56,95%CI 0.31-1.02)。
para
  1. 就非规范来源的新抗原而言,针对基因融合产物的疫苗可用于那些常见这些改变的肿瘤类型患者中,包括白血病、乳腺癌和结直肠癌、肾癌和肉瘤,或者如果它们在不同肿瘤组织学之间是共享的。
  2. 即便如此,集体共享的融合产物可能很罕见,这对药物开发提出了挑战,并需要个性化方法。
  3. 例如,一位头颈鳞状细胞癌(HNSCC)患者对派姆单抗和T细胞活性的持续反应在接受了与源自DEK–AFF2基因融合的肽脉冲的自体外周血单核细胞后增强了,这一基因融合在48%的鼻窦和颅底癌中已有报道。
  4. 在一项试点研究中,患有尤因肉瘤或肺泡横纹肌肉瘤的患者接受了与来源于移位断点编码的融合肽以及HPV16-E7肽结合的树突状细胞脉冲。
  5. 这种方法毒性很小,且在开始治疗的30位患者(43%)中的5年总生存率比研究中接受血细胞分离的所有患者(n = 52;31%)要高。
para
  1. 新抗原方法已用于嵌合抗原受体(CAR)T细胞疗法中,其中在T细胞中表达了工程化的新抗原特异性TCR。
  2. 一个关键的例子是首个人体一期临床试验,该试验使用非病毒基因编辑方法产生新抗原特异性TCR,以针对实体瘤患者的特异性肽段。
  3. 这项试验证明了这种方法的可行性。
para
  1. 计算方法预测癌症疫苗的新抗原候选将需要针对不同样本类型、样本纯度、测序方法和测序质量进行统计分析验证。
  2. 为了进一步推进这些疗法的发展,研究人员必须通过在早期临床试验中进行免疫监测,全面验证表位预测管道的精确性,不仅就免疫原性而言,还包括确定肿瘤识别程度。
  3. 新抗原疫苗的研发可以受益于早期的肿瘤切除,这为研究人员和临床医生提供了一个时间窗口(通常是2-3个月),以设计、生产和施用基于新抗原的治疗性疫苗。
  4. 先前的癌症治疗(如化疗、放疗和免疫检查点抑制剂)可以显著改变T细胞表型,尽管这些改变对于基于新抗原的疫苗的反应是否有积极或消极的影响仍有待确定。
  5. 对肿瘤内异质性和监测肿瘤进化的分析,以便针对克隆新抗原进行定位,可能能够设计出针对每位患者肿瘤中存在的最广泛范围的肿瘤新抗原图案的疫苗。

Analysis of cancer-extrinsic features

para
  1. 可以通过测序数据分析的癌症外部特征包括免疫系统特征和肿瘤微环境(TME)特征(见图1)。
  2. 肿瘤构建了一个独特的TME,其中包括多种多样的间质和免疫细胞(其他地方有详细评论156,157,158,159);肿瘤细胞与TME中的细胞之间的相互作用通过癌症免疫编辑和免疫监视等过程有助于肿瘤的进化和进展160,161,162,163。
  3. TME还包含了一个动态复杂的细胞因子、趋化因子、生长因子和黏附分子网络,推动癌症、间质和免疫细胞之间的相互作用,影响治疗反应164,165,166,167,168,169。
  4. 特别是,TME中激活的T细胞和CTL的存在或缺失分别代表了T细胞炎症(也称为‘热’)或非T细胞炎症(或‘冷’)TME,这可能影响对免疫检查点抑制剂(ICIs)的反应170。
para
  1. 已经开发出多种算法,用于分析RNA-seq和DNA甲基化剖析数据,以解析肿瘤微环境(TME)(图3和补充表4)。
  2. 总体而言,这些去卷积算法整合了各种统计和概率工具,将输入样本与定义的数据集之间的基因表达或DNA甲基化剖析数据进行比较。
  3. 这些方法的一个关键优点是输出简单——免疫细胞的相对比例,这很容易解释——但它们的预测性能会受到参考特征矩阵来源、数据预处理和肿瘤纯度的影响。

Fig. 3: Computational analysis of bulk tissue and single-cell RNA sequencing data to study the tumour microenvironment and associated features.

  • 有多种计算方法可用于分析肿瘤微环境(TME)的复杂性以及构成TME的各种细胞类型。
  • 一些工具使用来自批量组织样本的RNA测序(RNA-seq)数据来解析TME,其中一些工具基于来自单细胞RNA测序(scRNA-seq)数据的参考签名(虚线箭头)。
  • 已经开发出各种scRNA-seq工具来分配细胞标签并确定细胞特定的差异基因表达、细胞轨迹和细胞-细胞相互作用。
  • 可以利用计算方法和T细胞受体(TCRs)或B细胞受体(BCRs)的测序来识别B细胞和T细胞的多样性、克隆性和特异性。
  • 已经开发出几种方法来识别体细胞突变并利用单细胞DNA测序(scDNA-seq)数据研究肿瘤基因组的异质性和进化。
  • CAF,癌症相关成纤维细胞;DC,树突状细胞;MDSC,髓系来源的抑制细胞;NK,自然杀伤细胞;TAM,肿瘤相关巨噬细胞;TH细胞,辅助性T细胞;Treg细胞,调节性T细胞。

Approaches using RNA-seq data

使用RNA-seq数据的方法

para
  1. CIBERSORT146 使用 LM22 547-基因表达特征作为参考矩阵,并排除了在输入肿瘤基因表达矩阵中高表达的基因,因为它们会不利于已知或未知免疫细胞的估计。
  2. TIMER 工具173使用六个免疫细胞类型的参考基因表达特征,这些特征来源于人类原代细胞图谱174。
  3. ImSig175 使用代表七个免疫细胞群和三个生物过程(增殖、干扰素应答和翻译)的基因特征,这些特征是通过基因相关性网络分析定义的。
  4. EPIC176 整合了来自文献152,153,154的六种主要循环免疫细胞类型的基因表达特征以及五种主要黑色素瘤浸润免疫细胞类型的单细胞 RNA-seq(scRNA-seq)数据155。
  5. xCell177 是一个网络工具,它使用曲线拟合方法对细胞类型进行线性比较,该方法使用来自 1,822 个样本的 RNA-seq 数据作为参考矩阵,这些样本注释为 64 种细胞类型,并提供多种细胞类型的多样性和敏感富集。
  6. MCP-counter178 使用 1,194 个代表 TME 内细胞的样本和 742 个注有 63 种细胞类型的癌症样本来估计八种肿瘤浸润免疫细胞类型和两种间质细胞类型的绝对丰度。
  7. ConsensusTME(参考文献 179)使用来自七种方法(包括 CIBERSORT、TIMER、xCELL 和 MCP-counter)的细胞类型特定基因来估计 TME 中的 18 种免疫细胞类型。
  8. 其他 TME 解卷积方法结合了 RNA-seq 数据与其他来源的数据。
  9. quanTIseq180 是一个计算管道,可以从批量 RNA-seq 数据中解卷积出十种免疫细胞类型,并可以选择使用来自整个组织切片的组织学图像(免疫荧光、免疫组化或苏木精-伊红染色的组织切片)来将解卷积的免疫细胞类型的比例缩放到细胞密度。
para
  1. 去卷积方法已经使用RNA-seq数据来研究肿瘤微环境(图3)。
  2. 利用CIBERSORT,研究人员从代表TCGA中33种癌症类型的超过10,000个样本中确定了六种不同的免疫亚型。
  3. 炎症亚型,其特征是T辅助细胞标志物(特别是TH17和TH1)的高水平,具有最良好的预后。
  4. 对608个软组织肉瘤样本的肿瘤微环境进行MCP计数器分析,将这些肿瘤分为三组:免疫低、免疫高和高度血管化。
  5. 在一项涉及115名食管腺癌患者的二期临床试验中,研究人员使用ConsensusTME方法将患者分为四个免疫簇,包括一个与更好的总生存期相关的免疫热簇(q = 0.003)。

Approaches using DNA methylation profiling data

使用DNA甲基化分析数据的 方法

para
  1. DNA甲基化分析已成为一种有前景的方法,用以解析免疫细胞和基质细胞类型。
  2. 研究人员采用了CIBERSORT方法,开发了甲基化CIBERSORT184,它使用纤维母细胞和七种不同免疫细胞类型的参考来估计免疫细胞和肿瘤纯度的绝对比例。
  3. 在对HNSCC的分析中,甲基化CIBERSORT能够识别出‘免疫热’和‘免疫冷’聚类,其中免疫热样本显示出CTL与Treg细胞比例的增加(P < 1016)184。
para
  1. 早期的方法利用细胞类型间差异甲基化的DNA区域,被开发用于分析甲基化阵列数据,以评估免疫细胞的丰度,并已被研究人员用于进行全基因组关联研究。
  2. IDOL是一种去卷积方法,最初通过比较300个CpG位点的甲基化状态来预测全血样本中的六种细胞类型。
  3. 随后,IDOL的参考签名被扩展以包含12种免疫细胞类型。
  4. EpiDISH使用ENCODE的DNase超敏感位点图谱构建参考DNA甲基化数据库,以量化全血样本中的细胞类型。
  5. 基于甲基化的去卷积方法的研究人员应该注意,癌细胞中DNA甲基化的估计会受到体细胞拷贝数变化的影响。
  6. CAMDAC是一种考虑拷贝数的去卷积方法,它从批量肿瘤组织和匹配的非恶性组织中提取的亚硫酸氢盐测序数据中提取甲基化谱,以估计非恶性细胞、癌细胞以及肿瘤内亚克隆关系。
  7. CAMDAC被用于揭示与表观基因组功能障碍相关的拷贝数独立等位基因特异性表达。
para
  1. 基于DNA甲基化的去卷积方法,主要关注基于阵列的甲基化分析,与RNA-seq去卷积方法相比具有优势,因为它们可以从FFPE样本中开展工作。
  2. 直接DNA-seq方法的出现将能够同时评估DNA突变和甲基化去卷积,因此,我们预计,它将成为基于甲基化的TME去卷积的首选方法。

Incorporation of single-cell information

单细胞信息的整合

para
  1. 已经开发出各种去卷积工具来估计TME中免疫细胞的比例;然而,它们的使用带来了一些挑战。
  2. 总体而言,去卷积工具能够为最丰富的免疫细胞类型(如T细胞和B细胞)提供稳健的估计,但在估计含量较低的免疫细胞类型或T细胞亚群以及与肿瘤和间质细胞相关的其他细胞类型的混合物方面存在局限性。
  3. 单细胞RNA测序数据集的出现,导致了癌症特异性基因签名的识别,以及深度学习模型的运用,这有助于改善去卷积方法。
para
  1. CIBERSORTx196是CIBERSORT的扩展框架,它需要一个来自scRNA-seq数据的签名矩阵作为参考数据集,以便从批量RNA-seq数据中推断出特定细胞类型的基因表达,而无需进行物理细胞分离。
  2. MuSiC197和Bisque198可以使用从多个scRNA-seq数据集中获得的细胞类型特定信息,从批量RNA-seq数据中估计免疫细胞类型的比例。
  3. BayesPrism199应用贝叶斯统计方法估计细胞类型比例和细胞特定基因表达,该方法使用一个scRNA参考数据集。
  4. 使用BayesPrism对接受ICI和化疗联合治疗的食管腺癌患者的预处理样本进行分析发现,治疗后TME中单核细胞的高含量与良好的OS显著相关(HR 0.38,95% CI 0.22-0.67;P = 0.0008;假发现率0.037)。
  5. Scaden201是一个基于深度神经网络的去卷积工具,它在scRNA-seq数据上进行训练,不依赖于GEP签名,而是从它从未训练过的细胞类型中推断出信息特征,因此它可以对那些细胞类型进行去卷积。

Method selection

方法选择

para
  1. 在进行TME去卷积分析之前,研究者应仔细考虑哪种方法更适合他们的需求。
  2. 在选择最佳方法时,研究者应谨慎考虑可能会影响估计准确性的样本和技术因素,这些因素包括肿瘤纯度、罕见细胞类型的存在、参考矩阵和数据转换。
  3. 开发者使用来自胶质母细胞瘤、头颈鳞状细胞癌或皮肤黑色素瘤患者的1,412个批量RNA测序样本和85个单细胞RNA测序样本,发现BayesPrism方法优于CIBERSORTx和MuSiC199。
  4. 对20种去卷积方法的独立比较显示,数据转换会影响其中三种方法,并建议在进行去卷积时保持数据在线性尺度上。
  5. 随后,对九种去卷积乳腺癌TME的方法进行比较,发现在不同肿瘤纯度的模拟样本中,BayesPrism、Scaden和MuSiC的表现优于其他方法,并且在去卷积细粒度免疫谱系时,BayesPrism和DWLS的表现最佳。
para
  1. 在将这些去卷积工具作为临床环境中预后或治疗选择的决策支持工具实施之前,还需要进一步对去卷积工具的性能进行基准测试和验证。
  2. 这样的基准测试将提供某些去卷积工具是否更适合特定类型的癌症并且在某些类型的细胞上表现更好的信息。
  3. 总之,这些方法中没有一种普遍优于其他方法,选择特定的工具应取决于研究问题和实验设计。

Single-cell analysis

  1. 在过去的几年里,单细胞测序(scseq)技术经历了一场变革,使得数据集的创建和解析方法的开发成为可能。
  2. 在撰写本评论时,共有1,518个工具被归类在30个类别中(包括突变、CNA、克隆性、聚类、可视化、降维和细胞间通讯等),这些工具都可以在scRNA-tools上找到。
  3. 其中一些工具已经开发了教程或最佳实践资源。
  4. 并且有几项研究已经对其中的一些进行了基准测试。
  5. 然而,由于新数据集和新工具的持续开发,这些努力仍在进行中。
  6. 随着前瞻性收集样本,来自ICI治疗患者的单细胞分析将会越来越多地进行。
  7. 在这里,我们简要概述了可以使用测序技术评估单细胞水平上的癌症内在和外在特征的计算工具(图3)。

Cancer-intrinsic features

癌症固有特征

para
  1. 单细胞DNA测序(scDNA-seq)和单细胞RNA测序(scRNA-seq)能够识别出每个细胞中存在的遗传变异,为进化动力学和肿瘤异质性(ITH)提供洞见。
  2. 然而,由于扩增偏差、测序错误和样本污染,通过单细胞测序(scseq)识别体细胞突变带来了关键挑战,这可能会引入假阳性和假阴性发现,使得区分真正的突变和技术性假象变得困难。
para
  1. 已经开发出几种计算工具来克服在识别体细胞单核苷酸变异(SNVs)时遇到的一些技术挑战(图3)。
  2. Monovar208 使用概率方法通过将单个细胞的等位基因频率与批量参考基因组的等位基因频率进行比较来检测单个细胞中的突变。
  3. 研究人员利用这个工具揭示了急性髓系白血病中驱动突变的细胞水平共现和互斥性。
  4. LiRA210 使用生殖系变异作为参考来对序列读段进行分相,以区分体细胞变异和全基因组扩增产生的假象。
  5. SCcaller211 使用似然比检验来识别SNVs,以区分真实SNVs和假象。
  6. 这个工具被用来区分人肺上皮细胞中的体细胞突变,作为衰老和吸烟状态的函数。
para
  1. 研究者们还开发了多种方法来识别单个细胞内的拷贝数变异(图3)。
  2. Alleloscope 是一种方法,用于在利用scDNA-seq或所谓的用于转座酶可接近染色质的scseq检测获得的数据中,识别等位基因特异性的拷贝数变异。
  3. 由于基因表达与拷贝数变异状态相关,且相比于scDNA-seq,scRNA-seq具有更高的动态范围,因此研究者们已经开发出使用scRNA-seq数据来识别体细胞拷贝数变异的方法。
  4. InferCNV和CONICS被广泛用于估计基因区域拷贝数状态,为胰腺、结直肠、卵巢和胃癌、非小细胞肺癌、鼻咽癌和黑色素瘤的肿瘤异质性提供了见解。
para
  1. 对单细胞中的体细胞突变进行特征分析有助于重构克隆系谱,并且可以帮助推断基因组事件的顺序和时间。
  2. 研究人员已经开发出复杂的方法,整合了多种特征来追踪细胞群体的演变和推断肿瘤系统发育树。
  3. 这样的两个工具是B-SCITE,它是一种概率方法,整合了批量DNA测序和单细胞DNA测序数据,以及SCARLET,它识别并使用来自单细胞DNA测序的体细胞单核苷酸变异和拷贝数变异(图3)。
  4. 值得注意的是,在单细胞数据中检测突变仍然具有挑战性,分析工具的选择将取决于数据的特定特征和研究目标。
  5. 在未来,通过整合长读测序技术,单细胞方法表征癌症固有特征的能力可能会得到增强。

Cancer-extrinsic features

癌症外在特征

para
  1. 单细胞RNA测序(scRNA-seq)的引入改变了免疫肿瘤学的研究,过去十年的研究深入了解了肿瘤微环境(TME)的复杂细胞和分子特性。
  2. 利用scRNA-seq研究癌症非内在特征的应用正在迅速发展,新的工具和方法不断被开发出来(见图3)。
  3. scRNA-seq分析广泛使用并推荐的方法是Seurat,它在其最新套件中为质量控制、数据标准化、降维、细胞聚类、差异表达分析、可视化和多组学整合提供了一套全面的工具。
  4. Harmony旨在克服多个实验和生物学因素,通过执行‘批次效应’校正,实现大规模scRNA-seq数据的整合,这已经用于泛癌症数据的分析。
para
  1. 肿瘤微环境(TME)中单细胞分析的一个关键组成部分是细胞注释。
  2. 为细胞注释开发的工具包括scPred241、CellAssign242和SCCAF243,它们使用的是基于与免疫细胞类型相关的预定义基因集训练的机器学习模型。
  3. 同样,MARS244是一种深度学习方法,能够注释已知和未知的细胞类型。
  4. SCENIC245是一个用于识别基因调控网络和功能细胞状态的的计算框架。
  5. Monocle246,247是专门用于重建发育轨迹、识别推动细胞命运决策的基因和表征转录动力学的设计。
  6. 一项对45种单细胞轨迹推断方法进行了基准测试的研究发现,这些方法的性能存在很大差异;作者们制定了指导方针以方便选择方法248。
  7. 总的来说,基于图的方法PAGA249、基于树的方法Slingshot250和线性方法SCORPIUS251在所有比较中通常表现良好。
para
  1. 单细胞RNA测序的一个优势是它可以用来研究TME内的细胞-细胞通讯网络。
  2. CellChat252和CellPhoneDB253能够识别任何细胞亚型之间的配体-受体相互作用。
  3. PIC-seq254在原位对细胞进行染色,然后利用荧光激活细胞分选技术对细胞进行单细胞RNA测序,以识别相互作用的细胞,并使用计算模型来研究这些相互作用及其对基因表达的影响。
para
  1. 单细胞RNA测序方法是有价值的工具,用于剖析肿瘤微环境中的免疫细胞的异质性和功能状态。
  2. 目前,将这些方法应用于分析临床数据集,例如那些来自接受免疫检查点抑制剂治疗的患者,仍然是有限的,但我们预计这些研究最终会进行,并为免疫检查点抑制剂的治疗反应提供见解。

T and B cell repertoire diversity

T和B细胞受体库多样性

para
  1. 了解T细胞和B细胞在肿瘤微环境(TME)中的比例是很重要的;然而,测量特定T细胞和B细胞异质性也是至关重要的。
  2. T细胞能够识别新抗原并通过其高度多态性的T细胞受体(TCR)诱导抗肿瘤反应。
  3. 通过分析包括肿瘤浸润淋巴细胞(TILs)在内的淋巴细胞群体的TCR和B细胞受体(BCR)序列,研究者可以描述这些细胞的克隆组成、扩展和异质性。
  4. 已经开发出各种实验和计算方法来直接测序或从基因组或大量RNA-seq数据推断TCR结构(其他地方有详细评论)。
  5. 单细胞TCR测序(scTCR-seq)与单细胞RNA测序(scRNA-seq)结合是一种有前景的方法,能够快速精确地识别来自外周血和TILs中的淋巴细胞中多种新抗原特异性TCR,具有预后意义。
  6. 这种方法有能力识别癌细胞之间的非遗传异质性,包括与T细胞状态转换和扩展相关的,在免疫检查点抑制剂(ICIs)治疗期间的变化。
para
  1. 用于分析T细胞和B细胞受体库多样性的计算工具从原始数据中恢复TCR和BFR序列开始,然后进行聚类和注释。
  2. 后续步骤包括可视化免疫受体库,包括克隆型的丰度、多样性和V(D)J使用情况,以及对个体克隆型的分析。
  3. 已经开发出多种计算工具,用于分析使用批量RNA测序和单细胞TCR测序、单细胞BCR测序数据(框1和图3)的TCR和BCR受体库。
  4. 尽管尚未建立TCR序列重建的标准,但MiXCR和TRUST4(参考文献263)通常用于此目的。
  5. 单细胞技术的持续进步为发现和创新提供了巨大的可能性;毫无疑问,未来几年这里讨论的方法和工具将进一步发展,以实现更深入的分析。

box1 估算T细胞和B细胞库多样性的计算方法

  1. MiXCR261 通过人类和小鼠源自GenBank数据库的种系免疫球蛋白V、D、J和C位点序列参考库中的成对或单端DNA或RNA序列读取来估计克隆型的库。成对序列数据在应用于V和J比对时更可靠并提供高水平的准确性。
  2. IGoR262 是一个综合框架,用于从大规模RNA测序(RNA-seq)或DNA测序(DNA-seq)数据中估计B细胞受体(BCR)和T细胞受体(TCR)库。
  3. TRUST4(参考文献263)使用大规模RNA-seq或单细胞RNA-seq(scRNA-seq)。TRUST4 将RNA序列的单端或成对端读取比对到人类基因组参考,接着进行读取提取、去新组装和注释。
  4. ImmunoMap292 使用系统发育方法从TCR测序(TCR-seq)数据中估计TCR库的多样性和克隆性。
  5. VDJTools293 提供一个全面的平台用于TCR和BCR库测序分析。VDJTools 执行基本的质量控制统计计算、库的聚类、唯一克隆型的过滤和用户定义的注释以估计多样性指数。
  6. Immunarch 兼容Seurat235,236,237,238,并提供对广泛使用的TCR和BCR计算分析格式的数据加载、分析和可视化支持,包括单细胞测序数据。
  7. Enclone 是10x genomics开发的,用于分析TCR-seq和BCR-seq数据。Enclone 识别和分组选自共同祖先的细胞,称为克隆型,并显示它们及其显著特征,如突变氨基酸。
  8. 单细胞BCR组装(BASIC)294 在scRNA-seq数据中检测锚序列,并使用这些锚组装BCR序列。
  9. BraCeR295 使用scRNA-seq数据来估计克隆性并重建完整的BCR序列。
  10. ImReP296 是一种计算方法,使用来自大规模组织的RNA-seq数据来分析免疫球蛋白库。

Prediction of response to ICIs

para
  1. 能够持续识别出可能对免疫检查点抑制剂有反应的患者将为患者和医疗系统带来巨大好处。尽管单个临床特征(如年龄、性别和种族)对接受免疫检查点抑制剂治疗的患者结果的影响已经有所研究,但对肿瘤内在特征和肿瘤外在特征的分析已经确定了一些与反应相关的特征。
  2. 尽管单个临床特征,如年龄、性别和种族,对接受免疫检查点抑制剂治疗的患者结果的影响已经有所研究,但对肿瘤内在特征和肿瘤外在特征的分析已经确定了一些与反应相关的特征。
para
  1. 除了PD-L1表达外,还有几个基因组特征与对ICIs的反应有关,这突显了全面识别肿瘤特异性基因组特征的重要性。
  2. DNA错配修复缺陷的存在、高TMB或新抗原负荷都与良好的反应独立相关,而其他基因组特征,如肿瘤非整倍体的存在和高结构变异突变负荷,则与较差的反应独立相关。
para
  1. 癌组织内部或外周血液中的非肿瘤特征,包括TILs的存在,已显示出对预测ICIs的反应有价值。免疫细胞群参与肿瘤免疫逃逸,因此与许多癌症类型的较差预后相关,例如,肝细胞癌和膀胱癌中的髓系来源的抑制细胞(MDSCs),结直肠癌和肺癌中的Treg细胞以及乳腺癌和胃癌中的肿瘤相关巨噬细胞(TAMs)。
  2. TCRs和BRCs被认为是预测ICIs反应的生物标志物。例如,在接受ICIs的转移性黑色素瘤患者中,外周血样本中T细胞库的高多样性(使用MiXCR组合和量化)与发生严重免疫相关不良事件的可能性相关。
  3. 在另一项涉及转移性黑色素瘤患者的研究中,那些在治疗前TILs中TCR克隆性高的患者(使用ImRep评估)对抗PD-1抗体的反应有所改善。
para
  1. 研究者们已经识别出大量的基因标志物,其中许多与TILs相关,据报道可以预测对ICIs的反应(详见盒2和补充表5)。
  2. 这些标志物和方法正在被持续的的临床试验所采用;然而,它们需要在比较接受ICIs治疗前后获取的样本的实验中得到验证。
para
  1. 预测患者是否会对免疫检查点抑制剂(ICIs)产生反应需要一种方法,该方法将临床信息与癌症内在和外在特征相结合(图4)。
  2. 研究人员已经开发出多种方法来预测对ICIs的反应,这些方法结合了多个特征。
  3. 例如,使用全外显子测序(WES)数据的一个模型,结合了多个DNA特征(非整倍性、拷贝数改变(CNA)克隆性、突变特征、肿瘤突变负荷(TMB)、选定驱动基因中的突变存在、肿瘤内T细胞受体(TCR)克隆、人类白细胞抗原(HLA)等位基因和新生抗原负荷),能够区分接受ICIs的非小细胞肺癌(NSCLC)患者是否有有利或不利总生存期(OS)281。
  4. 研究人员对超过3600名跨越12种肿瘤类型的患者的基因组学和转录组学生物标志物与ICIs反应进行了荟萃分析,并提出了一个名为PredictIO的模型,以确定可能的目标,包括F2RL1和RBFOX2,以克服对ICIs的耐药性282。
  5. Litchfield等166研究人员汇编了超过1000名接受ICIs治疗的患者匹配的基因组和转录组概况,跨越七种肿瘤类型,并构建了一个多变量模型,利用此数据集的11个特征来训练和测试一个机器学习癌症特定分类器XGBoost,以预测每种癌症类型对ICIs的反应。
  6. 在这个模型中,克隆性TMB是对ICIs反应的最强预测因子,其次是总TMB和CXCL9表达。
  7. 此外,其他因素,如患者的病毒组和肠道微生物组,也可能影响对ICIs的反应283,284。

Fig. 4: Multi-omic machine learning to predict responses to immune-checkpoint inhibitors.

  • 来自不同来源的多个特征,如临床特征、肿瘤体细胞突变、基因表达谱(GEP)或分解免疫细胞和基质细胞的比例等,可用于开发和训练机器学习模型,以预测对免疫检查点抑制剂的反应。
  • 与结果相关的关键区分特征可以被确定。
  • CAF,癌症相关成纤维细胞;DC,树突状细胞;MDSC,髓系来源的抑制细胞;NK,自然杀伤细胞;OS,总生存期;RNA-seq,RNA测序;TAM,肿瘤相关巨噬细胞;TMB,肿瘤突变负荷。
  1. 整合多组学方法,包含所有相关的临床和分子特征来预测对ICIs的反应,需要复杂的机器学习手段。
  2. 迄今为止,由于数据集的不足,机器学习在分析对ICIs反应的应用受到了限制;大多数方法都集中在黑色素瘤或非小细胞肺癌患者的数据上。
  3. Liu等人应用了一种基于临床特征加上未经治疗的基因组学和转录组学特征的逻辑回归分类器来预测对anti-PD-1抗体的抵抗性(曲线下面积AUC 0.73–0.83)。
  4. Johannet等人采用了一种先进的方法,使用卷积神经网络,在晚期黑色素瘤患者的临床特征和组织病理学幻灯片上进行训练和测试,预测对ICIs的反应(AUC 0.80)。
  5. 随着更大、多模式数据集的可用,采用神经网络方法的更先进的机器学习模型的发展,可能提供对癌症–免疫细胞相互作用的更完整的概述。

box2 用于预测癌症免疫疗法反应的基因特征和计算工具

  1. IPRES24 是一个与黑色素瘤患者对抗PD-1抗体的耐药性相关的26基因表达特征。然而,这种方法在其他接受免疫检查点抑制剂(ICIs)治疗的独立黑色素瘤患者队列中未得到验证56,表明初始队列中的RNA-seq分析具有独特性。
  2. IMPRES24 是一个预测黑色素瘤患者对ICIs反应的特征,涵盖15个编码免疫检查点的基因之间的成对转录组关系。然而,其他研究人员提出了对IMPRES在转移性黑色素瘤患者中无法重复预测ICIs反应的担忧297。随后,IMPRES的创作者使用独立的黑色素瘤数据集验证了该评分56,并建议差异是由RNA-seq数据的处理导致的298
  3. **炎性和上皮-间质转化(EMT)特征299**:在接受ICI治疗的肺癌临床反应患者中,27炎性基因特征显著高于无反应者(P=0.014)。在同一队列中,12基因EMT特征评分在反应者中显著较低(表明上皮基因占主导地位),而在无反应者中则较高(P=0.016)。在接受阿特珠单抗加贝伐单抗治疗的恶性腹膜间皮瘤患者中也观察到了EMT特征的相似趋势300
  4. **T细胞基因表达特征评分301**:一个从ICI治疗的黑色素瘤小鼠模型中提取的13基因表达特征,被提出激活癌症固有的β-连环蛋白信号通路导致T细胞排斥,从而导致ICI耐药性。这一特征在II期前列腺癌试验中应用302;然而,该研究中未报告β-连环蛋白信号的状态,也未观察到T细胞基因表达特征评分与反应率之间的关联。
  5. IFNγ25 T细胞炎症基因表达特征,一种包含六个与IFNγ相关并扩展到18个基因的特征,用于预测黑色素瘤对ICI的临床反应。这种方法在20种癌症类型中得到了验证,高分数具有预测ICI反应的价值303
  6. TGFβ反应特征304 是一个19基因表达特征,用于识别免疫逃逸状态并预测转移性尿路上皮癌对ICIs的反应。该特征通过活跃的T细胞排斥与ICIs耐药性相关。这一特征在II期试验中得到验证,患者接受阿特珠单抗和新辅助阿特珠单抗治疗305
  7. 免疫表型评分306 包括20个单因素和六种免疫细胞类型,使用随机森林方法预测20种肿瘤类型对ICIs的反应。这种方法不可靠,未能在临床数据集中预测反应307,308
  8. TIDE308 是一种计算方法,用于预测黑色素瘤或非小细胞肺癌患者对ICIs的反应和肿瘤免疫逃逸。此方法在接受ICIs治疗的黑色素瘤24,27,56,309和非小细胞肺癌患者的数据集中得到验证307,310
  9. TREC311 是一种计算工具,通过估计T细胞扩展来预测对ICIs的反应。这一方法在TRACERx研究中得到了验证41
  10. Netie312 是一个分层贝叶斯模型,通过推断每个单核苷酸变异产生的新抗原的进化,来调查抗肿瘤T细胞相互作用,并估计肿瘤进展过程中免疫选择压力。

Conclusions

para
  1. 肿瘤和免疫系统之间始终存在着微妙的平衡,这影响着宿主对免疫检查点抑制剂的反应。
  2. 在过去的几年里,计算免疫基因组学的发展为研究这种复杂性提供了前所未有的机会,其最终目标是改善患者的预后。
  3. 这些改进包括但不限于,能够筛选出更有可能从免疫检查点抑制剂中受益的患者,开发高度有效的neoantigen疫苗以及通过追踪患者体内的免疫反应来改善疾病监测。
  4. 研究人员现在可以利用多种测序技术来分析基因组、转录组和表观基因组,最终剖析宿主肿瘤免疫景观。
  5. 高肿瘤突变负荷(TMB)和免疫细胞(如细胞毒性T淋巴细胞)的丰富程度与免疫检查点抑制剂的反应独立相关;然而,与PD-L1表达的评估相似,单独使用每个标记都不完美。
  6. 研究人员正在开发各种新的计算方法来研究不同的癌症内在和外在方面。
  7. 尽管这些方法很有前景,但许多方法将受益于更多患者数据的可用性,以训练模型和/或验证其预测性能。
para
  1. 分子生物学、纳米技术、微流控和机器学习的进步使得对肿瘤微环境(TME)进行更深入的分析成为可能。
  2. 研究人员正在使用单细胞技术来研究TME和免疫系统的异质性,以了解对免疫疗法反应或抵抗的原因。
  3. 单细胞分析技术的持续进步,有望实现基因组测序或全长转录组测序,从而为进一步深入了解基因组异质性、新抗原的形成和单细胞水平上的呈递提供更多洞见。
  4. 这种方法已经成功生成来自T细胞和B细胞的准确全长抗原受体序列。
para
  1. 免疫活动的程度可以在同一患者的肿瘤部位或多个病变之间有所不同。
  2. 现有的计算工具或方法没有将活检或切除的部位视为解析肿瘤微环境(TME)或理解免疫编辑机制的主要因素。
  3. 此外,鉴于新辅助免疫检查点抑制剂(ICIs290)的疗效充满希望,使用预处理患者的活检样本来预测对ICIs的反应是至关重要的。
  4. 需要一个更复杂的模型来整合各种因素,包括肿瘤纯度、TME组成、基因组异质性、肿瘤演变、遗传构成和免疫原性新抗原负荷。
  5. 开发能够捕捉整个肿瘤并整合分子和临床数据更加全面的方法可能会揭示癌细胞与免疫细胞之间的完整交互。
  6. 这种综合方法可能有助于解决预测对ICIs反应的挑战;然而,模型将需要在特定于大型肿瘤的数据集上进行训练,并且鉴于这些疗法通常与其他药物结合使用,预测模型可能需要更个性化的方法。