Closed ixxmu closed 1 year ago
分子分型是准确认识复杂疾病进而构建精准医学体系的重要基石。然而,构建具有精确性、鲁棒性及进一步可推广性的分子分型体系是众多复杂疾病面临的极大挑战。同时,分子分型的临床价值不仅在于提示具有差异疾病表型、分子基础的患者群体,针对不同特征群体筛选有效的临床干预策略也是分子分型体系构建的重要目标。
癌症分型高分定制化思路
扫码占座
去年的发表在Briefings in Bioinformatics(IF:13.994)的研究Machine learning revealed stemness features and a novel stemness-based classification with appealing implications in discriminating the prognosis, immunotherapy and temozolomide responses of 906 glioblastoma patients. 在基于机器学习方法构建亚型预测子及潜在用药策略的相关研究提供了很好的参考思路。
该研究围绕癌细胞的干性指数(细胞的自我更新和分化潜能),探究了基于癌症干性的分子分型和应用。一开始确认了干性指数与基本临床特征和分子特征、肿瘤免疫微环境改变模式存在显著关联;进一步,发现干性指数升高预示患者更长的OS和更差的PFS;接着仍然是常规做法,将130个干性指数相关的差异表达基因作为特征,基于无监督的一致性聚类识别干性相关的分子分型。分型在拷贝数变异负荷、TMB上存在显著差异;干性亚型具有不同的TIME和免疫基因组模式,对免疫疗法的敏感性以及对TMZ化疗的耐药性也存在不同。
但随后,该分型分析相比于一般的分型识别和刻画分析有一些与众不同之处:基于CMap分析,探索针对各干性亚型的潜在治疗药物。最后,基于机器学习算法构建了亚型预测子并基于独立验证集进行了验证。这两点分析相比于一般的分型识别和特征刻画做得更深入,也挖掘出分型分析的潜在应用价值。
1、首先展示该集合在训练集中的表达热图,这里注意过滤掉在样本中表达普遍较低的基因。然后基于ssGSEA或GSVA计算样本的基因集合富集得分(与基因表达一起展示,列按照富集得分排秩)。
3、计算富集得分与cancer hallmarks的关联,基于同样的富集得分计算方法,获得每个cancer hallmarks相关通路的活性得分,计算spearman秩相关。
(1)以热图形式展示每个特征节点与每个hallmark的spearman相关
(2)对于重点例子补充展示散点图
5、直接基于富集得分中值分类样本,进行log-rank检验及单因素Cox,评估该通路与患者预后的关联。若预后存在显著差异,计算富集得分高低两组的差异表达基因,并进行功能富集。
2、验证分型的预后效能(log-rank检验,单因素和多因素Cox)。
3、分型的差异通路富集
基于wilcox秩和检验或Fisher精确检验计算分子分型的临床特征差异。
2、基于药物基因组数据库(GDSC、CellMiner和CCLE)收集预测药物的对应的细胞系表达数据,验证构建分型时的特征基因与药物敏感性IC50值的关联。
1、基于least absolute shrinkage and selection operator (LASSO) regression,support vector machine (SVM), Random Forest and Boruta (RFB)以及extreme gradient boosting (XGBoost) analyses 筛选对于分型构建贡献最大的特征(这里也可以根据数据的实际情况选择两种机器学习特征筛选方法)。
2、对于不同机器学习方法筛选的特征取交集,作为最终的特征集合。构建多因素Cox回归模型,作为分型的预测模型。评估在训练集中该预测模型的预后效能。
获得独立验证集的表达谱,独立验证集也可选用免疫治疗队列,进一步阐明分型的临床应用潜能。基于打分模型预测独立验证集中每个样本所属的分子分型,基于单因素、多因素Çox 和 log-rank检验验证分型的预后效能。
END
最新思路推荐
细胞死亡 |
液体活检 |
单细胞 |
m6A专题 |
临床专题 |
https://mp.weixin.qq.com/s/g6s-ID7FaLRx3I_M2OJyLg