ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

组会论文分享 | 顺铂耐药的多组学差异以及机器学习模型的建立 #4000

Closed ixxmu closed 1 year ago

ixxmu commented 1 year ago

https://mp.weixin.qq.com/s/xE6LzGLwIFTA746niC6czw

ixxmu commented 1 year ago

组会论文分享 | 顺铂耐药的多组学差异以及机器学习模型的建立 by 医信融合创新沙龙

医信融合创新沙龙(融创沙龙)是山西医科大学“医信融合团队”运营的公众号。本团队的研究包含头颈癌、乳腺、胃癌、类风湿性关节炎等多种疾病类型,从数据下载到数据处理,从文献阅读到综述撰写,小组成员横跨博士研究生到刚入学的本科生。团队官方网站为:生信沙龙-临床决策研究大数据山西省重点实验室(http://www.sxmu.edu.cn/bdcd/rcpy/sxsl.htm)。您可以订阅”医信融合创新沙龙“公众号,来获取团队最新研究成果和学习情况,我们每天都会在本公众号分享生信知识、技术经验、论文复现、医学知识科普以及学习心得等各种干货,欢迎您的关注!本团队长期招收有想法有能力的同学和各类创新创业团队,欢迎您的加入!


题目:Cisplatin resistance-related multi-omics differences and the establishment of machine learning models1

杂志:Journal of translational medicine

IF:8.44

发表时间:2022年4月


01

研究背景


顺铂由M.Peyrone于1844年首次合成,其化学结构由Alfred Werner于1893年首次阐明。然而,这种化合物直到20世纪60年代才得到足够的科学研究,当时罗森博格发现它能够抑制大肠杆菌中的细胞分裂,这增加了它用于癌症化疗的可能性。


1978年,顺铂成为FDA批准的第一个用于癌症治疗的铂化合物,后来它成为最重要的抗癌药物之一。如今,由于对EGFR、ALK或ROS突变肿瘤的靶向治疗出现耐药性,铂类化疗仍然是这些晚期非小细胞肺癌(NSCLC)患者的重要治疗方式。


本研究将加深我们对顺铂耐药原因的认识,尤其是肺腺癌(LUAD)耐药的原因,为临床治疗决策提供参考。


02

数据来源


从癌症依赖性地图(Depmap)和癌症细胞系百科全书(CCLE)数据库中下载细胞系信息的详细信息,包括IC50值、细胞系来源、体细胞突变、mRNA表达、miRNA表达和代谢物。


从肿瘤基因组图谱(TCGA-LUAD)下载肺腺癌患者顺铂治疗的信息及其基因表达数据。


661个细胞株最终入选,获得了完整的mRNA、microRNA表达和代谢产物数据。


CCLE数据库给出的反映化疗药物敏感性的半数抑制浓度IC50值,将其分为3组。该值越低,灵敏度越高。在本研究中,IC50值低(IC50≤10.4)的前1/3(220)被定义为敏感组,而IC50值低(IC50≥26.2)的后1/3(220)被登记为不敏感组。


03

研究流程



04

主要结果


一、相关癌症顺铂的平均IC50值


不同癌症对顺铂的耐药性不同。在Depmap数据库中,我们成功地根据肿瘤来源对不同的肿瘤细胞系进行了分类,从而获得了相关癌症顺铂的平均IC50值。如图所示。其中肺腺癌(LUAD)、间皮瘤(Meso)、甲状腺癌(THCA)、等等,这意味着这些类型的癌症患者可能对最常见的化疗药物之一顺铂产生更高的耐药性。



二、体细胞突变差异



如图所示。A和B,虽然两个体细胞突变癌图块和这些基因的共生集合有一定的相似性,但不难发现,在顺铂耐药组(高IC50)中,TP53的突变位居首位,高于顺铂敏感组(低IC50组)的突变率。


横坐标表示每个细胞系样本(220),纵坐标表示肿瘤突变负荷 及基因名。不同颜色代表不同突变类型。


TP53突变与顺铂耐药密切相关。相反,TTN在低IC50组有较高的突变率。


三、不同层次的基因功能分析的差异分析


为了进一步发现两组之间的差异,从不同的水平对两种细胞系进行了差异分析。



在mRNA水平,通过edgfR分析,发现1348个有统计学意义(P<0.01)差异mRNA。其中具有明显折叠变化(|logFC|>1)的包括:TMEM4SB、CLDN3、KLK6、IRF5、ZBTB38等35个基因表达上调;SLFN1 一个基因表达下调。



在miRNA水平上,发现80个差异表达的miRNA(P<0.01)。有明显的倍增变化(|logFC|>1)的包括:11个下调(miR194、miR-206、miR-215等),12个上调(miR-144、miR-16、miR-129-3p等)



但在代谢产物中,只有尿苷、丝氨酸、肌肽、N-氨基甲酰-β-丙氨酸、胱硫氨酸等15种代谢物的表达在两组间有显著差异,但没有明显的折叠变化。



对于甲基化,没有一个明显折叠变化(|logFC|>1)的差异甲基化位点与差异表达基因密切相关。



基于之前发现的1348个差异表达的mRNAs进行了基因本体论(GO)分析。基因功能F富集分析显示,低IC50组和高IC50组的20个GO功能基团在  肌动蛋白结合、细胞外基质结构成分、GTP酶结合、鸟苷-核苷酸交换因子活性等方面存在显著差异。


基于这些mRNA的KEGG通路富集,两组间有10条不同的信号通路:PI3K-Akt信号通路差异最显著,基因比例最高,其次是肿瘤中的蛋白多糖、灶性粘连等。



进一步总结途径和功能的差异,我们应用了基因集变异分析(GSVA),它以特定的基因集作为特征表达矩阵,并对基因浓缩的结果进行量化。共获得643条基因通路,其中大部分与耐药相关,包括三苯氧胺耐药、EGFR信号通路24HR、吉非替尼耐药、KIM-MIC扩增靶点等。


四、模型的构建与评价


先用GLMnet R包采用适合于二元离散因变量的“Family=binomial”来确定 DEGS是否与高IC50或低IC50相关。在1348个mRNAs中,有6个是与顺铂耐药相关的特征,分别是FOXA2、BATF3、SIX1、HOXA1、ZBTB38、IRF5。



然后通过GLM函数建立相关的Logistic模型。


接下来,我们应用J48和RPart R程序包,其中formula=ic50~FOXA2+BATF3+SiX1+HOXA1+ZBT38+IRF5。Family=Gaussius是以连续单变量为基础的,通过该模型得到IC50值的预测值。利用阶跃函数实现逐步回归。结果发现,6个变量中有3个变量通过了显著性检验(p<0.05),成为构建模型的相对重要变量。虽然模型中的每个变量都通过了显著性检验,但要确保整个模型是显著的。因此,对模型进行了卡方检验。由于从第一个变量到最后一个变量逐一添加到模型中,模型最终通过了显著性检验,表明由这些变量组成的模型是有意义的和正确的。


最后,我们验证了这些基因是否不仅与顺铂耐药有关,而且与患者的生存有关。


FOXA2、BATF3、SIX1、HOXA1、ZBTB38、IRF5高表达与低表达生存时间差异的K-M图。根据TCGA数据库中的数据,它们的表达水平在一定程度上与不同肿瘤患者的预后有关,包括卵巢癌、乳腺癌、肺癌和胃癌。




事实上,BATF3、IRF5和ZBTB38也有助于评估乳腺癌和卵巢癌患者对化疗的反应。


同样,我们构建了miRNA预测模型。套索回归分析得到4个显著的miRNAs,即miR-203、miR-200C、miR-148A、miR-142-5P。



在阶跃函数之后,miR-203和miR-200C剩余,两个变量都通过了卡方检验,表明这些变量组成的模型是有意义的和正确的。



五、BATF3、IRF5、ZBTB38在A549、H358细胞和肿瘤组织中的表达与顺铂敏感性的关系



为了在细胞水平上验证BATF3、IRF5、ZBTB38的表达与顺铂敏感性之间的因果关系,我们分别将BATF3靶向、IRF5靶向和ZBTB38靶向的siRNA分别导入高表达BATF3、IRF5、ZBTB38的人肺癌细胞株A549和H358中。


沉默BATF3显著增加顺铂的敏感性,而沉默IRF5、ZBTB38则降低了对顺铂的敏感性。



使用t-SNE对单细胞测序结果进行分析。



在LUAD中,NACT-SEN组BATF3表达显著下调,而恶性上皮细胞簇中IRF5、ZBTB38的表达显著高于NACT-Non-SEN组(EpCAM和Sox4标记,图3)。d)。在食管癌中,BATF3、IRF5、ZBTB38在LYZ和C1QB标记的9801肿瘤细胞中表现出相同的趋势。



05

总结


1348个mRNA、80个miRNA和15个代谢产物在两组间的表达差异有统计学意义(P<0.05)。根据LASSO惩罚Logistic模型,FoxA2、BATF3、SIX1、HOXA1、ZBT38、IRF5 6个mRNAs被选为顺铂耐药的关联特征和预测模型的贡献者(调整后P值均<0.001)。也构建了miRNA的预测模型,4个显著的miRNAs,miR-203、miR-200C、miR-148A、miR-142-5P入选。6个基因中的3个(BATF3、IRF5、ZBTB38)最终在细胞水平和zs队列中的患者中得到验证。


建立的基于BATF3、IRF5、ZBTB38三个基因表达的模型可以帮助预测接受铂为主的癌症患者的反应和预后,特别是包括顺铂在内的化疗。



参考文献:

1.  Sui Q, Chen Z, Hu Z, Huang Y, Liang J, Bi G, Bian Y, Zhao M, Zhan C, Lin Z, Wang Q, Tan L. Cisplatin resistance-related multi-omics differences and the establishment of machine learning models. J Transl Med. 2022 Apr 11;20(1):171. doi: 10.1186/s12967-022-03372-0. PMID: 35410350; PMCID: PMC9004122.



图文 | 焦新龙

编辑 | 张书贤