2021年1月份,尼古拉斯团队在Nature Biotechnology(IF:36.558)发表Delineating copy number and clonal substructure in human tumors from single-cell transcriptomes,他们开发了一种整合的贝叶斯分段算法,称为非整倍体肿瘤拷贝数核型分析(CopyKAT),用于估算高通量scRNA-seq基因组拷贝数谱,以区分肿瘤微环境中的正常细胞与恶性肿瘤细胞,识别主要的克隆亚群。这个算法和以往的inferCNV和HoneyBadger相比,可以直接根据拷贝数谱区分正常细胞和肿瘤细胞,并且更适用于新的单细胞测序技术。文章详细介绍了该算法的原理和流程,并表明该算法应用于各种实体瘤和不同的测序技术。让我们来详细看一看吧。背景单细胞转录组分析被广泛用于研究人类肿瘤。然而,如何区分肿瘤微环境中的正常细胞与恶性细胞,以及如何识别肿瘤中的克隆亚结构,仍是一个挑战。一个有效方法是鉴定细胞非整倍体拷贝数谱,因为绝大多数的人类肿瘤细胞都是非整倍体(88%),而正常人类基质细胞均是二倍体。先前的方法——inferCNV和HoneyBadger,是针对第一代scRNA-seq技术设计的(具有较低的细胞通量和较高的覆盖深度)。而新开发的高通量scRNA-seq技术进行全转录组扩增,只对mRNA的3’或5’端进行稀疏覆盖,具有较高的细胞通量和较低的覆盖深度。此外,inferCNV和HoneyBadger不能准确地解析特定染色体断点的基因组位置,也不能根据非整倍体拷贝数谱正确分类肿瘤细胞和正常细胞。而CopyKAT克服了这些缺点,研究者可以直接使用该方法,输入测序得到的单细胞表达数据,就可以得到正常细胞和肿瘤细胞的预测结果,并且了解这些肿瘤细胞的哪些基因组区域发生了变化。而将计算的拷贝数谱(基因型信息)和我们常规的表型分析结合起来,可以更加深刻的了解肿瘤细胞恶性表达程序。数据及代码:数据:GSE148673代码:https://github.com/navinlabcode/copykat(包括测试数据)(所以不懂算法的原理和流程不要害怕,安装R包后一行代码就可以得到计算结果,我们只要对算法有一个粗略的了解就可以啦。)主要内容一、CopyKAT 方法的整体流程
https://mp.weixin.qq.com/s/-AzxUP3PrstSfbRa28rgnQ