ShixiangWang / sigminer

🌲 An easy-to-use and scalable toolkit for genomic alteration signature (a.k.a. mutational signature) analysis and visualization in R https://shixiangwang.github.io/sigminer/reference/index.html
https://shixiangwang.github.io/sigminer/
Other
147 stars 19 forks source link

问题:使用sig_tally来解析WES样品的SBS Signature时,如何设置use_syn? #393

Closed wangshun1121 closed 2 years ago

wangshun1121 commented 2 years ago

如题:最近刷了一遍TCGA的突变Signature,回头一边检查结果,一边审视sig_tally源代码。关于该函数中sig_tally中是否纳入同义突变,在帮助信息中并没有言明该参数默认值时啥,查看了代码知道默认时True。

那么,若将这个参数设置为F,那么某些CDS区特定的SNP突变,注定不可能被计算入SBS中,进一步就会影响后续SBS Signature的发现或解析。

另外,我也去了COSMIC官网上,找到了SBS发现的原始素材和工具,但没能发现源代码。那么,问题来了:当初这批Signature解析的时候,是否没有区分同义与非同义?Exomic的Signature是否锁定的Exon区间?然后,分析目标若为解析WES样品COSMIC SBS组分,那么sig_tally时是否要纳入同义突变?甚至进一步考虑,将来若采用小panel测序,又要比较和引用COSMIC的SBS,那么三碱基突变的组分,是否需要根据测序区间三碱基组合的比例进行修正?

wangshun1121 commented 2 years ago

我接下来继续尝试各种不同组合。但是,这个问题提出来,希望抛砖引玉

wangshun1121 commented 2 years ago

刚刚简简单单,画了一幅图。横轴是包括/排除同义突变算出的COSMIC SBS组分的相关系数,纵轴时log10(TMB)。

image

简单的结果:当TMB足够高,则包括或排除同义突变,SBS组分的相关性有一定保证;若TMB降下来,那可不一定了。。。

wangshun1121 commented 2 years ago

ID Signature与SBS类似。但是,普遍上说,更多样品中ID的相关性还是比SBS好些。

image
ShixiangWang commented 2 years ago

@wangshun1121 你好,一般的情况不需要去除同义突变。突变一般被认为是随机时间,突变因素不带有同义或非同义的倾向性。纳入突变的数目越多,越容易得到合理的signature解析结果。

不过,不同基因组区间的核苷酸突变环境是不同的,这有可能影响建立panel的结果,最好先推断出panel的核苷酸环境组成,再去解析signature。sigminer只支持外显子和全基因组之间SBS signature的转换,见https://shixiangwang.github.io/sigminer-book/convert.html

wangshun1121 commented 2 years ago

对于Mutation Signature,我是这么理解的:这些Signature实际代表了特定类型的碱基,发生特定突变的概率。所以,从上游DNA的层面说,Target Region中不同三连碱基的丰度必然影响后面Mutation Signature组分的比例;从下游说,若CDS中同义突变被排除,相当于强行去掉了特定碱基发生特定突变的可能。

而针对panel,不考虑同义或非同义的情况,先假设每一个位点突变成其他碱基的概率相等,那么,在一种情况下(例如WGS)得到的Signature可以根据碱基组合的比例,转换为特定panel的。实际上,现在已经有研究Mutation Signature的文章涉及到了这种场景。例如Nature Genetics研究8个国家食管鳞癌WGS的文章(10.1038/s41588-021-00928-6)。文中把三连碱基突变谱,按照突变发生的位置(非转录的DNA,基因区间转录链,基因区间非转录链),由SBS96变成了SBS288。3个区间中的Signature组成比例很相似。他们的策略是先寻找DeNovo的Signature,再和标准的Sig比较。

若后面去挖掘Signature,尤其样品没那么多时,还是需要借用标准的Sig的。此时,了解Signature的背景信息就很重要了。

wangshun1121 commented 2 years ago

最近在做Signature的研究,发现好多常用的临床肿瘤突变指标(TMB,MSI,HRD等)都可以用Signature表出。这里面应该有东西值得深挖呢。

ShixiangWang commented 2 years ago

目前方法、应用上都还有值得探索的空间。