starskyzheng / panpop

Application of pan-genome for population
MIT License
93 stars 8 forks source link

运行FILL_DP和PART之后的得到的结果解释 #58

Closed hanshenglei closed 2 months ago

hanshenglei commented 4 months ago

你好,郑博士, 我想快速的知道最终split之后的sv文件中的ZORIPOS=XXX;ZORIEND=XXX;ZLEN=XXX,和某些样本中的./.是什么意思;我的自己的二代脚本为将DEL、DUP、INS的变异先进行单个样本多个caller的PART后进行merge_caller,然后再进行fill_dp和PART,得到的vcf文件与分离出来的INV进行baftools concat,得到的sv文件中ZORIPOS=XXX;ZORIEND=XXX;ZLEN=XXX和某些样本中的./.我并不知道是什么意思。看你在别的问题下回答对于sv要使用fill_dp.pl,但是我已经使用了。

祝好

hanshenglei commented 4 months ago

补充:1)我发现我只对DEL、DUP、INS分析的vcf再进行到PART-merge_caller-fill_dp-PART之后的sv文件中有样本GT=./.,请您解释这个; 2) 我的concat之后的vcf使用了flt_vcf_maf_by_allele.pl脚本之后,才出现了ZORIPOS=XXX;ZORIEND=XXX;ZLEN=XXX,我希望您可以解释一下ZORIPOS=7171810;ZORIEND=7171866;ZLEN=57;AF=0:36,1:8是什么意思,或者有用吗? 3)我看您的文章中写得到的vcf要过滤miss和拆allele,所以我运行了flt_vcf_by_miss.pl和flt_vcf_maf_by_allele.pl,请问我的操作对吗?您文中提到的将多等位的sv转为双等位的sv请问是什么原理,是简单的删除吗?

starskyzheng commented 4 months ago

./.就是不知道这个位点是什么Genotype,也就是深度不足。 ZORIPOS和ZORIEND就是realign group的起始位置和终止位置。ZLEN是长度。一般没用。 拆allele和转双等位基因是通过PART算法。flt_vcf_maf_by_allele.pl是过滤MAF的。

hanshenglei commented 4 months ago

好的 谢谢您

hanshenglei commented 4 months ago

flt_vcf_maf_by_allele.pl中的[--max_miss_freq 0.3]和flt_vcf_by_miss.pl中的[--threshold_miss 0(no miss allowed)]是一回事吗? flt_vcf_maf_by_allele.pl中的[--min_maf 0.05]是保留了这些小于0.05稀有突变位点还是去除了

starskyzheng commented 4 months ago
  1. 是一样的
  2. 去除了
github-actions[bot] commented 3 months ago

This issue is stale because it has been open for 30 days with no activity.

github-actions[bot] commented 2 months ago

This issue was closed because it has been inactive for 14 days since being marked as stale.