starskyzheng / panpop

Application of pan-genome for population
MIT License
87 stars 8 forks source link

NGS最终的结果文件 #27

Closed cheninouc closed 4 months ago

cheninouc commented 5 months ago

您好! 郑博士 @starskyzheng

我通过NGS流程,得到了最终结果文件—9.aug_final_result/6.filter_maf1.final_mergechr.all.sv.vcf.gz 其中的基因型数据不是很明白:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT
1       378556  .       TATTATTTTGATACAAATC   *       .       .       ZORIPOS=377487;ZORIEND=384753;ZLEN=7267;AF=0:203,1:21
1       378635  .       AATACCTAAAACAGGGAGTTCA        *       .       .       ZORIPOS=377487;ZORIEND=384753;ZLEN=7267;AF=0:203,1:21
1       428275  .       AAATTTGTATTATCATTTTTTAGTTTATCCATGC  *       .       PASS    AF=0:246,1:30
1       534761  .       CAAATACATAGATAAATAAATAAATAAATAAATAAATTAATTAATATATAAATAAATGAATAAATAAATCT TAAATAAAAAAATAATAATAATAATAAATGAATAAATCA .       PASS    AF=0:113,1:187

1.ALT列为*表示什么基因型呢? 2.最后一个变异它应该不属于INV变异,那它属于哪种变异呢? 3.我使用这个vcf文件进行群体遗传学分析,是否需要进一步过滤,例如只保留PASS的位点?

期待您的回复!

starskyzheng commented 5 months ago
  1. *表示删除,即这段序列都删掉了
  2. 属于分歧(divergence)类型。不属于插入或缺失
  3. 不需要过滤PASS,这个信息没有用的。如果过滤的话,可以过滤掉缺失率较高的位点。