broadinstitute / gatk

Official code repository for GATK versions 4 and up
https://software.broadinstitute.org/gatk
Other
1.71k stars 594 forks source link

GenomicsDBImport and CombineGVCFs results don't match #9024

Open gokalpcelik opened 3 weeks ago

gokalpcelik commented 3 weeks ago

This could be another GenomicsDB issue that we may need to pursue. https://gatk.broadinstitute.org/hc/en-us/articles/360035889671-How-do-I-submit-a-detailed-bug-report

GenomicsDB dump of the variant site chr13 32339012 . A G,T,<NON_REF> . . AS_RAW_BaseQRankSum=|-0.600,1,0.300,1|-2.000,1|;AS_RAW_MQ=14731200.000|828000.000|3600.000|0.000;AS_RAW_MQRankSum=|0.000,2|0.000,1|;AS_RAW_ReadPosRankSum=|0.300,1,1.900,1|0.100,1|;AS_SB_TABLE=1874,2218|112,118|0,1|0,0;BaseQRankSum=0.388;DP=39331;MQRankSum=0;RAW_MQandDP=16254000,4515;ReadPosRankSum=2.007 GT:AD:GQ:MIN_DP:SB:DP ./././././././././././././././././././.:.:9:1445:.:1628 ./././././././././././././././././././.:2150,118,1,0:99:.:979,1171,59,60:2269 ./././././././././././././././././././.:.:9:1867:.:2079 ./././././././././././././././././././.:.:9:1927:.:2216 ./././././././././././././././././././.:.:9:2056:.:2328 ./././././././././././././././././././.:.:9:2611:.:2992 ./././././././././././././././././././.:.:9:2547:.:2857 ./././././././././././././././././././.:.:9:1836:.:2175 ./././././././././././././././././././.:.:9:2334:.:2681 ./././././././././././././././././././.:.:9:1723:.:1966 ./././././././././././././././././././.:.:9:1790:.:2010 ./././././././././././././././././././.:1942,112,0,0:99:.:895,1047,53,59:2054 ./././././././././././././././././././.:.:9:1743:.:2058 ./././././././././././././././././././.:.:9:1937:.:2283 ./././././././././././././././././././.:.:9:1918:.:2244 ./././././././././././././././././././.:.:9:1743:.:1964 ./././././././././././././././././././.:.:9:2032:.:2290 ./././././././././././././././././././.:.:9:1748:.:1953 ./././././././././././././././././././.:.:9:1748:.:2037 ./././././././././././././././././././.:.:9:1811:.:2017

CombineGVCFs version of the site

chr13 32339012 . A G,T,<NON_REF> . . BaseQRankSum=0.388;DP=39331;MQRankSum=0.00;RAW_MQandDP=16254000,4515;ReadPosRankSum=2.01 GT:AD:DP:GQ:MIN_DP:PL:SB ./././././././././././././././././././.:.:1628:9:1445:0,9,18,28,39,50,62,7..... (redacted..)

GenomicsDB dump is lacking the PL field therefore final genotyped VCF is missing this variant. CombineGVCFs on the other hand has the proper PL field. Ploidy is 20 in these samples.

I asked user to send us snippets of those GVCF files for testing.