fulcrumgenomics / fgbio

Tools for working with genomic and high throughput sequencing data.
http://fulcrumgenomics.github.io/fgbio/
MIT License
313 stars 67 forks source link

Duplicate read names in output of CallMolecularConsensusReads #464

Closed alkodsi closed 5 years ago

alkodsi commented 5 years ago

I am getting the following error in FilterConsensusReads: Multiple non-secondary, non-supplemental R1s for Library1:chr10:102509587/GCGGCCAGC

Here is the workflow I am using (fgbio v0.7.0, picard v2.18.26):

picard UmiAwareMarkDuplicatesWithMateCigar  I=in.bam  O=out.bam M=metrics1.txt UMI_METRICS=metrics2.txt   MOLECULAR_IDENTIFIER_TAG=MI BARCODE_TAG=BC

fgbio SortBam -s TemplateCoordinate -i out.bam -o out2.bam

fgbio CallMolecularConsensusReads -i out2.bam -o out3.bam -r rejected.bam -M 1

fgbio FilterConsensusReads -i out3.bam -o output.bam -r reference.fasta -M 1 -E 0.05 -e 0.3 -N 10 -n 0.3 -q 10

Here are the corresponding sam records from picard output:


D00482:271:HNKNLBCX2:1:1103:1348:60510 |1123|chr10|102509516|60|101M|=|102509587|172 |TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG|DDDDDHIHHHIIIIIIIIHHHHIIIIIIIIIIIIIIIIIIIIIIIIIHIIHHHHIHHIIIIIIIIIIIHHIIIIIHHIIIIIIIIIIHGHIIIIIIIIIII|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:1:2111:7814:54070 |1123|chr10|102509516|60|101M|=|102509587|172 |TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG|DDDDAHHIIDHFHHHHDHIIDHHEFHHHIIIIGIIHIIIHHHIHEHHIIIIIIIIHHHIIHGIIIIIIIIIIIIID1GHIIIDHECHDHHHIIIHHIIIH?|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:2:1208:1325:45789 |1123|chr10|102509516|60|101M|=|102509587|172 |TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACGCGACGTGGTGAGGCAGCGCATCGTGGTGCTGGCCCACCAGGGTGTGCGGCCCTGTG|<00<BFD1<FHIEEE<CHHI//<0<<FHH1D1ED<D/</<CH1=0<F/<<DDDEHHCH<<0D<D/DDHE@@1D?11<<<DD<GCGHGH@/<DGDHCDDEHH|MC:Z:101M|MD:Z:44C26A29|RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:2|AS:i:91 |XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:2:2212:17652:87766|99  |chr10|102509516|60|101M|=|102509587|172 |TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG|DDDDDIIIIIIHHIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIHIEHHGHHIIIIIIHIIIIIIIHIGIIIHIIIGHIIIIIIIIIIIIIIIIIIH|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:1:1103:1348:60510 |1171|chr10|102509587|60|101M|=|102509516|-172|AGCTGGCCCACCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGC|HIIIIGGHFIIIIIIHCIIIHHIHIIIIIIIHHFHHIIIIIHHIHIIIIIIIIHIIHHHHHHIIIIIIIIHGIIIIIIIIIIHHHIIIIIIHHHHICDDDD|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:1:2111:7814:54070 |1171|chr10|102509587|60|101M|=|102509516|-172|AGCTGGCCCACCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGC|HHHDHHHEGCHCHIHIHIDHDIIHHGHH?GHHHHHHHCHIIIHHIGIHEIHGCIIHHHHIIIIHIIGIHIIHHEEEHHFHEIIIHIHIHHIIIIGGDDDDA|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:2:1208:1325:45789 |1171|chr10|102509587|60|101M|=|102509516|-172|AGCTGGCCCACCAGGGTGTGCGGCCCTGTGACATCACCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGACAGGTGAGGGCTTCGCAGC|<<<01</0F<HD1C<</E/C/D0011<11D<<11/0/<E@HC@DC</<11@HGD//HE<11D<C<<<1<111<1D11111<1<1@H@<<1CE</</<00<0|MC:Z:101M|MD:Z:35T45G19|RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:2|AS:i:91 |XS:i:19|RX:Z:GCGGCCAGC
D00482:271:HNKNLBCX2:2:2212:17652:87766|147 |chr10|102509587|60|101M|=|102509516|-172|AGCTGGCCCACCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGC|HIIIIIIIIIIIIIIIIIIIIHIIIIIIIHIHHIIHIIIIIHIIHHIIIIIIHIIIIIIIIIHIIIIIIIIHIIIIIIIHCIIIIIIIIIIIIIIHDDCDD|MC:Z:101M|MD:Z:101     |RG:Z:ID1|MI:Z:chr10:102509587/GCGGCCAGC|NM:i:0|AS:i:101|XS:i:0 |RX:Z:GCGGCCAGC

and the sam records from the CallMolecularConsensusReads output:

Library1:chr10:102509587/GCGGCCAGC|77 |*|0|0|*|*|0|0|TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG|NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNMNNNNNNNNNNNNNNNNNNNNNNNNNNMNNNNNNNNNNNNNNNNNNNNNNNNNNNNN|cD:i:3|cE:f:0.00660066|RG:Z:A|MI:Z:chr10:102509587/GCGGCCAGC|cM:i:3|RX:Z:GCGGCCAGC|cd:B:s,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3|ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509587/GCGGCCAGC|77 |*|0|0|*|*|0|0|TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG|BBBBBEEEEEEDDEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEDECDDDDDEEEEEEDEEEEEEEDEDEEEDEEEDDEEEEEEEEEEEEEEEEEED|cD:i:1|cE:f:0         |RG:Z:A|MI:Z:chr10:102509587/GCGGCCAGC|cM:i:1|RX:Z:GCGGCCAGC|cd:B:s,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1|ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509587/GCGGCCAGC|141|*|0|0|*|*|0|0|GCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAGATGTCACAGGGCCGCACACCCTGGTGGGCCAGCT|NNNNNNNNNNNNNNNNNNNMNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNMNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN|cD:i:3|cE:f:0.00660066|RG:Z:A|MI:Z:chr10:102509587/GCGGCCAGC|cM:i:3|RX:Z:GCGGCCAGC|cd:B:s,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3|ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509587/GCGGCCAGC|141|*|0|0|*|*|0|0|GCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAGATGTCACAGGGCCGCACACCCTGGTGGGCCAGCT|BBABBDEEEEEEEEEEEEEEADEEEEEEEDEEEEEEEEDEEEEEEEEEDEEEEEEDDEEDEEEEEDEEDDEDEEEEEEEDEEEEEEEEEEEEEEEEEEEED|cD:i:1|cE:f:0         |RG:Z:A|MI:Z:chr10:102509587/GCGGCCAGC|cM:i:1|RX:Z:GCGGCCAGC|cd:B:s,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1|ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
xiucz commented 5 years ago

The same problem I have met.

nh13 commented 5 years ago

The output of CallMolecularConsensusReads has four reads when I'd expect two. Could you provide the test BAMs you used, with just those reads above (I want the full SAM header is why I am asking)?

Alternatively, you could use GroupReadsByUmi instead of UmiAwareMarkDuplicatesWithMateCigar (or after it).

alkodsi commented 5 years ago

Here is the SortBam output file (it's different from the file above, all my bam files failed at this step):

@HD VN:1.5  SO:unsorted GO:query    SS:unsorted:template-coordinate
@SQ SN:chrM LN:16571
@SQ SN:chr1 LN:249250621
@SQ SN:chr2 LN:243199373
@SQ SN:chr3 LN:198022430
@SQ SN:chr4 LN:191154276
@SQ SN:chr5 LN:180915260
@SQ SN:chr6 LN:171115067
@SQ SN:chr7 LN:159138663
@SQ SN:chr8 LN:146364022
@SQ SN:chr9 LN:141213431
@SQ SN:chr10    LN:135534747
@SQ SN:chr11    LN:135006516
@SQ SN:chr12    LN:133851895
@SQ SN:chr13    LN:115169878
@SQ SN:chr14    LN:107349540
@SQ SN:chr15    LN:102531392
@SQ SN:chr16    LN:90354753
@SQ SN:chr17    LN:81195210
@SQ SN:chr18    LN:78077248
@SQ SN:chr19    LN:59128983
@SQ SN:chr20    LN:63025520
@SQ SN:chr21    LN:48129895
@SQ SN:chr22    LN:51304566
@SQ SN:chrX LN:155270560
@SQ SN:chrY LN:59373566
@SQ SN:chr1_gl000191_random LN:106433
@SQ SN:chr1_gl000192_random LN:547496
@SQ SN:chr4_ctg9_hap1   LN:590426
@SQ SN:chr4_gl000193_random LN:189789
@SQ SN:chr4_gl000194_random LN:191469
@SQ SN:chr6_apd_hap1    LN:4622290
@SQ SN:chr6_cox_hap2    LN:4795371
@SQ SN:chr6_dbb_hap3    LN:4610396
@SQ SN:chr6_mann_hap4   LN:4683263
@SQ SN:chr6_mcf_hap5    LN:4833398
@SQ SN:chr6_qbl_hap6    LN:4611984
@SQ SN:chr6_ssto_hap7   LN:4928567
@SQ SN:chr7_gl000195_random LN:182896
@SQ SN:chr8_gl000196_random LN:38914
@SQ SN:chr8_gl000197_random LN:37175
@SQ SN:chr9_gl000198_random LN:90085
@SQ SN:chr9_gl000199_random LN:169874
@SQ SN:chr9_gl000200_random LN:187035
@SQ SN:chr9_gl000201_random LN:36148
@SQ SN:chr11_gl000202_random    LN:40103
@SQ SN:chr17_ctg5_hap1  LN:1680828
@SQ SN:chr17_gl000203_random    LN:37498
@SQ SN:chr17_gl000204_random    LN:81310
@SQ SN:chr17_gl000205_random    LN:174588
@SQ SN:chr17_gl000206_random    LN:41001
@SQ SN:chr18_gl000207_random    LN:4262
@SQ SN:chr19_gl000208_random    LN:92689
@SQ SN:chr19_gl000209_random    LN:159169
@SQ SN:chr21_gl000210_random    LN:27682
@SQ SN:chrUn_gl000211   LN:166566
@SQ SN:chrUn_gl000212   LN:186858
@SQ SN:chrUn_gl000213   LN:164239
@SQ SN:chrUn_gl000214   LN:137718
@SQ SN:chrUn_gl000215   LN:172545
@SQ SN:chrUn_gl000216   LN:172294
@SQ SN:chrUn_gl000217   LN:172149
@SQ SN:chrUn_gl000218   LN:161147
@SQ SN:chrUn_gl000219   LN:179198
@SQ SN:chrUn_gl000220   LN:161802
@SQ SN:chrUn_gl000221   LN:155397
@SQ SN:chrUn_gl000222   LN:186861
@SQ SN:chrUn_gl000223   LN:180455
@SQ SN:chrUn_gl000224   LN:179693
@SQ SN:chrUn_gl000225   LN:211173
@SQ SN:chrUn_gl000226   LN:15008
@SQ SN:chrUn_gl000227   LN:128374
@SQ SN:chrUn_gl000228   LN:129120
@SQ SN:chrUn_gl000229   LN:19913
@SQ SN:chrUn_gl000230   LN:43691
@SQ SN:chrUn_gl000231   LN:27386
@SQ SN:chrUn_gl000232   LN:40652
@SQ SN:chrUn_gl000233   LN:45941
@SQ SN:chrUn_gl000234   LN:40531
@SQ SN:chrUn_gl000235   LN:34474
@SQ SN:chrUn_gl000236   LN:41934
@SQ SN:chrUn_gl000237   LN:45867
@SQ SN:chrUn_gl000238   LN:39939
@SQ SN:chrUn_gl000239   LN:33824
@SQ SN:chrUn_gl000240   LN:41933
@SQ SN:chrUn_gl000241   LN:42152
@SQ SN:chrUn_gl000242   LN:43523
@SQ SN:chrUn_gl000243   LN:43341
@SQ SN:chrUn_gl000244   LN:39929
@SQ SN:chrUn_gl000245   LN:36651
@SQ SN:chrUn_gl000246   LN:38154
@SQ SN:chrUn_gl000247   LN:36422
@SQ SN:chrUn_gl000248   LN:39786
@SQ SN:chrUn_gl000249   LN:38502
@PG ID:bwa  PN:bwa  VN:0.7.17-r1188 CL:bwa mem -M -t 4 -R @RG\tID:ID1\tPL:ILLUMINA\tLB:Library1\tSM:sample ucsc.hg19.fasta sample_R1_001.fastq.gz sample_R3_001.fastq.gz

D00482:271:HNKNLBCX2:1:2212:10191:61020 1123    chr10   102509597   60  101M    =   102509621   125 CCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTCAGGGCTTCGCAGCTGTCCCGGGA   <<B@0<D1CGHHHDHHEHHIFHHHIE1CHIGDDH0<DDCHDHIHGHHIHIIHIIECC<C1FHFHHE1CF11CEEHHH11<1<@HCHCCDHIHIGGHHDCC/   MC:Z:101M   MD:Z:77G23  RG:Z:ID1    MI:Z:chr10:102509621/CCGCTACGC  NM:i:1  AS:i:96 XS:i:0  RX:Z:CCGCTACGC
D00482:271:HNKNLBCX2:1:2212:10191:61020 1171    chr10   102509621   60  101M    =   102509597   -125    CTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGCTGTCCCGGGAGACGCCTTGCCTACTTCCCCGGCC   HDHDF<CC?HDIHE1FIHEHHDCEFD<<<G@HEGHHF?HIHHCCC@IGIHHHHHIHIHGIHHHCD?HEHHHDHHCHCDHHHGHH@CCEG@H@DIHFD?@D<   MC:Z:101M   MD:Z:101    RG:Z:ID1    MI:Z:chr10:102509621/CCGCTACGC  NM:i:0  AS:i:101    XS:i:0  RX:Z:CCGCTACGC
D00482:271:HNKNLBCX2:2:2104:19776:61048 99  chr10   102509597   60  101M    =   102509621   125 CCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGCTGTCCCGGGA   DDDDDHIHIIIIIGGIIIIIIHIIIIIIIIIIIHIHIIHIHIIGIIIIIHIIIIIIIIIIIIHIHIIIIIIIHIHIIIHIIIFHHIIHIIGIHIHIIIIIH   MC:Z:101M   MD:Z:101    RG:Z:ID1    MI:Z:chr10:102509621/CCGCTACGC  NM:i:0  AS:i:101    XS:i:0  RX:Z:CCGCTACGC
D00482:271:HNKNLBCX2:2:2104:19776:61048 147 chr10   102509621   60  101M    =   102509597   -125    CTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGCTGTCCCGGGAGACGCCTTGCCTACTTCCCCGGCC   IIIIIIIIIIIHIIIIIIIIIIIIIIHIIIIHIHHGIIIIIIIIIIIIIIIIHIIIIIIIIIIIIIIHIIIIIIHIIIIIIIIHHF1HHFIIIIIIDDDDD   MC:Z:101M   MD:Z:101    RG:Z:ID1    MI:Z:chr10:102509621/CCGCTACGC  NM:i:0  AS:i:101    XS:i:0  RX:Z:CCGCTACGC
nh13 commented 5 years ago

I am unable to reproduce the bug. Can you verify that when you run just those reads you get duplicates?

Output on the 4-record bam in 0.7.0:

@HD VN:1.5  SO:queryname    GO:none
@RG ID:A    LB:Library1 SM:sample ucsc.hg19.fasta sample_R1_001.fastq.gz sample_R3_001.fastq.gz PL:ILLUMINA
@CO Read group A contains consensus reads generated from 1 input read groups.
Library1:chr10:102509621/CCGCTACGC  77  *   0   0   *   *   0   0   CCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGCTGTCCCGGGA   MMMMMMNMNNNNNNNNNNNNNNNNNNMNNNNNNNMMNNNNNNNNNNNNNNNNNNNNNMNMNNNNNNMNNMMNNNNNN6MMMMMNNNNNNNNNNNNNNNNNM   cD:i:2  cE:f:0.004950495    RG:Z:A  MI:Z:chr10:102509621/CCGCTACGC  cM:i:2  RX:Z:CCGCTACGC  cd:B:s,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509621/CCGCTACGC  141 *   0   0   *   *   0   0   GGCCGGGGAAGTAGGCAAGGCGTCTCCCGGGACAGCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAG   MNMMNNNNNNNMNNMNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNMMMNNNNNNNNNNNMNNNNNNNNMNNNNN   cD:i:2  cE:f:0.0    RG:Z:A  MI:Z:chr10:102509621/CCGCTACGC  cM:i:2  RX:Z:CCGCTACGC  cd:B:s,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0

Output on the 4-record bam using the latest master commit (bf8c700):

@HD VN:1.5  SO:queryname    GO:none
@RG ID:A    LB:Library1 SM:sample ucsc.hg19.fasta sample_R1_001.fastq.gz sample_R3_001.fastq.gz PL:ILLUMINA
@CO Read group A contains consensus reads generated from 1 input read groups.
Library1:chr10:102509621/CCGCTACGC  77  *   0   0   *   *   0   0   CCAGGGTGTGCGGCCCTGTGACATCTCCCGGCAGCTGCGGGTCAGCCACGGCTGTGTCAGCAAAATCCTGGGCAGGTGAGGGCTTCGCAGCTGTCCCGGGA   MMMMMMNMNNNNNNNNNNNNNNNNNNMNNNNNNNMMNNNNNNNNNNNNNNNNNNNNNMNMNNNNNNMNNMMNNNNNN6MMMMMNNNNNNNNNNNNNNNNNM   cD:i:2  cE:f:0.004950495    RG:Z:A  MI:Z:chr10:102509621/CCGCTACGC  cM:i:2  RX:Z:CCGCTACGC  cd:B:s,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509621/CCGCTACGC  141 *   0   0   *   *   0   0   GGCCGGGGAAGTAGGCAAGGCGTCTCCCGGGACAGCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAG   MNMMNNNNNNNMNNMNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNMMMNNNNNNNNNNNMNNNNNNNNMNNNNN   cD:i:2  cE:f:0.0    RG:Z:A  MI:Z:chr10:102509621/CCGCTACGC  cM:i:2  RX:Z:CCGCTACGC  cd:B:s,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0

Output on the 8-record bam in 0.7.0:

Library1:chr10:102509587/GCGGCCAGC  77  *   0   0   *   *   0   0   TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG   NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN   cD:i:4  cE:f:0.00495049 RG:Z:A  MI:Z:chr10:102509587/GCGGCCAGC  cM:i:4  RX:Z:GCGGCCAGC  cd:B:s,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509587/GCGGCCAGC  141 *   0   0   *   *   0   0   GCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAGATGTCACAGGGCCGCACACCCTGGTGGGCCAGCT   NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN   cD:i:4  cE:f:0.00495049 RG:Z:A  MI:Z:chr10:102509587/GCGGCCAGC  cM:i:4  RX:Z:GCGGCCAGC  cd:B:s,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0

Output on the 8-record bam using the latest master commit (bf8c700):

@HD VN:1.5  SO:queryname    GO:none
@RG ID:A    LB:Library1 SM:sample ucsc.hg19.fasta sample_R1_001.fastq.gz sample_R3_001.fastq.gz PL:ILLUMINA
@CO Read group A contains consensus reads generated from 1 input read groups.
Library1:chr10:102509587/GCGGCCAGC  77  *   0   0   *   *   0   0   TGTGAACCAGCTCGGGGGGGTGTTTGTGAACGGCCGGCCCCTACCCGACGTGGTGAGGCAGCGCATCGTGGAGCTGGCCCACCAGGGTGTGCGGCCCTGTG   NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN   cD:i:4  cE:f:0.004950495    RG:Z:A  MI:Z:chr10:102509587/GCGGCCAGC  cM:i:4  RX:Z:GCGGCCAGC  cd:B:s,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Library1:chr10:102509587/GCGGCCAGC  141 *   0   0   *   *   0   0   GCTGCGAAGCCCTCACCTGCCCAGGATTTTGCTGACACAGCCGTGGCTGACCCGCAGCTGCCGGGAGATGTCACAGGGCCGCACACCCTGGTGGGCCAGCT   NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN   cD:i:4  cE:f:0.004950495    RG:Z:A  MI:Z:chr10:102509587/GCGGCCAGC  cM:i:4  RX:Z:GCGGCCAGC  cd:B:s,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4    ce:B:s,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0