karel-brinda / ococo

Ococo: the first online variant and consensus caller. Call genomic consensus directly from an unsorted SAM/BAM stream.
https://arxiv.org/abs/1712.01146
MIT License
47 stars 3 forks source link

FASTA output represents ambiguity with '=' chars rather than Ns #18

Closed bede closed 8 years ago

bede commented 8 years ago

Hi, trivial issue – I've noticed that FASTA output includes '=' chars where the documentation would lead me to expect Ns. I'm using OS X 10.10.5.

Example

ococo -i 31_c100.sam --fasta-cons EU155341_31_c100_cons.n.fa

31_c100.sam

EU155341_31_c100_cons.n.fa:

>ENA|EU155341|EU155341.2
AAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGGACCC
CCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGA
ATTGCCAGGACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGG
AGATTTGGGCGTGCCCCCGCAAGACCGCTAGCCGAGTAGTGTTGGGTCGC
GAAAGGCCTTGTGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAG
GTCTCGTAGACCGTGCACCATGAGCACGAATCCTAAACCTCAAAGAAAAA
CCAAACGTAA=ACCAACCGTCGCCCACAGGACGTCAAGTTCCCGG=TGGC
GGTCAGATCGTTGGTGGAGTTTACTTGTTGCCGCGCAGGGGCCCTAGATT
GGGTGTG=GCGCGACGAGGAAGACTTCCGAGCGGTCGCAACCTCGAGGTA
GACGTCAGCCTATCCCCAAGGCGCGTCGGCCCGAGGGCAGGACCTGGGCT
CAGCCCGGGTACCCTTGGCCCCTCTATGGTAATGAGGGCTGCGGGTGGGC
AGGATGGCTCCTGTCCCCCCGTGGCTCTCGGCCTAGCTGGGGCCCCACAG
ACCCCCGGCGTAGGTCGCGCAATTTGGGTAAGGTCATCGATACCCTCACG
TGCGGCTTCGCCGACCTCATGGGGTACATTCCGCTCGTCGGCGCCCCTCT
TGGGGGCGCTGCCAGGGCCCTGGCGCATGGCGTC================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
=======================================TTCACTTTCTC
CCCCAGACACCACTGGACGACGCAAGACTGCAACTGCTCCATCTACCCCG
GCCATATAACGGGTCACCGCATGGCATGGGATATGATGATGAATTGGTCC
CCTACAACGGCGCTGGTAGTAGCTCAGCTGCTCAGGGTCCCGCAAGCCAT
CTTGGACATGATCGCTGGTGCCCATTGGGGAGTCCTAGCGGGCATAGCGT
ATTTCTCCATGGTGGGGAACTGGGCGAAGGTCCTGGTGGTGCTGTTGCTG
TTTGCCAGCGTCGATGCAGATACCTACACCACCGGGGGAACTGCCGCTAG
GGGCGCTTC=GGGCTCGCCAACATCTTCAGTCCGGGCGCTAAGCAGAA==
TCCAG==G=TC==CAC====GGCAGTTGGCACATCAATCGCAC=GCCCTG
AACTGCAATGCGAG=CTCGACACTGGCTGGGTGGCGGGGCTCCTCTATTA
CCACAAATTCAACTCTTCAGGCTGCACCGAGAGGATGGCCAGCTGTAGAC
CCCTTGCCGATTTCGA=CAGGGCTGGGGCCCCAT=AGCCACACCAACGGA
AGCGGCCCCGAACACCGCCCTTACTGCTGGCACTACCCCCCAAAGCC=TG
TGGCATCGTGCCAGCAAAGAGTGTATGTGGTCCAGTGTATTGCTTCACTC
CTAGCCC=GTGGTGGTGGGAACGACCGACAAGTTGGGCGCGCCCACCTAC
AACTGGGGTAGCAATGACACGGACGTCTTCATCCTCAACAACACCAGGCC
ACCGTTGGGCAATTGGTTCGGCTGCACCTGGATGAA==============
==================================================
==================================================
===========================================GTCCATT
ACTCTTACAGGCTTTGGCATTACCCTTGTACTGTCAACTACACCCTGTTC
AAAGTCAGGATGTACGTGGGAGGGGTCGAGCACAGGCTGGAAGTTGCTTG
CAACTGGACGCGGGGCGAGCGTTGTGATCTGGACGACAGGGACAGGTCCG
AGCTCAGCCCGCTGCTGCTGTCCACCACACAGTGGCAGGTCCTTCCGTGT
TCCTTCACGACCTTGCCAGCCTTGACCACCGGCCTCATCCACCTCCACCA
GAACATTGTGGACGTGCAATATTTGTACGGGGTGGGGTCAAGTATCGTAT
CCTGGGCCATCAAGTGGGAGTATGTCATTCTCTTGTTCCTCCTGCTTGCA
GACGCGCGCATCTGCTCCTGCTTGTGGATGATGCTACTCATATCCCAAGC
GGAGGCGGCTTTGGAGAACCTCGTGGTGCTTAATGCGGCGTCTTTGGCCG
GGACGCACGGTCTTGTGTCCTTCCTCGTGTTTTTCTGCTTTGCATGGTAT
CTCAAGGGTAGGTG====================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==========================================TGCT=GC=
CCCATCACGGCTTATGCCCAGCAGACAAGGGGTCTCTTGGGGTGCATAAT
TACCAGCCTGACCGGCCGGGATAAAAACCAGGTGGAGGGTGAGGTCCAGA
TTGTGTCAACTGCTGCCCAGACTTTTCTGGCAACCTGCATCAACGGGGTG
TGCTGGACCGTCTACCACGGGGCTGGAACAAGGACCATCGCGTCATCTAA
GGGTCCTGTTATCCAGATGTACACCAATGTAGACCAGGACCTCGTGGGCT
GGCCCGCTCCCCAGGGTGCCCGCTCATTGACACCCTGCACTTGCGGCTCC
TCGGACCT=T==CTGGT=AC=AGGCACGCCGA=GT==T=CCCGTGCGC=G
==GAGG=GA=A===G=GGC=GCC==C=TTCGCCCCGGCCCATCTCCTACC
TGAAAGGCTCCTCGGGGGGCCCACTGCTGTGCCCCGCGGGACACGCCGTA
GGCATATTCAGAGCCGCGGTATGCACCCGTGGAGTGGCTAAGGCGGTGGA
CTTCATCCCCGTAGAAAGCCTAGAGACAACCATGAGGTCCCCAGTGTTCA
CAGACAATTCCTCCCCGCCAGCAGTGCCCCAGAGCTTCCAGGTTGCCCAC
CTGCACGCTCCCACCGGCAGCGGTAAGAGCACCAAGGTCCCGGCCGCATA
CGCGGCGCAGGGCTACAAAGTGCTGGTGCTCAACCCCTCCGTTGCTGCAA
CACTGGGCTTTGGCGCTTACATGTCCAAGGCCCACGGGGTTGATCCTAAC
ATCAGGACTGGGGTGAGGACAATCACTACTGGCAGCCCCATCACGTACTC
CACCTACGGCAAGTTCCTTGCCGACGGCGGGTGCTCAGGGGGTGCCTATG
ACATAATAATTTGTGACGAGTGCCACTCCACGGATGCCACATCCGTTTTG
GGCATCGGCACTGTCCTTGACCAAGCAGAGACCGCGGGGGCGAGACTGGT
TGTGCTCGCCACCGCCACCCCTCCGGGCTCCATTACTGTGCCTCATCCCA
ACATCGAGGAGGTTGCTCTGTCCACCACCGGAGAGATTCCCTTTTACGGC
AAGGCTATCCCCCTTGAGGCAATCAAGGGGGGGAGACACCTCATCTTTTG
CCACTCAAAGAAGAAGTGCGACGAGCTCGCCGCAAAACTGGTCGCGCTGG
GCATCAACGCCGTGGCTTATTACCGCGGCCTTGACGTGTCCGTCATCCCG
ACCAGTGGCGATGTTGTCGTCGTGGCAACTGATGCTCTCATGACCGGCTA
TACCGGCGACTTTGACTCGGTGATAGACTGCAACACGTGTGTCACCCAGA
CAGTCGACTTCAGCCTTGACCCCACCTTCACTATTGAGACAACCACGCTT
CCCCAGGATGCCGTCTCCCGCACTCAACGTCGGGG=AGGACTGGCAGGGG
GAAGCCAGGCATCTACAGATTTGTGGCACCGGGGGAGCGCCCTTC=GGCA
TGTTTGACTCGTCCGTCCTCTGCGAGTGCTATGACGCGGGCTGTGCTTGG
TACGAGCTCACACCCGCCGAGACCACAGTTAGGCTACGAGCATACATGAA
CACCCCGGGACTCCCCGTGTGCCAAGACCATCTTGAATTTTGGGAGGGCG
TCTTCACGGGTCTCACCCATATAGATGCCCACTTTCTATCCCAGACAAAG
CAGAGTGGGGAGAACTTTCCTTACCTGGTAGCGTACCAAGCCACCGTGTG
CGCTAGAGCCCAAGCCCCCCC=CCATCGTGGGACCAGATGTGGAAGTGCT
TGATCCGTCTCAAGCCCACCCTTCATGGGCCAACACCTCTGCTATACAGA
CTGGGCGCTGTTCAGAATGAAGTCACCCTGACGCACCCAGTTACCAAATA
CATCATGACATGCATGTCGGCTGACCTGGAGGTCGTCACGAGTACCTGGG
TACTCGTTGGCGGCCTTCTGGC=GC==T=GC=GC=TA=TGC=T=TCA===
GGC=G=GTGGT=AT=GT=GG=AG===========================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
==================================================
===========================================TCTACCA
CCTCACGCAGTGCTTGCCAGAGGCAGAAGAAAGTCACATTTGACAGACTG
CAGGTCCTGGACAACCACTACCAGGACGTGCTCAAGGAGGTTAAGGCGGC
GGCGTCAAAAGTGAAGGCAAGCTTGCTATCCGTAGAGGAGGCTTGCAGCC
TGACGCCCCCACATTCAGCCAGATCTAAATTTGGCTATGGGGCAAAGGAC
GTCCGCAGCCATGCCAGAAAGGCCGTAAACCACATCAACTCCGTGTGGAA
AGACCTTCTGGAAGACAGTGTAACACCAATAGATACTACCATCATGGCTA
AGAACGAAGTTTTCTGCGTTCAGCCTGAGAAGGGGGGTCGTAAGCCAGCT
CGCCTCATCGTGTTCCCCGACCTGGGGGTACGCGTGTGCGAGAAGATGGC
CCTGTACGACGTGGTCAAGAAACTCCCTGTGGCCGTGATGGGAAGCTCCT
ACGGATTCCAATACTCACCAGGACAGCGGGTTGAATTCCTCGTGCAAGCG
TGGAAGTCCAAGAAGACCCCGATGGGGTTTTCATATGATACCCGCTGCTT
TGACTCCACAGTCACTGAGAGCGACATCCGTACGGAGGAGGCAATCTACC
AGTGTTGTGACCTGGACCCCCAAGCCCGAGTGGCCATCAAGTCCCTCACC
GAGAGGCTTTATGTCGGGGGCCCTCTTACCAATTCAAGGGGGGAGAACTG
CGGCTATCGCAGATGCCGCGCAAGCGGCGTGCTGACAACTAGCTGCGGTA
ACACCCTCACCTGCTACATCAAGGCCCAAGCAGCCTGTCGAGCCGCAGGG
CTCCGGGACTGCACCATGCTCGTGTGTGGCGACGACCTAGTCGTTATCTG
=GAAAGTCAGGGGGTCCCGGAGGATGCAGCGAGCCTGAGAGCCTTCACGG
AGGCTATGACCAGGTACTCCGCTCCCCCCGGGGACCCCCCCCAACCAGAA
TACGACTTGGAGCTCATAACATCATGCTCCTCTAACGTGTCAGTCGCCCA
CGACGGCGCTGGAAAGAGGGTCTATTACCTTACCCGTGACCCTACGACTC
CCATCGCGAGAGCCGCGTGGGAGACAGCAAGACACACTCCAGTCAATTCC
TGGCTAGGCAACATAATCATGTTTGCCCCCACATTGTGGGCGAG====AT
ACTGATGACCCACTTCTTCAGTGTCCTCATAGCCAGGGATCAGCTTGAAC
AGGCCCTTGATTGCGAAATCTACGGAGCCTGCTACTCCATAGAACCACTG
GACCTACCTCCAATCATTCAAAGACTCCA=GGCCTTAGCGCGTTCTCACT
CCACAGCTACTCTCCAGGTGAAATCAATAGGGTGGCCGCATGCCTCAGAA
AACTTGGGGTCCCGCCCTTGCGAGCTTGGAGACACCGGGCCCGAAGCGTC
CGCGCTAGGCTTCTGTCCAGAGGAGGCAAGGCTGCCATATGTGGCAAGTA
CCTCTTCAATTGGGCAGTAAGAACAAAGCTCAAACTCACTCCAATAGCGG
CCGCTAGCCAGCTGGACTTGTCCGGCTGGTTCACGGCTGGCTACAGCGGG
GGAGACATTTATCACAGCGTGTCTCATGCCCGGCCCCGCTGGTTCTGGTT
TTGCCTACTCCTGCTTACTGCAGGGGTAGGCATCTACCTCCTCCCCAACC
GATGAA
bede commented 8 years ago

Thank you : )