How to get best k for genernate read-db.meryl?

marbl / merqury

k-mer based assembly evaluation

Other

272 stars 19 forks source link

Hello,

The "best_k.sh" is to help getting the minimum k size to generate read-db.meryl, given the genome size.

The "k-mer threshold" is for getting a cutoff for obtaining a reliable k-mer subset from read-db.meryl. The threshold is automatically determined given the k-mer histogram of read-db.meryl in Merqury.

So yes, you need sequencing reads to generate read-db.meryl. Once you know the "best k", prepare meryl-dbs using the "best k" as in the document with meryl count. Merqury will do the rest, in most cases, unless the histogram is somewhat unexpected.

Thanks, Arang

marbl / merqury

How to get best k for genernate read-db.meryl? #101