Closed mikael-s closed 3 years ago
K-mer canonique : pas forcément une bonne idée en fait, on préfère ne pas avoir à calculer un revcomp au moment où on interroge la table de hachage. Par contre il faut donc insérer dans la table de hachage (et le filtre de Bloom) les k-mers et leurs reverse complement.
Pour connaître le revcomp vous pouvez peut-être regarder cela : http://gatb-core.gforge.inria.fr/doc/api/snippets_kmer.html sinon le faire à la main
Je viens de remarquer que depuis 4609ce11 le nom de fichier contenant le transcrit est en dur. Non il faut bien que ce soit un paramètre.
Il n'y a pas besoin d'avoir un autre fichier pour le reverse complément, il faut calculer le reverse complément à partir de la séquence d'origine. Cela n'a pas forcément besoin d'être fait pour la séquence complète, cela peut être fait k-mer par k-mer, ce qui est géré par GATB. D'ailleurs dans GATB, la classe CanonicalKmer est d'intérêt puisqu'elle permet de gérer cela de manière transparent : http://gensoft.pasteur.fr/docs/gatb-core/1.3.0/classgatb_1_1core_1_1kmer_1_1impl_1_1Kmer_1_1KmerCanonical.html