Closed jorondo1 closed 2 years ago
par termine de tester metawrap mais voici le pipleine, jai teste jusqua l'etape de reassembly (le reste en cours).
voir ici
En resume, presentement les etapes sont comme suit:
Selon mes tests sur un echantilllon le pipeline prendra environ 1-2 jours d'execution. L'etape binning tourne pendant 9h pour les tests que jai fait. En fait c'est une etape de checkM durant el binning qui ralenti le truc car ca roule a un seul thread car chaque thread bouffe env 40GB de ram selon la doc.
Tu aimerais donc que je modifie le pipeline comme suit:
C'est bien ca? Faut savoir que ceci va ajoute du temps d'execution a la job.
En fait, kraken/brakcen se passent sur les reads et les contigs, mais c'est indépendant des autres modules (sauf contigs qui requiert assembly avant). C'est indépendant dans le sens que ça peut être fait en parallèle du reste, rien ne dépend de l'output kraken/bracken.
Je sais pas comment tu montes le config, mais est-ce qu'on pourra spécifier quels modules on veut faire rouler ? ou est-ce qu'on va manuellement partir chaque module?
on peut s'appeler pour jaser de la meilleure stratégie si tu veux
mon commentaire original voulait surtout dire qu'on a pas besoin de réécrire un nouveau script kraken/bracken, on peut réutiliser celui du pipeline humann
plus simple de copie coller au script metawrap
pour etre certain, faudrait se parler direct avant de faire ce changement.
ok es-tu dispo lundi 13h ou mercredi am ?
dans metaWRAP, on pourrait utiliser le module kraken complet tel qu'utilisé dans humann, donc incluant Bracken avant KronaTools. La seule différence c'est qu'on aura pas besoin de créer une bugs-list custom.
On pourrait quand même intégrer le script pour créer la table complète de taxonomie en utilisant tous les samples?