jflucier / ILL_pipelines

Isabelle Laforest-Lapointe Laboratory code
0 stars 1 forks source link

metaspades vs memory usage #18

Closed jorondo1 closed 2 years ago

jorondo1 commented 2 years ago

Si ça peut aider, cette équipe ont utilisé metaSPAdes pour assembler 9428 samples, générer quelques 200 millions de contigs et 350 000 bins. Pasolli et al. - 2019 - Extensive Unexplored Human Microbiome Diversity Re.pdf

p.18 y'a beaucoup d'info sur leur méthode peut-être que ça peut t'intéresser.

p.19-20 ils comparent leur méthode single-sample assembly avec deux différents co-assembly (longitudinal et cross-sectionnel, donc plusieurs samples d'un individu, mais aussi plusieurs samples de plusieurs individus, séparément) en utilisant seulement MEGAHIT qui (je pense) utilise beaucoup moins de mémoire. Leur conclusion est qu'on va chercher des génomes de meilleure qualité avec l'approche co-assembly, donc ça semble valoir la peine, mais faudrait analyser cost-benefit et termes de computing power.

jflucier commented 2 years ago

jai potentiellement trouver mieux copmme methode, en train de tester ca.

https://github.com/SchulzLab/ORNA

je vais tester les 3 algo ORNA et comparer avec un coassemblage de 3 echantillons avec les donnee brute.

jflucier commented 2 years ago

ORNA no good see https://docs.google.com/presentation/d/1CYJNg4vG7fOjYp6OLXl0Ig_CLDBRqeVCn7bDHVofvjc/edit?usp=sharing