Closed jorondo1 closed 1 year ago
Mon opinion,
on devrait utilise prokka au lieu de prodigal pour predire le proteome. Ensuite, on passe le fasta de proteine predit a roary et kofamscan+keggdecoder
Ca sert a rien de rouler prodigal et prokka en parralele... tu obtiendras pas vraiment plus d'info. Ca complexifie les post-analyse pour rien.
En fait la première étape de prodigal est de rouler prokka pour créer des fasta de protéines prédites, après quoi ces fichiers sont cherchés contre différentes db
pourrais-tu me montrer comment partir prokka indépendamment de notre pipeline, je veux rouler kofamscan sur des contigs déjà assemblés, c'est le projet d'une autre collègue
module load StdEnv/2020
conda activate roary
export PERL5LIB=/project/def-ilafores/miniconda3/envs/roary/lib/site_perl/5.26.2/lib/perl5:/project/def-ilafores/miniconda3/envs/roary/lib/site_perl/5.26.2
## exemple pour boucler sur tes echantillons
genome=genomes/NC_008278.gb
for read in contigs/*.fasta
do
file=$(basename $read)
sample=${file%.fasta}
echo $sample
mkdir -p annotation/$sample
prokka --force --cpus 30 --outdir annotation/${sample} \
--prefix ${sample} --proteins $genome \
contigs/${sample}.fasta
done
# exec roary sur annot prokka
roary -p 32 -f out_roary/ -e -n -v annotation/*.gff
Pour prokka, le parametre genome n'est pas obligatoire. Ceci est pour specifier un genome de reference pour matcher dessus dans une premiere passe.
merci, est-ce que kofamscan et keggdecoder sont accessible aussi ? je suis good pour les commandes, mais est-ce que je dois les activer pour les utiliser?
non pas encore installer ca.
va essayer de faire ca aujourd'hui.
pour rouler kofam_scan:
module load StdEnv/2020
export MUGQIC_INSTALL_HOME=/cvmfs/soft.mugqic/CentOS6
module use $MUGQIC_INSTALL_HOME/modulefiles
module load mugqic/hmmer/3.1b2
/project/def-ilafores/common/kofam_scan/exec_annotation -h
pas ete facile ce dernier install.
Pour utilise keggdecoder:
conda activate keggdecoder
KEGG-decoder -h
merci beaucoup est-ce que je peux activer ces trois modules dans le même script, dans un seul header? Si non, quel est le meilleur moyen de travailler avec prokka + kofamscan + keggdecoder dans un même script ?
Pour te simplifier la vie, jai tout installe sous un meme environnement.
module load StdEnv/2020
conda activate keggdecoder
prokka -h
/project/def-ilafores/common/kofam_scan/exec_annotation -h
KEGG-decoder -h
le config.yml de kofamscan est vide, je peux define --cpu, -k et -p dans ma commande mais je pense que je dois pointer vers hmmsearch et parallel, où sont-ils ?
Je crois les avoir trouvés, dans /project/def-ilafores/miniconda3/envs/keggdecoder/bin/
J'essaie de rouler exec_annotation sans succès, la commande stall et quand je regarde Top y'a aucune utilisation de CPU à travers le temps. L'avais-tu testée? Voici mon code:
export exec_annotation=/project/def-ilafores/common/kofam_scan/exec_annotation
export _in_dir=/nfs3_ib/ip29-ib/ip29/ilafores_group/rosaelle/syncom
export _bn=Leaf351
export _infile=$_in_dir/PRJNA297956_assembly2015/*${bn}*.fna
export _out_KO=${in_dir}/kofamscan_out
$exec_annotation $_infile --config config_test.yaml \
-f mapper \
-o $_out_KO/${bn}.txt
mon config file est ici ip29/ilafores_group/rosaelle/syncom/config_test.yaml
je me suis débogué, exec_annotation émet zero verbose mais j'ai réalisé que je pointais vers le mauvais infile, Désolé pour tout ça ! 🙃
PTI, check aussi le screenshot, hmmsearch tourne a plusieurs threads mais a 0%,.... c pas trop ce que ce logiciel fait.
J'aimerais pouvoir monter un script où j'utiliserais Prodigal 2.6.3, Kofamscan 1.3.0 et KEGG-decoder 1.2.2. Je m'inspire de ce tuto que j'ai essayé pendant mon cours. Si t'as besoin de voir mon script je te l'enverrai mais il n'est pas tout à fait fini.