contigs functional annotation with kofamscan

jorondo1 commented 2 years ago

J'aimerais pouvoir monter un script où j'utiliserais Prodigal 2.6.3, Kofamscan 1.3.0 et KEGG-decoder 1.2.2. Je m'inspire de ce tuto que j'ai essayé pendant mon cours. Si t'as besoin de voir mon script je te l'enverrai mais il n'est pas tout à fait fini.

jflucier commented 2 years ago

Mon opinion,

on devrait utilise prokka au lieu de prodigal pour predire le proteome. Ensuite, on passe le fasta de proteine predit a roary et kofamscan+keggdecoder

Ca sert a rien de rouler prodigal et prokka en parralele... tu obtiendras pas vraiment plus d'info. Ca complexifie les post-analyse pour rien.

jorondo1 commented 1 year ago

En fait la première étape de prodigal est de rouler prokka pour créer des fasta de protéines prédites, après quoi ces fichiers sont cherchés contre différentes db

pourrais-tu me montrer comment partir prokka indépendamment de notre pipeline, je veux rouler kofamscan sur des contigs déjà assemblés, c'est le projet d'une autre collègue

jflucier commented 1 year ago


module load StdEnv/2020

conda activate roary
export PERL5LIB=/project/def-ilafores/miniconda3/envs/roary/lib/site_perl/5.26.2/lib/perl5:/project/def-ilafores/miniconda3/envs/roary/lib/site_perl/5.26.2

## exemple pour boucler sur tes echantillons
genome=genomes/NC_008278.gb
for read in contigs/*.fasta
do
    file=$(basename $read)
    sample=${file%.fasta}
    echo $sample
    mkdir -p annotation/$sample
    prokka --force --cpus 30 --outdir annotation/${sample} \
    --prefix ${sample} --proteins $genome \
    contigs/${sample}.fasta
done

# exec roary sur annot prokka
roary -p 32 -f out_roary/ -e -n -v annotation/*.gff

Pour prokka, le parametre genome n'est pas obligatoire. Ceci est pour specifier un genome de reference pour matcher dessus dans une premiere passe.

jorondo1 commented 1 year ago

merci, est-ce que kofamscan et keggdecoder sont accessible aussi ? je suis good pour les commandes, mais est-ce que je dois les activer pour les utiliser?

jflucier commented 1 year ago

non pas encore installer ca.

va essayer de faire ca aujourd'hui.

jflucier commented 1 year ago

pour rouler kofam_scan:

module load StdEnv/2020
export MUGQIC_INSTALL_HOME=/cvmfs/soft.mugqic/CentOS6
module use $MUGQIC_INSTALL_HOME/modulefiles

module load mugqic/hmmer/3.1b2
/project/def-ilafores/common/kofam_scan/exec_annotation -h

jflucier commented 1 year ago

pas ete facile ce dernier install.

Pour utilise keggdecoder:

conda activate keggdecoder
KEGG-decoder -h

jorondo1 commented 1 year ago

merci beaucoup est-ce que je peux activer ces trois modules dans le même script, dans un seul header? Si non, quel est le meilleur moyen de travailler avec prokka + kofamscan + keggdecoder dans un même script ?

jflucier commented 1 year ago

Pour te simplifier la vie, jai tout installe sous un meme environnement.

module load StdEnv/2020
conda activate keggdecoder
prokka -h
/project/def-ilafores/common/kofam_scan/exec_annotation -h
KEGG-decoder -h

jorondo1 commented 1 year ago

le config.yml de kofamscan est vide, je peux define --cpu, -k et -p dans ma commande mais je pense que je dois pointer vers hmmsearch et parallel, où sont-ils ?

jorondo1 commented 1 year ago

Je crois les avoir trouvés, dans /project/def-ilafores/miniconda3/envs/keggdecoder/bin/

J'essaie de rouler exec_annotation sans succès, la commande stall et quand je regarde Top y'a aucune utilisation de CPU à travers le temps. L'avais-tu testée? Voici mon code:

export exec_annotation=/project/def-ilafores/common/kofam_scan/exec_annotation
export _in_dir=/nfs3_ib/ip29-ib/ip29/ilafores_group/rosaelle/syncom
export _bn=Leaf351
export _infile=$_in_dir/PRJNA297956_assembly2015/*${bn}*.fna
export _out_KO=${in_dir}/kofamscan_out

$exec_annotation $_infile --config config_test.yaml \
-f mapper \
-o $_out_KO/${bn}.txt

mon config file est ici ip29/ilafores_group/rosaelle/syncom/config_test.yaml

Bildschirmfoto 2022-09-16 um 11 19 57

jorondo1 commented 1 year ago

je me suis débogué, exec_annotation émet zero verbose mais j'ai réalisé que je pointais vers le mauvais infile, Désolé pour tout ça ! 🙃

jflucier commented 1 year ago

PTI, check aussi le screenshot, hmmsearch tourne a plusieurs threads mais a 0%,.... c pas trop ce que ce logiciel fait.

jflucier / ILL_pipelines

contigs functional annotation with kofamscan #37