Closed jflucier closed 1 year ago
je veux seulement conserver les lignes qui contiennent un seul niveau taxonomique pour créer une table d'abondance qui va servir aux analyses subséquentes. On peut seulement faire celle au niveau |s__ (et on veut aussi garder le header)
ah, la lettre devrait être minuscule c'est peut-être pour ça que ça ne fonctionne pas?! dans tous les cas, seulement besoin de |s__ donc pas besoin de looper sur tous les niveaux avec une variable
ouin j'vais deja fabrique le script. Il est maintenant dispo et fopnctionnel
commit id 271e984
jai egalement updater la doc pour expliquer comment tourner le script qui genere les tables pour tout les levels taxonomique, ca ressemble a ca:
export TAXONOMIC_ALL_LEVEL=(
"D:domains"
"P:phylums"
"C:classes"
"O:orders"
"F:families"
"G:genuses"
"S:species"
)
out=test
tmp=test/temp
for taxa_str in ${TAXONOMIC_ALL_LEVEL[@]}
do
taxa_code=${taxa_str%%:*}
taxa_name=${taxa_str#*:}
echo "generating taxonomic table for taxonomic level $taxa_name --> $taxa_code"
kreports="/nfs3_ib/ip29-ib/ip29/ilafores_group/projet_PROVID19/taxKB_conf01_jfl/*/*_bracken/*_"$taxa_code".kreport"
# echo $kreports
bash $ILL_PIPELINES/scripts/taxonomic_table.allsamples.sh \
--kreports "$kreports" \
--taxa_code $taxa_code \
--out $out \
--tmp $tmp
done
enjoy!
@jorondo1
cette ligne du script ne semble pas fonctionner correctement
C quoi exactement tu essaie de grepper dans le fichier temp_${taxa_oneletter}.tsv?
Si je regarde ce fichier je vois:
L'output dans le fichier
#Classification GQ10 GQ11 GQ12 GQ13 GQ14 GQ15 GQ16 GQ17b GQ18 GQ19 GQ1
Dans cet exemple, le taxa_oneletter est C. Voici le code pour tester le script:
Essaie-tu de grpper pour les lignes qui ont "|c__" et qui ne sont pas a 0?