Déjà, à la ligne 119 et 123, la fonction extract_anno est appelée sur exactement les mêmes données. On ne devrait pas appeler cette fonction sur les données nettoyées car la seule différence avec les données brutes est au niveau des nom (le identifiants ensembl devraient être identiques).
De plus, étant donnée que l'opération de mapIds est relativement longue, on devrait éviter de la répéter plusieurs fois. On devrait plutôt faire comme aux lignes 174 à 176 où on fait un sous-ensemble des données originales.
TODO:
[x] Remplacer les fonction extract_anno qui ne sont pas sur les données brutes soit par un filtre (i.e.: la fonction dplyr::filter) ou bien en utilisant un indice comme pour les lignes 174 à 176.
[x] Ajouter une validation dans la fonction save_anno_resuts pour s'assurer que les identifiants sont identiques pour le fasta et pour l'annotation (on doit retrouver exactement les mêmes identifiants, exactement dans le même ordre).
[x] Incrémenter la version du paquet dans le fichier DESCRIPTION.
La fonction
extract_anno
est appelée trois fois:Déjà, à la ligne 119 et 123, la fonction
extract_anno
est appelée sur exactement les mêmes données. On ne devrait pas appeler cette fonction sur les données nettoyées car la seule différence avec les données brutes est au niveau des nom (le identifiants ensembl devraient être identiques).De plus, étant donnée que l'opération de
mapIds
est relativement longue, on devrait éviter de la répéter plusieurs fois. On devrait plutôt faire comme aux lignes 174 à 176 où on fait un sous-ensemble des données originales.TODO:
extract_anno
qui ne sont pas sur les données brutes soit par un filtre (i.e.: la fonctiondplyr::filter
) ou bien en utilisant un indice comme pour les lignes 174 à 176.save_anno_resuts
pour s'assurer que les identifiants sont identiques pour le fasta et pour l'annotation (on doit retrouver exactement les mêmes identifiants, exactement dans le même ordre).DESCRIPTION
.