Concernant ce nouveau bis modele proposé :
on peut utiliser les outils des profs !! :D
Concernant le nouveau modèle proposé :
on peut utiliser les scripts ./extract_method2SEQ2D.pl fournis,
ils concatènent les résultats de toute les chaînes de la structure dans la même string...
Un PDB a un id.
Grâce au parseur (si c'est possible avec celui que @jecarvaill a utilisé), le header est splitté en plusieurs champs. (pour le moment, j'ai indiqué les champs qu'il est possible de parser avec Bio.PDB).
Un PDB a plusieurs chaînes.
Chaque chaîne a un id (un auto incrément :question: , ou celui que l'on trouve dans le fichier PDB ? (je ne me souviens plus de si on s'était dit qu'on risquait des doublons ou pas. Et sinon, ça pourrait ne pas être un id qui soit 'sémantiquement' correcte, mais plus un repère pour les séquences continue (sans gap, si les outils de prédiction gèrent cela).
et une séquence (récupérée grâce au parsing / aux scripts des profs, qui du coup correspondraient soit à des sequences de chaine, soit à des out de séquence continue, selon ce qu'on choisit).
Ces chaînes (sémantiques, ou bout de séquences continues):
une fois analysée par les outils d'annotations, auraient une entrée pour chaque méthode dans la table annotation.
pour chaque Ca de la chaine, on stocke la valeur phi et phi du Ca (pour le premier et le dernier Ca de la chaîne, il y en a un des deux qui est NULL).
About #1 and close #14.
Concernant ce nouveau bis modele proposé : on peut utiliser les outils des profs !! :D
Concernant le nouveau modèle proposé : on peut utiliser les scripts
./extract_method2SEQ2D.pl
fournis, ils concatènent les résultats de toute les chaînes de la structure dans la même string...Un PDB a un id. Grâce au parseur (si c'est possible avec celui que @jecarvaill a utilisé), le header est splitté en plusieurs champs. (pour le moment, j'ai indiqué les champs qu'il est possible de parser avec Bio.PDB).
Un PDB a plusieurs chaînes. Chaque chaîne a un id (un auto incrément :question: , ou celui que l'on trouve dans le fichier PDB ? (je ne me souviens plus de si on s'était dit qu'on risquait des doublons ou pas. Et sinon, ça pourrait ne pas être un id qui soit 'sémantiquement' correcte, mais plus un repère pour les séquences continue (sans gap, si les outils de prédiction gèrent cela). et une séquence (récupérée grâce au parsing / aux scripts des profs, qui du coup correspondraient soit à des sequences de chaine, soit à des out de séquence continue, selon ce qu'on choisit).
Ces chaînes (sémantiques, ou bout de séquences continues):