nanls / M2BI-db-project

1 stars 1 forks source link

Db diagram #24

Closed nanls closed 7 years ago

nanls commented 7 years ago

About #1 and close #14.

Concernant ce nouveau bis modele proposé : on peut utiliser les outils des profs !! :D

Concernant le nouveau modèle proposé : on peut utiliser les scripts ./extract_method2SEQ2D.pl fournis, ils concatènent les résultats de toute les chaînes de la structure dans la même string...

Un PDB a un id. Grâce au parseur (si c'est possible avec celui que @jecarvaill a utilisé), le header est splitté en plusieurs champs. (pour le moment, j'ai indiqué les champs qu'il est possible de parser avec Bio.PDB).

Un PDB a plusieurs chaînes. Chaque chaîne a un id (un auto incrément :question: , ou celui que l'on trouve dans le fichier PDB ? (je ne me souviens plus de si on s'était dit qu'on risquait des doublons ou pas. Et sinon, ça pourrait ne pas être un id qui soit 'sémantiquement' correcte, mais plus un repère pour les séquences continue (sans gap, si les outils de prédiction gèrent cela). et une séquence (récupérée grâce au parsing / aux scripts des profs, qui du coup correspondraient soit à des sequences de chaine, soit à des out de séquence continue, selon ce qu'on choisit).

Ces chaînes (sémantiques, ou bout de séquences continues):