nanls / M2BI-db-project

1 stars 1 forks source link

Db diagram #19

Closed nanls closed 7 years ago

nanls commented 7 years ago

About #1 and close #14.

Concernant le nouveau bis modele proposé : on peut utiliser les outils des profs !! :D

Concernant le nouveau modèle proposé : (suppose que pour #2, on n'utilise pas les scripts ./extract_method2SEQ2D.pl fournis, car ils concatènent les résultats de toute les chaînes de la structure dans la même string...).

Un PDB a un id. Grâce au parseur (si c'est possible avec celui que @jecarvaill a utilisé), le header est splitté en plusieurs champs. (pour le moment, j'ai indiqué les champs qu'il est possible de parser avec Bio.PDB).

Un PDB a plusieurs chaînes. Chaque chaîne a un id (un auto incrément :question: , ou celui que l'on trouve dans le fichier PDB ? (je ne me souviens plus de si on s'était dit qu'on risquait des doublons ou pas. Et sinon, ça pourrait ne pas être un id qui soit 'sémantiquement' correcte, mais plus un repère pour les séquences continue (sans gap, si les outils de prédiction gère cela). et une séquence (récupérée grâce au parsing, qui du coup correspondraient soit à des sequences de chaine, soit à des out de séquence continue, selon ce qu'on choisit).

Ces chaînes (sémantiques, ou bout de séquences continues):