ntm / IDN

Interactomic data web navigator
0 stars 0 forks source link

import PPIs from intact et al, using psicquic in a cronjob #8

Closed ntm closed 10 years ago

ntm commented 10 years ago

on veut importer, de maniere minimaliste, les PPIs qui concernent au moins une prot ECM/Secreted/Membrane, en provenance de Intact et sans doute d'autres sources psicquic. Il faut donc:

  1. un parser mitab -> matrixdb, qui utilise des tags appropriés pour la source;
  2. un script qui
    • fasse des queries psicquic,
    • fasse une selection Quality Control (dans MIQL si possible, en post-traitement sinon) pour se limiter aux prots d'interet et se limiter aux PPIs "solides" et binaires et ignorer les PPIs qu'on a deja dans matrixdb (?),
    • parse le mitab obtenu avec 1,
    • sauve le .ace resultant quelque part (timestamped ace file).
    • un cronjob pour lancer ce script 2 regulierement, et soit le parse dans matrixdb_latest, soit nous avertisse pour qu'on puisse checker le fichier avant de le parser (au moins dans un premier temps).
ntm commented 10 years ago

SRB says we want to import PPIs from:

Import should be limited to ECM-relevant biomolecules as indicated above, but we should be taking into account the matrisome data for deciding which biomolecules are "ECM-relevant", see issue 9.

SRB says it would be nice to import protein-smallMolecule and protein-complex interactions in addition to PPIs, if it's not too complicated.

glaunay commented 10 years ago

BioGrid cant be reach through psicquic service. Other specs implemented see /home/matrixdb/DBimport