kantale / OpenBio.eu

An Open Collaborative Scientific Environment
BSD 3-Clause "New" or "Revised" License
7 stars 6 forks source link

Add / Explore Ontologies: EDAM Ontology, Software Ontology #6

Open kantale opened 6 years ago

kantale commented 6 years ago

Assigned to: Alex + Leuteris

koumakis commented 6 years ago

Both focus on biomedical informatics software. SWO adopted and extended EDAM. According to the publication of SWO "EDAM does not cover software and related software items like algorithms and licenses" But it looks like that the SWO is not active. Bioportal data for SWO (Latest version 02/2017 average visitor ~110) while the Bioportal data for EDAM (Latest version 08/2018 and has average visits per month ~1400)

potamias commented 6 years ago

... κοίταξα λίγο της SWO και φαίνεται ότι είναι πιο "πλούσια" από την EDAM με επιπλέον  κλάσσεις, π.χ.:

και

οπότε, ΝΑΙ μάλλον θα πρέπει να πάμε με την SWO.

... μια ερώτηση: ΠΟΙΟΙ ΒΛΕΠΟΥΝ ΤΗΝ ΑΠΑΝΤΗΣΗ ΣΕ ΑΥΤΟ ΤΟ EMAIL ??? ΟΛΟΙ ???

Γ.

On 9/24/18 9:02 PM, koumakis wrote:

Both focus on biomedical informatics software. SWO adopted and extended EDAM. According to the publication of SWO https://jbiomedsem.biomedcentral.com/articles/10.1186/2041-1480-5-25 "EDAM does not cover software and related software items like algorithms and licenses" But it looks like that the SWO is not active. Bioportal data for SWO https://bioportal.bioontology.org/ontologies/SWO/?p=summary (Latest version 02/2017 average visitor ~110) while the Bioportal data for EDAM https://bioportal.bioontology.org/ontologies/EDAM (Latest version 08/2018 and has average visits per month ~1400)

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/kantale/OpenBioC/issues/6#issuecomment-424068753, or mute the thread https://github.com/notifications/unsubscribe-auth/AHkJ5KLAF4l4LOuH20Fe00NVck23v59Bks5ueR5FgaJpZM4WqTMu.

-- George Potamias Principal Investigator FORTH (Foundation for Research & Technology - Hellas) ICS (Institute of Computer Science) N. Plastira 100 Vassilika Vouton GR-700 13, Heraklion, Creete Greece Tel (job): (+30) 2810 391693 Mobile: (+30) 6974648090 Email: potamias at ics dot forth fot gr URL: http://www.ics.forth.gr/~potamias/GeorgePotamias.htm

potamias commented 6 years ago

... κοίταξα λίγο της SWO και φαίνεται ότι είναι πιο "πλούσια" από την EDAM με επιπλέον κλάσσεις, π.χ.: "Information Content Entity", "process", ... οπότε, ΝΑΙ μάλλον θα πρέπει να πάμε με την SWO. Γ.

kantale commented 6 years ago

Ερώτηση: Γιατί να πρέπει να χρησιμοποιήσουμε ΜΙΑ οντολογία και όχι πολλές user specified ontologies? Δηλαδή:

@koumakis Πότε θα είσαι στο γραφείο να το συζητήσουμε; (Εγώ θα είμαι από Δευτέρα 1 Οκτ).

koumakis commented 6 years ago

Μπορούμε να εχουμε πολλες οντολογίες.
Επίσης ο χρήστης θα μπορεί (?) να δώσει tags που δεν ανοίκουν υποχρεωτικά σε οντολογία. Αυτο που ειχα κατα νου είναι ενα service που θα προτείνει concept terms σύμφωνα με μια περιγραφή. Σε αυτο πρέπει να έχουμε ορίσει την/τις οντολογίες... Απο εμπειρία μπορώ να πω οτι αν βαλουμε πολλές οντολογίες το service αυτο θα δίνει πολλά irrelevant terms και αν βαλουμε ενα strict threshold θα έχουμε high precision but low recall Επίσης αν είναι να κανουμε ενα bulk import με tools (e.g. απο το bio.tools) αυτο το service θα μας δώσει semantics. @kantale Επιστρέφω Πέμπτη βράδυ, θα ελεγα να κανουμε μια συναντηση Δευτερα κατα τις 13:00 που είναι ελεύθερη και η αιθουσα συναντήσεων.

kantale commented 6 years ago

οκ για Δευτέρα 13:00!

potamias commented 6 years ago

ok kai apo emena (stiw 15:00 exoume ti sinantisi MIAK).

=> peri 1,2,3,... ontologies !!! Ola ta components enos WF (data, tools, people, groups, links .... .... ...) eite/kai opoiodhpote RESOURCE (p.x., stack-overflow, biostars sizitiseis, github ... ...)  (prepei na/tha) einai ONTOLOGY-based ANNOTATED ... kai tha prepei na ANTISTOIXIZETAI/REPRESENTED ME VASH TA TYPES THS SWO :

KAI TA SUB-types, p.x., "information content entity" =>  "algorithm" => "k-means" .... ... KAI PROFANWS MPOREI O K-MEANS NA EINAI ERGALEIO ANALYSHS KAI GIA "BIOLOGY" kai gia "CHEMISTRY"

TO VASIKO THEMA EINAI GIA TA SWO-(sub-)TYPES TA TERMINOLOGIES POU THA XRHSIMOPOIHSOUME WSTE NA MPOROUME ME POS-tagging/NER/... NA ENTOPIZONTAI KAI NA KATHGORIOPOIOUNTAI TA terms/words/ ...

... ta leme kai apo konta

G.

On 9/26/18 1:41 PM, Alexandros Kanterakis wrote:

οκ για Δευτέρα 13:00!

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/kantale/OpenBioC/issues/6#issuecomment-424669280, or mute the thread https://github.com/notifications/unsubscribe-auth/AHkJ5L1fJxhSNhBfZvWZHcEe93Q0Clwzks5ue1ncgaJpZM4WqTMu.

-- George Potamias Principal Investigator FORTH (Foundation for Research & Technology - Hellas) ICS (Institute of Computer Science) N. Plastira 100 Vassilika Vouton GR-700 13, Heraklion, Creete Greece Tel (job): (+30) 2810 391693 Mobile: (+30) 6974648090 Email: potamias at ics dot forth fot gr URL: http://www.ics.forth.gr/~potamias/GeorgePotamias.htm

kantale commented 6 years ago

Έχω φτιάξει ένα dataset με 25 πραγματικές ερωτήσεις / απαντήσεις. Είναι μόνο από το seqanswers συγκεκριμμένα πήγα από τα πιο πρόσφατα entries και κοίταγα ποια είχαν να κάνουν με ερωτήσεις όπου οι χρήστες ρωτούσαν ποια εργαλεία να χρησιμοποιήσουν. http://seqanswers.com/forums/archive/index.php/f-18.html

Στη συνέχεια έκανα manual tag τα εργαλεία.

Το dataset είναι εδώ: https://github.com/kantale/OpenBioC/blob/master/OpenBioC/data/questions.json

Είναι σε μορφή json Κάθε entry έχει title, id, link, questions, answers

Ένα post έχει: user, data, text, tools Τα tools είναι λίστα με tools τα οποία γίνονται reference στο text Τα tools είναι σημειωμένα στο text με: %%TOOL_NAME%%

Ένα question είναι ένα post Τα answers είναι μία λίστα από posts

Σκοπός είναι να τα φτάσω στα 100 αλλά θέλει πολύ.. manual work.. (to be continued) Προς το παρόν νομίζω είναι αρκετά για να τεστάρετε κάποια πράγματα.