julibinho / VDJ-Kernel

0 stars 0 forks source link

Data? #4

Open Magicdjez opened 3 years ago

Magicdjez commented 3 years ago

Bonjour Juliana

Vous n'étiez pas censé mettre des datas pour le knn? ou je dois utilisez les fichiers déjà présent?

julibinho commented 3 years ago

Bonjour,

Nika, prépare les données, je vais la relancer aujourd'hui, désolé.

à+

On Tue, Feb 9, 2021 at 11:08 AM Djeser Kordon notifications@github.com wrote:

Bonjour Juliana

Vous n'étiez pas censé mettre des datas pour le knn? ou je dois utilisez les fichiers déjà présent?

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/julibinho/VDJ-Kernel/issues/4, or unsubscribe https://github.com/notifications/unsubscribe-auth/ACMJX7G4IF7NTMDEW7XC6RLS6ECQBANCNFSM4XKWBI6Q .

--


Juliana Silva Bernardes, Assistant Professor. Biologie Computationnelle et Quantitative Sorbonne Université, Paris, France http://www.lcqb.upmc.fr/julianab 01 44 27 73 62


Magicdjez commented 3 years ago

Ne vous inquiétez je me posais juste la question car je dois m'organiser car je fais beaucoup de chose à coté de la Fac

julibinho commented 3 years ago

Bonjour,

vous trouvez le premier jeu de donnée pour Machine Learning dans le répertoire data/database/ML/ vous avez trois fichiers qui simule trois répertoire immunitaires, dans chaque fichier un gène est représenté par deux ligne, la première contiens le identifieur du gène et la deuxième la séquence. Vous pouvez prendre deux fichiers pour l'entrainement du modèle et tester la performance sur le troisième, vous pouvez échanger les fichiers et faire trois combinaison.

Voici une librairie de ML pour python https://scikit-learn.org/stable/

Pour plus tard peut etre interessant de regarder aussi Pytorch, il y a un module sur le text https://pytorch.org/tutorials/beginner/transformer_tutorial.html

julibinho commented 3 years ago

On a mis a jours les données, vous avez plus de fichier maintenant, tous en même format.

Merci

Magicdjez commented 3 years ago

Bonjour Les gènes ne sont codés que sur une ligne lorsque je lis les documents. j'ai essayé modifier manuellement pour voir si c'était un problème qui venait de mon ordinateur mais ça marchais. Pourriez vous vérifiez?

julibinho commented 3 years ago

Vous avez raison, c'est une seul ligne separé par tabulation.

julibinho commented 3 years ago

Bonjour,

les donnees de genes D et J sont à data/database/ML/Data_VDJ.zip

bon courage