jeantil / admission_post_bac

163 stars 17 forks source link

jeu de donnée #19

Open sbuisson opened 8 years ago

sbuisson commented 8 years ago

tout est dans le titre: vous auriez des exemples de jeux de données?

inattendu commented 8 years ago

Non ; c'est d'ailleurs une bonne partie du problème. Il faut pour le moment faire du reverse.

Pour des raisons évidentes de confidentialité, un jeu de donnée officiel ne sera jamais publié, mais il est prévu de faire la demande d'un jeu "fake" ou au moins de la structure. (à suivre dans le wiki)

piwai commented 8 years ago

Vu qu'effectivement on aura jamais un vrai jeu de données, je me demandais dans quelle mesure on pourrait réutiliser ce simulateur: https://github.com/arnaudriegert/comprendre-apb et brancher la partie sql à la place du modèle existant. Bien sur il faudra sans doute adapter le code pour enlever toutes les features spécifiques Oracle. @arnaudriegert: un avis sur la faisabilité de la chose?

sbuisson commented 8 years ago

Meme un truc de tests? J'ai déjà travaillé sur des données confidentielles "réelles" qui avaient été "obfuscées" pour les confidentialiser.

Mais bon, quand on voit comment on a recu le code à la base :$

inattendu commented 8 years ago

Le simulateur n'est qu'une application issue d'une interprétation de la théorie publiée précédemment. @piwai : Je doute qu'on puisse garantir la reconstruction d'un jeu de donnée à partir de celui ci. Par contre si on obtient les sources de http://www.simulation-apb.fr/, ce sera plus parlant.

Pourquoi ré-ouvrir ? je ne comprend pas le rapport.

@sbuisson : L'enjeu est de construire une nouvelle demande à l'éducation nationale. Un jeu de donnée "Fake" fait déjà partie de ce qui va être demandé ; CF : https://github.com/jeantil/admission_post_bac/wiki

piwai commented 8 years ago

@inattendu : C'était juste que de ce que j'ai cru voir de l'application, elle pourrait peut-être faciliter la création d'un faux jeu de données (en attendant mieux)

jpotier commented 8 years ago

Une ébauche de création de table a été mergé ; reste à la compléter, c'est un premier pas vers un jeu de données factice.

jferard commented 8 years ago

Un problème lié à ce jeu de données factices est celui des possibles valeurs négatives au niveau de l'ordre des voeux, mentionné en https://github.com/jeantil/admission_post_bac/issues/12. Une fois que la structure des tables est "découverte", comment déterminer ce qui devrait s'y trouver (en particulier les fourchettes de valeurs) ?

IBG2016 commented 8 years ago

Bonjour J'ai essayé le site officiel de simulation http://www.simulation-apb.fr/ Je voulais regarder comment ils formalisaient le fait de classer les voeux. Person, cela m'étonnerait que les voeux soient en négatif dans le système, cela semble tellement plus compliqué à gérer le changement de l'ordre quand on ajoute un voeu et c'est moins intuitif. Mais bien que je dispose d'un numéro d'INE (élève de 1ére, donc ça tombe bien, il est censé pouvoir s’entraîner ), je n'ai pas de numéro OCEAN. Avez-vous une idée de la structure du numéro ? Je ne pense pas que l'outil vérifie la donnée elle-même, juste la structure. Merci

khena commented 8 years ago

Je suis entièrement d'accord avec @IBG2016 , les codes négatifs, franchement, je veux bien que plus rien ne nous surprenne vu la qualité du code, mais franchement, à moins d'avoir une très bonne raison qui nous échappe, c'est une faute professionnelle là.

AxelVoitier commented 8 years ago

On ne sait pas comment marche l'esprit du developpeur. Certaines personnes arrivent sans probleme a reflechir en "anti-normal", en contre-intuitif, simplement parce qu'eux, a l'inverse de la majorite qui definie le normal et le naturel, arrivent a se representer des algorithmes marchant aussi bien en positif qu'en negatif, dans un sens ou dans un autre. Ca peut etre un raccourci alambique pour resoudre un probleme qui aurait peut etre etre pu resolu d'une facon plus explicite, mais qui ne collait pas a la facon de reflechir du developpeur.

Aussi, ne pas oublier la possibilite que les voeux soit bien en positif, et que le cas du zero en premier soit resolu en post-traitement.

Edit : dans un post-traitement qui nous est inconnu ;).

arnaudriegert commented 8 years ago

Bonjour, et merci à @piwai de m'avoir fait signe :)

Le projet que j'ai lancé au moment de la publication de la première partie de l'algorithme a pour but de faire une reconstitution d'APB, dans un langage plus compréhensible que le SQL qui vient d'être diffusé pour que les développeurs, chercheurs et autres enthousiastes puissent se l'approprier, le forker, etc., ainsi que d'avoir une application web permettant de faire des simulations.

Je vais travailler ce week-end pour essayer de comprendre le code et mettre à jour mon dépôt. J'ai l'habitude de certaines bases de l'Éducation nationale, cela m'aidera peut-être à démêler certaines choses.

En termes de jeu de données, il y a un travail en cours au ministère pour mettre à disposition une version partielle la base APB (qui sera bien sûr anonymisée) auprès de chercheurs et peut-être du grand public. Je vous tiens au courant lorsque j'ai plus d'informations communicables à ce sujet.