pchaigno / ra

Parallelized Java implementation of the APriori algorithm for association rule learning
MIT License
0 stars 0 forks source link

Première colonne du fichier tickets_caisse.txt #9

Closed pchaigno closed 10 years ago

pchaigno commented 10 years ago

J'ai l'impression que la première colonne du fichier tickets_caisse est sélectionnée (format_tickets_ra.pl)... Elle représente un identifiant, elle ne doit donc pas être sélectionnée sinon ça fausse tout, non ?

gwandalf commented 10 years ago

On peut l'ignorer ! En effet, la ligne de commande prend des options : 1 par colonne du fichier txt. Par exemple, Pour générer le fichier obtenu (qui lui est bon) :

perl ./format_tickets_ra.pl tickets_caisse.txt ignore 32 symbol symbol symbol 30000 -1 symbol symbol symbol symbol symbol symbol symbol symbol symbol symbol symbol

Mais c'est moche et fastidieux, j'en suis conscient. Je pense changer et faire en sorte que les types soient lus dans un fichier.

Le type "ignore" permet d'ignorer une colonne...

Gwendal

----- Mail original ----- De: "Paul Chaignon" notifications@github.com À: "pchaigno/ProjetRA" ProjetRA@noreply.github.com Envoyé: Dimanche 13 Avril 2014 19:50:14 Objet: [ProjetRA] Première colonne du fichier tickets_caisse.txt (#9)

J'ai l'impression que la première colonne du fichier tickets_caisse est sélectionnée ( format_tickets_ra.pl )... Elle représente un identifiant, elle ne doit donc pas être sélectionnée sinon ça fausse tout, non ?

— Reply to this email directly or view it on GitHub .

pchaigno commented 10 years ago

Ouah! J'avais pas du tout compris ça en lisant le script. C'est plutôt bien foutu :) Et actuellement la première colonne est ignorée dans les fichiers générés ?

Le script me semble bien comme ça mais il manque de commentaires (et d'un exemple d'usage en commentaire en haut pour les profs). De toute façon on a jusqu'à jeudi pour changer ça, la priorité c'est le rapport.

gwandalf commented 10 years ago

La première colonne est effectivement ignorée dans les fichiers générés.

----- Mail original ----- De: "Paul Chaignon" notifications@github.com À: "pchaigno/ProjetRA" ProjetRA@noreply.github.com Cc: "gwandalf" gwlemoul@insa-rennes.fr Envoyé: Lundi 14 Avril 2014 08:48:01 Objet: Re: [ProjetRA] Première colonne du fichier tickets_caisse.txt (#9)

Ouah! J'avais pas du tout compris ça en lisant le script. C'est plutôt bien foutu :) Et actuellement la première colonne est ignorée dans les fichiers générés ?

Le script me semble bien comme ça mais il manque de commentaires (et d'un exemple d'usage en commentaire en haut pour les profs). De toute façon on a jusqu'à jeudi pour changer ça, la priorité c'est le rapport.

— Reply to this email directly or view it on GitHub .

pchaigno commented 10 years ago

Cool :)