common-voice / commonvoice-fr

Tooling for producing French dataset for Common Voice
100 stars 24 forks source link

Corrections diverses sur Corpora Creator #20

Open lissyx opened 5 years ago

lissyx commented 5 years ago

cf le travail de @nicolaspanel https://github.com/mozilla/CorporaCreator/pull/87

Quelques éléments :

drzraf commented 3 years ago

Pourquoi mozilla/CorporaCreator#87 n'a-t-il finalement jamais été mergé malgré le travail entrepris ?

lissyx commented 3 years ago

Pourquoi mozilla/CorporaCreator#87 n'a-t-il finalement jamais été mergé malgré le travail entrepris ?

Parce qu'il y avait encore du travail, et que la personne qui le faisait ne bosse plus autour de ces thématiques et que personne n'a repris la suite.

CapitainFlam commented 2 years ago

PS : I'am a noob, please don't shoot neither shout at me 😅

@lissyx Juste pour clarifier, il s'agit "juste" de supprimer/modifier les quelques lignes en commentaire de @kdavis-mozilla dans https://github.com/common-voice/CorporaCreator/pull/87/files/149e960692bdc734ccb56e13ff7e71ba4c96f8ae ?

Parce que, si je suis incapable n'ai pas encore codé en python, ni réalisé de commit, et bien, en relisant le code, les commentaires et les discussions, je pense que 99% du boulot est fait, non ? Sous entendu, si on fait que ce propose @kdavis-mozilla, en supprimant le code mort et en commentant le code pour les chiffres (pour le jour où les chiffres reviennent), ça pourrait le faire ?

...et au pire on ouvre une nouvelle issue pour ce qui n'est pas encore implémenté, mais le système de contrôle / correction des abréviation est bon, non ?

ou en fait, le code d'il y a deux ans a tellement changé depuis qu'on n'a plus qu'à tout jeter ? (le bébé avec l'eau du bain) et/ou repartir from scratch ?

Edit : erreur de clic, commentaire envoyé trop vite 😅 ...Je termine.

lissyx commented 2 years ago

@CapitainFlam Oui il suffirait de faire ça sauf que:

Donc pas sûr que tout soit à jeter, il faut regarder en détails