Legilibre / Archeo-Lex

Pure Histoire de la Loi française – Git + Markdown
https://archeo-lex.fr
Do What The F*ck You Want To Public License
98 stars 17 forks source link

Stocker dans la base de données certaines métadonnées #22

Closed Seb35 closed 6 years ago

Seb35 commented 7 years ago

Il y a dans la base LEGI-XML certaines métadonnées intéressantes comme les liens, mais peut-être également d’autres. Ces métadonnées ne serviraient probablement pas dans une version “texte brut” mais seraient intéressantes à exploiter dans des versions “texte enrichi” ou “machine-readable”.

Les premières étapes seraient :

Dans un second temp, on pourra envisager de réutiliser ces métadonnées pour améliorer #2 et #18.

Dans un troisième temps, dans le cadre d’Archéo Lex ou pas (plutôt “pas” en fait), on pourrait comparer les résultats obtenus selon les deux méthodes (source officielle et reconstruction heuristique), et en fonction des cas améliorer les heuristiques ou rapporter l’erreur de liens à la DILA – selon que c’est un faux positif ou un faux négatif en fait – et dans ce cadre ça rentrerait dans le cadre de legi.py (@Changaco).

Je mentionne cette feature ici parce qu’il faut bien le mettre quelque part et que c’est d’intérêt pour Archéo Lex, mais ça rentrerait dans un projet plus global à Légilibre d’avoir une structure de base de données commune entre les différents projets.

Changaco commented 7 years ago

Pour info legi.py a déjà une table liens, qui est une des plus grosses d'ailleurs (5564793 lignes aujourd'hui), et normalement toutes les autres métadonnées sont aussi dans la base (si je n'en ai pas oublié). Cependant legi.py n'utilise pas encore la table liens (https://github.com/Legilibre/legi.py/issues/4).

Seb35 commented 6 years ago

Je ferme cette issue vu qu’Archéo Lex n’a plus de base de données en propre, et legi.py a effectivement certaines données comme les liens.