issues
search
Envinorma
/
envinorma-data
Python library for manipulating enriched versions of regulation texts
MIT License
4
stars
0
forks
source link
Explorer l'exploitabilité des AP
#30
Closed
remidbs
closed
3 years ago
remidbs
commented
3 years ago
[x] écrire un downloader d'AP
[x] download 1k AP
[x] écrire un détecteur de pdf searchable
[x] convertir manuellement 10 pdf en .odt -> plutot demander à récupérer des AP .odt
[x] écrire un extracteur de texte depuis un .odt
[x] appliquer la structuration dessus et évaluer la qualité
[ ] Rédiger une stratégie de prise en compte des AP
[ ] Essayer de trouver un moyen de traiter les PDF cherchables