issues
search
Envinorma
/
envinorma-data
Python library for manipulating enriched versions of regulation texts
MIT License
4
stars
0
forks
source link
Explorer l'exploitabilité des AP .pdf cherchable
#34
Closed
remidbs
closed
3 years ago
remidbs
commented
3 years ago
[x] convertisseur pdf -> docx
[x] utils pour manipuler le xml des docx
[x] détection des titres
[ ] détection du nom de l'AP
[ ] détection du début de l'AP (après les VU/CONSIDERANT, sans sommaire)
[ ] convertisseur docx -> StructuredText