Closed sebastic closed 2 years ago
Ik ben het met je eens. Ik heb het gevoel dat de LV BAG driver te overhaast ontwikkeld is, gezien de vele fixes. Helaas moet wel steeds GDAL weer worden geupgrade, om gebruik te kunnen blijven maken van de meest recente wijzigingen.
@fsteggink @sebastic gedeeltelijk mee eens: de LVBAG Driver is ontwikkeld door Laixer uit Delft en voldoet voor hun toepassing (iets met Panden). De verdere ontwikkeling is ook aan de community, en/of gesponsorde ontwikkeling. Voor NLExtract is inderdaad de situatie niet ideaal:
Het alternatief was om BAGv2 als custom ETL met Python/Stetl te ontwikkelen. Dat kan nog steeds. Voor mij persoonlijk was dit de snelste weg, goede samenwerking o.a. meetings, met Laixer, en werkt de huidige versie via de "latest" Docker Image voldoende. Heb zelf 2 PRs gesubmit/merged naar GDAL. Dat bleek behoorlijk mee te vallen: zelfs zonder multi-platform compilatie-keten, alles via GH Workflows.
Dit is eigenlijk meer een discussie voor de NLExtract mailing lijst/Gitter. m.i. is het nodig om een PSC te formeren, om meer richting/structuur te geven voor NLExtract/BAGv2 evolutie en te stemmen voor architecturele wijzigingen.
Laten we dit issue beperken tot welke GDAL versie (in de documentie) aangeraden wordt.
Met de recent opgedane kennis blijkt 3.2.2 niet meer te voldoen, daarom is de betreffende documentatie aangepast naar 3.4.0 (#335).
Omdat ik geen Docker infrastructuur op wil zetten tbv mijn gebruik van NLExtract, heb ik de betreffende changes in GDAL 3.4.0 in de Debian package in unstable opgenomen zodat dit nu al gebruikt kan worden tot de gdal transition (Debian Bug #998887) is afgerond. Ook heb ik een stable update van GDAL 3.2.2 Debian package voorbereid met de relevante changes in 3.3.0 & 3.4.0. Gebruikers van NLExtract op andere distributies zijn daarmee echter niet geholpen.
Verdere discussie wat BAGv2 support in NLExtract betreft is via de mailinglist of gitter inderdaad beter. Een PSC is denk ik nog niet nodig, de mensen die het werk in NLExtract uitvoeren bepalen de richting.
Een speciale update van GDAL 3.2.2. met de LV-BAG fixes is wel heel erg fijn. Geweldig! Voor mijn eigen verwerking ben ik laatst overgestapt naar Bullseye, maar ik liep tegen issues aan m.b.t. het gebruik van GDAL 3.3 op Bullseye, omdat er verschillende versies van libproj werden gebruikt, nl. één via GDAL zelf en één via libspatialite (zie https://github.com/OSGeo/gdal/issues/4731).
De records in de
woonplaats
tabel hebben geen waarde in deidentificatie
column waardoor deze niet gejoined kunnen worden met degemeente_woonplaats
tabel:Bovenstaande is met de data in
bagv2/etl/test/data/lv/BAGNLDL-15092020-small.zip
en GDAL 3.2.2 op Debian bullseye.In GDAL 3.3.0 zitten changes in de lvbag driver (https://github.com/OSGeo/gdal/pull/3324) waarmee wel
identificatie
waardes worden geladen, maar ook de column names worden aangepast:Bovenstaande is met dezelfde test data en GDAL 3.3.3 op Debian unstable.
Zou de minimum versie in
bagv2/etl/README.md
niet naar 3.3.0 moeten?In GDAL 3.4.0 zitten changes voor
woonplaatsRef
(num) enverkorteNaam
(opr), mogelijk moet de geadviseerde GDAL versie daarom zelfs 3.4.0 zijn?