Open sebastic opened 2 years ago
Het onderliggende probleem lijk te zijn dat sql/finalize-tables.sql
faalt, in de meest recente run door gebrek aan disk space:
2021-11-22 17:28:17,843 chain INFO Running Chain: input_sql_post|output_postgres_sql
2021-11-22 17:28:17,843 fileinput INFO Read/parse for start for file=sql/finalize-tables.sql....
2021-11-22 17:28:17,891 fileinput INFO Read/parse ok for file=sql/finalize-tables.sql
2021-11-22 17:28:17,892 dboutput INFO executing SQL
2021-11-22 17:28:17,894 postgis INFO Connecting to dbname=bag-test user=bag host=dbserver port=5432
2021-11-22 17:28:18,044 postgis DEBUG Connected to database bag-test
2021-11-22 18:26:27,594 postgis ERROR error could not extend file "base/17240/485872.2": No space left on device
Stetl gaat vervolgens door met de andere acties in de chain die falen omdat de columns niet zijn renamed e.d.
M.i. zou stetl moeten stoppen wanneer een error voorkomt.
Waarom is gekozen het schema aan te passen om op BAG v1 te lijken?
De bulk van de data is in BAG v2 niet meer beschikbaar (aanduidingrecordinactief/aanduidingrecordcorrectie/officieel/inonderzoek), is het niet beter om het database schema zoveel mogelijk een directe match te laten zijn van de XML data wat door NLExtract verwerkt wordt zoals het ook voor BAG v1 was?
Applicaties die voor het BAG v1 schema ontwikkeld zijn moeten geport worden voor het nieuwe schema, dat is niet vreemd voor een nieuwe major versie.
M.i. zou stetl moeten stoppen wanneer een error voorkomt.
Ik schaar mij achter deze insteek: het wordt wat graven in de logs als stetl niet bij de eerste onherstelbare fout stopt, en het kost onnodig tijd waarbij het proces tevergeefs doorloopt. Ik denk dat dit vraagt om een wat andere benadering van de foutafhandeling in NLExtract of STETL.
M.i. zou stetl moeten stoppen wanneer een error voorkomt.
Ik kan me hier ook in vinden.
Het uitvoeren van een aantal SQL scripts door
etl.sh
faalt:Ook
adres.sh
faalt:Dit is met GDAL 3.3.3 op Debian unstable, en de (volledige)
lvbag-extract-nl.zip
data uit de Atom feed.