Kunstenpunt / havelovewilltravel

A data management environment for havelovewilltravel.be
Apache License 2.0
1 stars 0 forks source link

batch script to detect vague festivals that actually have a precise counterpart #344

Closed ruettet closed 3 years ago

ruettet commented 4 years ago

bijvoorbeeld image

of

image

ruettet commented 3 years ago

een vergelijkbaar script staat hier: https://github.com/Kunstenpunt/havelovewilltravel/blob/master/hlwtadmin/management/commands/clean_duplicated_relations.py

ruettet commented 3 years ago

de voorzet van dirk https://github.com/Kunstenpunt/havelovewilltravel/blob/master/hlwtadmin/management/commands/merge_more_vaguely_dated_counterparts_of_existing_concerts.py kan efficienter, denk ik: kan dat niet een pak efficienter als je enkel itereert door concerten met een "until_date is not None", en dan voor elk van die concerten een concert zoekt met een specifieke datum binnen de begin en end van het initiele concert (+ zelfde artiest + zelfde organisatie)? Da's een veel kleinere search space, toch? In principe heb je dan in 1 pass niet alles opgelost, maar het is een recurrent bash script, dus bij een tweede run heb je de overblijvende vage concerten, en bij een derde run de nog overblijvende

ddehertog commented 3 years ago

Langs de andere kant, dit loopt een enkele keer en vindt alles. Maakt het uit dat dit een half uur loopt 's nachts?Op 10 mrt. 2021 14:22 schreef "Tom R." @.***>: de voorzet van dirk https://github.com/Kunstenpunt/havelovewilltravel/blob/master/hlwtadmin/management/commands/merge_more_vaguely_dated_counterparts_of_existing_concerts.py kan efficienter, denk ik: kan dat niet een pak efficienter als je enkel itereert door concerten met een "until_date is not None", en dan voor elk van die concerten een concert zoekt met een specifieke datum binnen de begin en end van het initiele concert (+ zelfde artiest + zelfde organisatie)? Da's een veel kleinere search space, toch? In principe heb je dan in 1 pass niet alles opgelost, maar het is een recurrent bash script, dus bij een tweede run heb je de overblijvende vage concerten, en bij een derde run de nog overblijvende

—You are receiving this because you were assigned.Reply to this email directly, view it on GitHub, or unsubscribe.