Lijst met URL's van processen-verbaal van verkiezingen, maar niet de documenten zelf.
Dit maakt het makkelijker ze te downloaden.
Installeer jq.
Download alle processesen-verbaal voor de gemeentes die aan dit project zijn toegevoegd:
./download.sh
Mocht je een foutmelding krijgen, probeer het commando opnieuw. Gemeentes die reeds compleet zijn. worden niet opnieuw gedownload.
Voor de volgende gemeenten is een apart commando nodig:
./overige-gemeentes.sh
Voor Leiden dient handmatig een zip bestand gedownload te worden, zie issue #68
Roermond (issue #56) en Assen (issue #55) gebruiken Google Drive en Stack Storage, dus moeten ook handmatig gedownload worden.
De sha256 hashes van alle processen-verbaal staan in Timestamps/2023-TK.asc, als volgt:
find * -type f -not -path '**/*.DS_Store' -not -path '*.txt' -exec shasum -a 256 {} \; | sort -k 2 --version-sort > 2023-TK
gpg --clear-sign 2023-TK
Daarnaast heb ik een timestamp gemaakt, welke te verifieren is op opentimestamps.org of met ots-client en je eigen Bitcoin node:
ots verify 2023-TK.asc.ots
Success! Bitcoin block 818632 attests existence as of 2023-11-26 CET
Meestal als volgt:
Zoek de processen-verbaal op de site van de gemeente:
a) via de links van Kiesraad hier; of
b) Google "[gemeente] processen-verbaal tweede kamerverkiezingen 2023"
Kopieer de URL van de pagina met de tabel van processen-verbaal
Controleer of hij te verwerken is: ./urls-from-html.py https://www.[gemeente].nl/verkiezingen/processen-verbaal-.../
: zie je een lijst met PDF's?
Zoek het .txt bestand voor de gemeente, bv. "0034 Utrecht.txt"
Sla op: ./urls-from-html.py https://utrecht.nl/... | uniq > 2023-TK/0034\ Utrecht.txt
Download de documenten: ./download.sh
Controleer één of meer PDF-bestanden om te zien of de download gelukt is
Commit: zet de URL in de commit message
Maak een pull request
(Optioneel): voeg het gebruikte download commando toe aan scrape-urls.sh
Om te zien welke gemeentes nog ontbreken:
./progress.sh
N.B. sommmige in deze lijst hebben wel processen-verbaal gepubliceerd, maar die zijn niet via een rechtstreekse URL te benaderen.
.pdf
toe om ze te bekijken