provinciesincijfers / PinC-taakopvolging

Dagelijks werk aan provincies.incijfers.be door de medewerkers van Data & Analyse
1 stars 1 forks source link

Bronnenrijkdom #316

Closed VickyVB closed 1 year ago

VickyVB commented 2 years ago

Het feit dat bronnen (bv. Statbel, mvg_onderwijs, steunpunt_werk, ...) zijn die heel breed gaan, gaat bij het nieuwe infosysteem mogelijk voor onduidelijkheden zorgen. Moeten deze bronnen gesplitst worden? Zijn er regeltjes? Timing? bv. 'Statbel' is verbonden met

joostschouppe commented 2 years ago

Verdere opvolging via https://github.com/provinciesincijfers/PinC-taakopvolging/issues/318

joostschouppe commented 2 years ago

Huidige "regel": “Naam van de bron - naam van de verwerking | provincies.incijfers.be”

Tine-VB commented 2 years ago

Dus antwoord op de vraag van Vicky is: Statbel moet inderdaad opgesplitst worden over de verschillende verwerkingen. V1401 en v1402 kunnen dus samen in Statbel - Economische indicatoren | provincies.incijfers.be of zoiets (afgekort statbel_econ). En v2390 wordt dan bijvoorbeeld Statbel - Onderwijsniveau | provincies.incijfers.be (afgekort statbel_onderwijs).

joostschouppe commented 2 years ago

Zie ook https://github.com/provinciesincijfers/PinC-taakopvolging/issues/332 voor praktische gevolgen van deze complexiteit. Hoe spreken we af om snel de bronnen op te splitsen?

Tine-VB commented 2 years ago

Meest efficiënt lijkt mij dat jij (of Emilien) met iedereen even de bronnen overloopt waarvoor hij/zij verantwoordelijk is. Zo kan iedereen de inhoudelijke kennis over de bron inbrengen, maar blijft toch ook de uniformiteit gegarandeerd.

joostschouppe commented 2 years ago

Deze DataSources zullen gewist worden op 18/10, er zijn immers geen onderwerpen aan gekoppeld:

Data source code Name Info Url Description
sv_vos Statistiek Vlaanderen - Vlaamse Openbare Statistieken | provincies.incijfers.be    
provincies_sa_pv Provincie Oost-Vlaanderen, Antwerpen, Vlaams-Brabant en EOS | provincies.incijfers.be v2503_SA_zonnepanelen.pdf Afhankelijk van waar de gemeente gelegen is: Provincie Oost-Vlaanderen, Provincie Antwerpen, Provincie Vlaams-Brabant, EOS (waarbij EOS alle gemeenten van de provincie West-Vlaanderen bedient).
provincies_sa_gs Provincies Oost-Vlaanderen, West-Vlaanderen en Antwerpen | provincies.incijfers.be v2503_SA_groene_stroom.pdf Afhankelijk van waar de gemeente gelegen is: Provincie Oost-Vlaanderen, Provincie West-Vlaanderen en Provincie Antwerpen.
statbel_combi Statbel - statistische sectoren/officiële oppervlakte gemeenten | provincies.incijfers.be    
dep_omgeving_fluvius Fluvius via Departement Omgeving | provincies.incijfers.be v2501_energie_CO2_inventaris.pdf  
uitgedoofd (momenteel geen uitgedoofde data in swing) OPGELET: verouderde data | provincies.incijfers.be   Je zou deze data niet meer mogen zien. Is dat toch het geval, laat dit dan weten aan info@provincies.incijfers.be . We wijzen je dan de weg naar de correcte opvolger van deze reeks. Bezorg ons de link en/of een screenshot van waar je deze reeks precies zag.
vea_dep_omgeving Vlaams Energie- en Klimaatagentschap (VEKA) en Departement Omgeving| provincies.incijfers.be v2503_hernieuwbare_elektriciteitsproductie.pdf  
monumentenwacht (ondertussen wel in gebruik) Monumentenwacht Vlaanderen vzw v2911_objecten_abonnees_monumentenwacht.pdf Objecten en abonnees Monumentenwacht
dna_rijksregister dna_rijksregister    
joostschouppe commented 2 years ago

Overzicht van de bronnen volgens wat er nog moet gebeuren (Redactiegroep PinC > Kwaliteitscontrole > Controlebestanden)

Opties voor de Naam van de Bron die werd opgesplitst over meerdere deelthema's of verwerkingen:

  1. We houden de toevoeging van de specifieke dataset , zowel in de CODE (bijvoorbeeld statbel_abc) als in de NAME (bijvoorbeeld Statbel – ABC | provincies.incijfers.be). Als de NAME te lang wordt (bijvoorbeeld 'Departement Onderwijs en Vorming van de Vlaamse Gemeenschap - Hoger onderwijs | provincies.incijfers.be'), korten we hem in. (Maar bij sommige bronnen kunnen we dat waarschijnlijk niet zomaar inkorten, omdat de bron zelf een specifieke verwijzing vraagt) Dit kan eventueel dan via SHORT NAME, maar dan moet die in het vervolg gebruikt worden bij figuren en rapporten. Of gewoon rechtstreeks in de NAME. Hier bijvoorbeeld iets als ‘Vlaams Ministerie Onderwijs en Vorming – Hoger onderwijs | provincies.incijfers.be’

  2. We gebruiken de toevoeging enkel in de CODE en niet in de NAME: dus dan zou het bij Statbel terug overal gewoon Statbel worden, in plaats van Statbel – ABC, Statbel – Fiscale inkomens enzovoort. Via de CODE (statbel_abc, statbel_fisc-ink…) wordt dan wel de juiste metadatafiche toegekend aan deze data, en je kan in de DESCRIPTION wel beschrijven over welke data dit precies gaat (als dat niet duidelijk genoeg zou blijken uit de broncode). (dit laatste is vooral mooier in figuren, MAAR heeft ook nadelen)

Voorstel instructies voor aanpassing:

Opgelet: is je bronnen/metadatastructuur nogal ingewikkeld om deze instructies te volgen, neem het dan op met mij en Emilien

Bronnen splitsen:

Opmerking: Als je in de tabel DataSources de DataSource code aanpast, dan wordt deze code ook automatisch aangepast bij de bijhorende onderwerpen in de indicatorentabel

joostschouppe commented 2 years ago

Opmerking: het gebruik van Short Name in rapporten is wel degelijk instelbaar in rapporten via "Labels". Maar dat werkt niet! ABF volgt het op via Melding 115214

Tine-VB commented 2 years ago

elke aparte metadatafiche moet gekoppeld zijn aan een aparte bron. Is dit nog niet het geval, dan moet de bron gesplitst worden, en wordt het (deel)thema of de specifieke verwerking toegevoegd aan de naam, volgens de afgesproken regel: “Naam van de bron - naam van de verwerking of het (deel)thema | provincies.incijfers.be” Soms is het ook een optie om de metadatafiches samen te voegen natuurlijk...

joostschouppe commented 2 years ago

Goed punt; ik heb dit nog aan de tekst toegevoegd:

Af en toe zijn er meerdere fiches voor één enkele verwerking. Dan is het wellicht beter deze samen te voegen! Heel uitegreide metadata kan eventueel nog in een bijlage toegevoegd worden.

HanneODB-VLBR commented 2 years ago

'Short name' mag blijkbaar maximaal 50 karakters zijn. Met de toevoeging '| provincies.incijfers.be' zit je snel over deze max, en het is niet altijd evident om dan nog een goede afkorting te vinden (bv. 'ABB Gemeente- en stadsmonitor | provincies.incijfers.be' is al te lang). Is er eventueel een mogelijkheid dit veld langer te maken?

HanneODB-VLBR commented 2 years ago

Voorlopig heb ik er 'ABB Gem. en stadsmonitor | provincies.incijfers.be' en 'ABB Lok. Best. VL | provincies.incijfers.be' van gemaakt maar vind het zelf toch suboptimaal, zeker als deze short name bij figuren en rapporten gebruikt gaat worden...

joostschouppe commented 2 years ago

De instructies zeggen: Voeg ook een "short name" toe met enkel de naam van de bron-ogranisatie, vb. "Dep. Onderwijs en Vorming | provincies.incijfers.be"

Dus dit zou twee keer gewoon "ABB | provincies.incijfers.be" worden.

Ik zou het nu gewoon zo uitrollen, we kunnen altijd achteraf nog bulk-wijzigingen in de naamgeving doen.

joostschouppe commented 2 years ago

Redactiegroep 14/11/2022: doe verder volgens instructies hierboven. Eventueel kunnen bulk-aanpassingen achteraf. Maar blijf het melden als er rare dingen zijn of als er cases te complex zijn

joostschouppe commented 1 year ago

Opmerking: als de HTMLs verdwijnen, dan gaan ook sommige URLs naar de metadata in de themaboom verdwijnen

veravandestraat commented 1 year ago

Ik heb DataSource ANB (Agentschap Natuur en Bos) opgesplitst voor alle natuurindicatoren die extern staan, maar ik zie dat er nog een aantal indicatoren aan ANB gekoppeld zijn die vorig jaar niet opnieuw opgeladen werden (v2530_opp_hab_rbb, v2530_opp_hab_eur, v2530_opp_ohab, vp2530_opp_hab_rbb_tovot, vp2530_opp_hab_eur_tovot, vp2530_opp_ohab_tovot). Zet ik die op uitdovend met bron empty, zodat ANB als DataSource geschrapt kan worden?

joostschouppe commented 1 year ago

Vera, hebben die indicatoren ooit extern gestaan? Indien niet, dan mag je ze gewoon deleten

Emilien-Dupont commented 1 year ago

Zou voor Vl-Br in orde moeten zijn. Lim: in orde, behalve VMM in cijfers O-Vl: in orde W-Vl: bijna in orde A'pen: normaal gezien in orde. Lieven kijkt nog na

Lievendr commented 1 year ago

nagekeken. lijkt ok

GeertBonte commented 1 year ago

W-Vl: in orde

HildeC commented 1 year ago

Bij de opmaak van de bronnenlijst voor de omgevingsanalyse wordt duidelijk dat er nog een en ander kan opgekuist worden. Voor de bronnen zou het handig zijn dat je 'bron' en 'thema' krijgt (omgekeerd van de kop metadatafiche waar eerst thema staat en dan bron. zie voorbeeld veka, soms met inhoud, soms zonder, verwijst wel naar een verschillende inhoud Bronnen omgevingsanalyse.pdf

joostschouppe commented 1 year ago

Redactiegroep 25/5/2023 Naar aanleiding van de opmerking van Hilde deed ik een check op bronnen die niet van de vorm "bronorganisatie - thema" waren. De meeste zijn nu opgelost, de andere zijn doorgespeeld naar de verantwoordelijken