inbo / prius-radius

MIT License
0 stars 1 forks source link

Verspreidingsdata #35

Closed bramdhondt closed 6 months ago

bramdhondt commented 8 months ago

@fleurpet - Eenmaal GBIF-codes beschikbaar (finale, of tijdelijke), moeten we de verspreidingsdata bekomen.

Ik vrees dat we de "cube(s)" niet kunnen gebruiken (zie https://zenodo.org/records/5819028), omdat (1) de data verrasterd zijn op 1-km², wat te ruw is voor onze geografische analyses, en (2) niet al onze soorten in die lijst zitten.

We zullen het daarom met de ruwe (punt)data moeten doen. Hier zitten dus wel wat uitdagingen naar een efficiënte download, slimme data-opslag... @SanderDevisscher, volg jij dit mee op?

@fleurpet: Ik kan enkel aangeven hoe ik voor individuele soorten GBIF-downloads verwezenlijk. Zie bv. deze voor muntjak, stukje ## Dataset 1 : GBIF. Ter inspiratie.

SanderDevisscher commented 7 months ago

@fleurpet je kan een lijst van soorten downloaden door in onderstaande code een lijst van taxa toe te kennen aan de parameter taxonkeys (L64).

https://github.com/inbo/vespaR/blob/a7b5f9e57a03d4529a23603411965c7e7aa31c86/Scripts/preprocessing/get_data_from_gbif.Rmd#L61-L89

Mogelijk ga je wel de soorten lijst in "behapbare" groepen moeten onderverdelen hiervoor kan je onderstaande code mits enkele aanpassingen gebruiken: https://github.com/inbo/prius-radius/blob/75a71ca788de81026f1f32c2fb8c765cb4ea45fe/prius/r-scripts/climate_matching.Rmd#L23-L82

Denk er wel aan om de parameter country = "Belgium" toe te voegen aan occ_count. Filteren op niveau Vlaanderen is met occ_count voor zover ik weet niet mogelijk.

fleurpet commented 7 months ago

@bramdhondt - Ik heb de gbif occurrences gedownload voor alle soorten in de RadIUS soortenlijst.

Na het filteren van de ruwe download (weglaten obs. buiten Vlaanderen, zonder coördinaten, zonder verificatie, ...), behoud ik in totaal 489.435 observaties.

Van de 118 soorten in de lijst:

Beide lijsten komen overeen met de aanwezige/afwezige soorten in het PrIUS-rapport, behalve:

bramdhondt commented 7 months ago

@fleurpet - Ok, top!

afbeelding

timadriaens commented 7 months ago

Ik kan me voorstellen dat er een filter gezet is op "incidentele invoer" cf. wat ook iNaturalist doet (geen captive/cultivated in de GBIF dataset)? Mocht dit het geval zijn zou ik dat wel eens melden in de repo van de wnm.be data. Ik ben voorstander die dingen wel mee te nemen aangezien ze voor garden escapes super relevant zijn. Eventueel in een aparte dataset wel. Maar dat is dus te checken of dat wel de reden is.

Ik heb twee emails geforward mbt tot 2 locaties (Wolvenberg en Kerkhoven) met boomwurger. Noteer dat er ook een Celastrus spec. in waarnemingen.be zit. Aangezien dat een over het hoofd geziene bessenverspreider kan zijn moeten we ze misschien toch binnen RadIUS eens bezoeken.

fleurpet commented 7 months ago

@timadriaens @bramdhondt Het lijkt inderdaad zo dat er een filter op de waarnemingen data staat bij het overzetten naar GBIF. Het is me niet helemaal duidelijk waarop gefilterd wordt. Vind ook niet direct de repo van de wnm.be data. Iemand een idee?

Ik kan voor twee waarnemingen in Wolvenberg en Kerkhoven eventueel even mailen Luc en Frank en informeren of deze permanent verwijderd werden.

timadriaens commented 7 months ago

ik denk hier https://github.com/inbo/data-publication-natuurpunt/issues maar ik vraag 't eens na bij @peterdesmet

fleurpet commented 7 months ago

@timadriaens Zou het kunnen dat deze repo private is? Als ik op die link klik, krijg ik "Page not found".

peterdesmet commented 7 months ago

Data met incidentele invoer worden wel naar GBIF gepubliceerd als deel van de Natuurpunt exoten datasets:

The dataset contains all plant, algae and fungi taxa recorded in Flanders and the Brussels Capital Region which have the status naturalized, naturalizing, exotic, or incidental import in waarnemingen.be.

Mogelijke redenen waarom https://waarnemingen.be/observation/104660699/ niet doorstroomt naar GBIF:

❌ Het taxon heeft niet een van bovenstaande statuses in waarnemingen.be. Nee, want andere waarnemingen van die soort raken er wel in: https://www.gbif.org/occurrence/search?dataset_key=7f5e4129-0717-428e-876a-464fbd5d9a47&taxon_key=3169169 ❓ De waarnemer heeft niet de toestemming gegeven om data te delen