ondata / covid19italia

Creative Commons Attribution 4.0 International
206 stars 55 forks source link

[Vaccini] Punti somministrazione - Province #85

Closed Feibio93 closed 3 years ago

Feibio93 commented 3 years ago

Salve a tutti, provando a fare lo scraping dei dati per ottenere microdati per ogni punto di somministrazione del Veneto, mi sono accorto che i punti di somministrazione richiedevano un inserimento manuale della provincia, ma per 5 luoghi mi è stato impossibile trovare la relativa provincia, in quanto il nome del luogo è troppo generale (come per esempio "ex ospedale"), quindi chiedo se sia possibile aggiungere anche l'identificativo per la provincia accanto all'identificativo regionale. Grazie mille per l'ottimo lavoro!

aborruso commented 3 years ago

Ciao @Feibio93 prima di risponderti, ho bisogno di capire che fonte usi. Parli di scraping, quindi non starai usando i dati di questo repo, né del repo ufficiale.

O stai usando questo file https://github.com/ondata/covid19italia/blob/master/webservices/vaccini/processing/datiRegioni/05.csv ?

Grazie

Feibio93 commented 3 years ago

Esatto, sto usando quel file

aborruso commented 3 years ago

Ciao @Feibio93 in quel file non trovo la stringa ex ospedale. Ma detto questo, provo ad aggiungere qualche elemento.

La colonna identificativo, se la splitti per _, sembra contenere data, tipo di vaccino, regione, identificativo del punto, nome del punto e classe di età.

Info sulla provincia non ce ne sono. Però potresti fare due cose:

identificativo identificativo_re0 identificativo_re1 identificativo_re2 identificativo_re3 identificativo_re4 identificativo_re5
06/01/2021_PF/BT_VEN_50506_CAMPOSAMPIERO MEDICO COMPETENT_90+ 06/01/2021 PF/BT VEN 50506 CAMPOSAMPIERO MEDICO COMPETENT 90+
04/01/2021_PF/BT_VEN_50506_VIA TEMANZA ANTI INFLUENZALE_20-29 04/01/2021 PF/BT VEN 50506 VIA TEMANZA ANTI INFLUENZALE 20-29
03/01/2021_PF/BT_VEN_050506_CAMPOSAMPIERO MEDICO COMPETENT_16-19 03/01/2021 PF/BT VEN 050506 CAMPOSAMPIERO MEDICO COMPETENT 16-19
30/12/2020_PF/BT_VEN_50501_AGORDO - SERVIZIO IGIENE_90+ 30/12/2020 PF/BT VEN 50501 AGORDO - SERVIZIO IGIENE 90+
27/12/2020_PF/BT_VEN_50501_BELLUNO "DRIVE-IN"_50-59 27/12/2020 PF/BT VEN 50501 BELLUNO "DRIVE-IN" 50-59
opencovid-mr commented 3 years ago

L'identificativo contenuto nella colonna identificativo_re3 sembra più o meno corrispondere al Codice identifictivo struttura dell'elenco Strutture di Ricovero Pubbliche - Ministero della Salute

Feibio93 commented 3 years ago

Grazie davvero ad entrambi, sono riuscito a trovare tutte le strutture mancanti!

Lascio il lavoro, modificato per la regione Veneto dal lavoro iniziale per la Puglia di Mimmo Cucinella https://docs.google.com/spreadsheets/d/e/2PACX-1vQORp1uXpLQqzBPh4i1ru0Ip33IOcS7JUPqyWbIM-A6YKkA3shLcaqlGTfAGwv4QF4OsWUs68jwyoB7/pubhtml

aborruso commented 3 years ago

Ciao @Feibio93 che uso ne state facendo? Dove ne darete notizia?

Feibio93 commented 3 years ago

Per il momento il mio uso è personale, quando avrò perfezionato grafici e spiegazioni testuali lo pubblicherò principalmente su Facebook, nei gruppi della provincia di Belluno. Ovviamente avrò cura di citarvi e impostare la licenza CC-BY. Vedrò se riesco a far pubblicare un articolo di giornale a riguardo

aborruso commented 3 years ago

Ciao @Feibio93 in giornata cambierò lo schema dati, estraendo le colonne con data, regione, classe di età e vaccino

aborruso commented 3 years ago

In ogni caso, stasera spegneremo la raccolta di questi dati: le richieste alle API superano il numero consentito e vengono quindi restituiti dati parziali

Feibio93 commented 3 years ago

Che peccato... sono dati molto interessanti e utili.

aborruso commented 3 years ago

@Feibio93 abbiamo fatto una modifica e ci facciamo restituire i dati soltanto quando sono state fatte più di zero somministrazioni.

Così, continueremo ancora, sino a nuovi limiti

Feibio93 commented 3 years ago

Grandissimi... complimenti davvero per tutto questo lavoro