italia / daf-ontologie-vocabolari-controllati

Elenco di ontologie e vocabolari controllati. Per maggiori informazioni, si veda il readme principale e quello di singoli vocabolari/ontologie, ove presente, e la seguente documentazione
https://github.com/italia/daf-ontologie-vocabolari-controllati/wiki
Creative Commons Attribution 4.0 International
80 stars 52 forks source link

proposta di vocabolario controllato per i riusi degli open data della PA #77

Open cirospat opened 4 years ago

cirospat commented 4 years ago

Salve

Un idea di HUB del riuso degli open data

a seguito di un iniziativa di ForumPA chiamata "A colazione con .." condotta da Gianni Dominici e Marina Bassi che vede alcune persone in Italia dentro e fuori le PA interessate ad animare un video incontro mensile sul mondo dei dati in formato aperto, è nata l'esigenza di costruire un HUB nazionale del riuso dei dati pubblici, così da potere avere informazioni (e dati!) sui tipi di impatto (economico, sociale, culturale) che i riusi dei dati pubblici creano nella società. image Mappa mentale a cura di G. Roberta Stagno su Twitter.

Questa esigenza di HUB nazionale del riuso degli open data pubblici è nata dall'incontro video del 15 gennaio 2019 di cui a breve sarà rilasciata registrazione online sul portale di ForumPA.

Un HUB per che cosa

Un HUB che diventa database pubblico in cui potere effettuare query per:

Un vocabolario controllato dedicato allo scopo dell'HUB del riuso degli open data

Al fine di disporre di un database comune dove siano raccolti le informazioni sul riuso e strutturati in maniera tale da potere poi effettuare qualsiasi tipo di ricerca query, è necessario condividere un vero e proprio "vocabolario controllato dei riusi dei dati pubblici in Italia". Che, immagino, tragga molto dal profilo DCAT_AP_IT, per la parte di metadatazione del riuso da censire nell'HUB.

Informazioni afferenti la PA che pubblica il dataset open data

Immagino dei campi da compilare, nel fare il data entry nell'HUB, come:

Informazioni afferenti il soggetto privato o pubblico che riusa i dati

Immagino dei campi da compilare, nel fare il data entry nell'HUB, come:

Da una corretta strutturazione di un vocabolario di voci può derivare un applicativo che soddisfa le esigenze più disparate di ricerca. Uno strumento con cui misurare realmente il fenomeno nazionale del riuso dei dati pubblici ed il relativo impatto.

CREW @giorgialodi innanzitutto tu che ne pensi? @gpirrotta, @aborruso, @Piersoft, e @davtaibi, @vincpatruno, @DanieleCrespi, @gigicogo voi? E poi, ... this is a mission for us. Non vedo l'ora di vostri feedback. Thanks and have a good day :)

piersoft commented 4 years ago

l’idea è ottima e stimolante. Forse per tarare meglio l’azione bisognerebbe capire il portale PDND cosa avrà dentro. Potremmo creare duplicati non necessari e focalizzarci su altri aspetti.

Piersoft Inviato da iPhone

Il giorno 15 gen 2020, alle ore 12:46, ciro spataro notifications@github.com ha scritto:

 Salve

Un idea di HUB del riuso degli open data

a seguito di un iniziativa di ForumPA chiamata "A colazione con .." condotta da Gianni Dominici e Marina Bassi che vede alcune persone in Italia dentro e fuori le PA interessate ad animare un video incontro mensile sul mondo dei dati in formato aperto, è nata l'esigenza di costruire un HUB nazionale del riuso dei dati, così da potere avere informazioni (e dati!) sui tipi di impatto (economico, sociale, culturale) che i riusi dei dati creano nella società. Questa esigenza di HUB nazionale è nata dall'incontro video del 15 gennaio 2019 di cui a breve sarà rilasciata registrazione video sul portale di ForumPA.

Un HUB per che cosa

Un HUB che diventa database pubblico in cui potere effettuare query per:

tipo di riuso (app, web application, mappa, infografica, bot, ...) per ente pubblico che ha pubblicato il dataset per l'azienda/soggetto che lo ha riutilizzato creando qualcosa di utile ella società per parola chiave per ......... Un vocabolario controllato dedicato allo scopo dell'HUB

Al fine di disporre di un database comune dove siano raccolti le informazioni sul riuso e strutturati in maniera tale da potere poi effettuare qualsiasi tipo di ricerca query, è necessario condividere un vero e proprio "vocabolario controllato dei riusi dei dati pubblici in Italia". Che, immagino, tragga molto dal profilo DCAT_AP_IT, per la parte di metadatazione del riuso da censire nell'HUB.

Informazioni afferenti la PA che pubblica il dataset open data

Immagino dei campi da compilare, nel fare il data entry nell'HUB, come:

denominazione IPA dell'ente pubblico che pubblica il dataset data di pubblicazione del dataset titolo del dataset copertura temporale del dataset eccetera,... e queste informazioni porebbero essere mutuate dal profilo dei metadati del catalogo dati DCAT_AP_IT Informazioni afferenti il soggetto privato o pubblico che riusa i dati

Immagino dei campi da compilare, nel fare il data entry nell'HUB, come:

denominazione del soggetto che riusa il dataset della PA denominazione del tipo di riuso dei dati tipo del riuso (che nell'HUB lato consultazione immagino un menù a tendina): mappa, app x mobile, infografica, web application, .... url dove risiede il riuso categoria in cui è inquadrabile del riuso (mutuabile da quelle del profilo DCAT_AP_IT): ambiente, cultura, amministrazione, ecc. eventuale pagamento per la fruizione del riuso e se affermatico, costo del riuso un campo note (testo a numero caratteri definito) con la richiesta di descrizione o valutazione del tipo di impatto generato dal riuso (impatto economico, sociale, culturale, ambientale,..) ecc.... Da una corretta strutturazione di un vocabolario di voci può derivare un applicativo che soddisfa le esigenze più disparate di ricerca. Uno strumento con cui misurare realmente il fenomeno nazionale del riuso dei dati pubblici.

@giorgialodi innanzitutto tu che ne pensi? @gpirrotta, @aborruso, @piersoft, e @davidetaibi, @DanieleCrespi, voi? E poi, ... this is a mission for us. Non vedo l'ora di vostri feedback. Thanks and have a good day :)

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

cirospat commented 4 years ago

capire il portale PDND cosa avrà dentro

chi ce lo può far capire @piersoft? In tempi brevi!

gigicogo commented 4 years ago

e aggiungi il sottoscritto :)

cirospat commented 4 years ago

e aggiungi il sottoscritto :)

@gigicogo aggiunto, d'altronde hai iniziato a parlarne prima tu grazie :)

gigicogo commented 4 years ago

Come ci siam detti stamane, ampia disponibilità a collaborare su questo progetto che vedo davvero strategico. Aggiungo che, a fine progetto, bisognerà inventare un barbatrucco che permetta di embeddare il catalogo dell'HUB in qualsiasi CMS che accetti codice embeddabile html, xml, o qualsiasi altro meta linguaggio. My two cent.

davidetaibi commented 4 years ago

Discussione sicuramente molto interessante. Per qualche ragione GitHub mi ha sottoscritto a questa conversazione, ma credo sia indirizzata al mio omonimo :-)

cirospat commented 4 years ago

Si ci siete più Davide Taibi su Github. Quello a cui facciamo riferimento è il palermitano

dcrespi commented 4 years ago

Ci sono ! Daremo il ns contributo

marcomb commented 4 years ago

Sicuramente anche noi..

giorgialodi commented 4 years ago

Quanti siete! Ottimo! Intanto riporto, a beneficio di tutti, dei miei primi pensieri in merito. Mi riprometto di disegnare ad alto livello un possibile modello. Datemi però qualche altro giorno che ho una presentazione importante da preparare per la prossima settimana!

Parlerei però più di vera e proprio ontologia più che vocabolario controllato. Dentro potrebbero esserci diversi vocabolari controllati. Chiedo anche a @gpirrotta se interessato alla cosa :)

Secondo me non dobbiamo spingerci tanto in là per fare l’ontologia dell’HUB. Questo perché, come giustamente riportato da Ciro, c’è già, per una parte, il DCAT-AP_IT. Però aggiungo: c’è il DCAT versione 2 che ha elementi interessanti per questo tema e un’altra ontologia molto importante (per giunta menzionata dal DCAT, dal DCAT-AP e dal DCAT-AP_IT e dalle nostre linee guida nazionali) che è PROV-O che ci può tornare utile.

In particolare, il DCAT versione 2 https://www.w3.org/TR/vocab-dcat-2/ introduce la Data Citation (capitolo 11) che dice: "Data citation offers multiple benefits, such as supporting proper attribution and credit to those producing the data, facilitating data discovery, supporting tracking the impact and reuse of data, allowing for collaboration and re-use of data, and enabling the reproducibility of results based on the data.” Questo è poi collegato con PROV-O che è l’ontologia della Provenance attraverso cui tracciare attività e agenti che le svolgono (quindi anche app che usano dati).

Un esempio potrebbe essere dire che un dataset è un entity di PROV-O che deriva da (wasDerivedFrom) un altro dataset (entity di PROV-O) o altra risorsa (app, servizio, mappa, ecc.. Ogni dataset ha il suo URI - identificativo univoco nel mondo DCAT-AP e DCAT-AP_IT e si può dire che il secondo dataset o la risorsa creata a partire dal dataset è attributedTo (la cui inversa è prov:contributed) Agent (un'impresa, un'altra PA, una persona, un gruppo di persone). Non stiamo violando DCAT-AP_IT ma stiamo specificando ulteriori metadati per descrivere meglio tutto l’iter di produzione di un dataset e quello che avviene dopo (ci potremmo anche spingere a descrivere singole attività - ho preso questo dataset, ho fatto merge con quest'altro e ho prodotto una risorsa dataset o altro che sia). Dal ragionamento di Ciro, ci sono però alcuni elementi che dovremmo definire noi a parte mi sa (e.g., tipo di impatto generato), però il mio ragionamento complessivo è che con DCAT-AP_IT il nuovo DCAT e PROV-O si potrebbe riuscire a modellare lo schema dell’HUB abbastanza facilmente.

Per rispondere a @piersoft: non mi è chiaro che fine farà la PDND. Non sembra al momento nei radar dei nuovi organi di governance (cc @mariaclaudia), magari lo sarà più avanti, non lo so. Potreste pensare di farlo come esponenti delle PA locali e come comunità di attivisti per poi magari presentarlo ai nuovi organi di governance. Potrebbe essere un bell'esempio che strumenti come questo repo github, totalmente aperti e collaborativi, portano qualcosa prima che se ne occupi livello centrale top-down.

Comunque, datemi ancora qualche giorno e provo a buttar giù un disegno che tenga conto dei requisiti elencati da @cirospat sopra. Se avete altri requisiti, inseriteli pure in questo thread.

gpirrotta commented 4 years ago

Ciao @giorgialodi, @cirospat e tutti quanti. Scusate la lunga assenza, ci sono anch'io! 😀 Mi trovo d'accordo con quanto scritto da Giorgia, sia sul fatto che più che un vocabolario controllato serve un'ontologia in grado di catturare il dominio riuso sia che già esiste DCAT-AP, per descrivere il dataset e PROV con cui è possibile descrivere chi (Agent) ha creato un riuso (ex.App, - Entity) a partire da un insieme di dati aperti (Dataset - Entity) e in che modo è arrivato al risultato finale (Activity).

Del riuso, secondo quanto descritto da Ciro, è importante descrivere:

La parte relativa all'impatto socio-economico è sicuramente la più complessa e bisognerà decidere il livello di dettaglio che si vuole raggiungere. Ragiono insieme a voi ad alta voce: il contesto dovrebbe prevedere concetti legati

Nei casi in cui il riuso diventa un servizio per il cittadino potrebbe essere interessante riutilizzare qualche concetto esistente in CPSV-APIT:

E' tanta roba, lo so; mi riservo di pensarci un po' meglio mentre aspetto anch'io la prima bozza di Giorgia.

Ciao a tutti e buon w.e. Giovanni