ondata / appaltipop

ETL scripts and issue tracking for AppaltiPOP project.
https://www.appaltipop.it
MIT License
1 stars 0 forks source link

Check numeri dati di input #31

Open aborruso opened 4 years ago

aborruso commented 4 years ago

Al momento il sistema espone i dati su questi CF:

Gli ultimi due non sono da considerare: il primo è REGIONE TOSCANA, che appare come stazione appaltante in una gara del comune di Prato del 2019, il secondo è la PIVA (e non il CF) del comune di Prato. Il primo non è un errore, il secondo sì. Vi scriverò una issue a tema.

I numeri per i 3 CF "giusti" sono quelli di sotto (@jenkin per ora li metto qui, poi mi dirai dove metterli).

tenders tenderers suppliers tendersZero ID
3345 6818 3439 226 01199250158
2528 5701 2576 480 00355870221
1826 3432 1843 106 84006890481
{ "tenders": "3345", "tenderers": "6818", "suppliers": "3439", "tendersZero": "226", "ID": "01199250158" }
{ "tenders": "2528", "tenderers": "5701", "suppliers": "2576", "tendersZero": "480", "ID": "00355870221" }
{ "tenders": "1826", "tenderers": "3432", "suppliers": "1843", "tendersZero": "106", "ID": "84006890481" }
nelsonmau commented 4 years ago

@aborruso ma esattamente le colonne cosa rappresentano?

aborruso commented 4 years ago

@nelsonmau ma quello che vuoi sapere, non è scritto nel messaggio di sopra (sotto screenshot)?

Temo quindi di non avere capito la domanda

image

nelsonmau commented 4 years ago

Ho fatto male la domanda, a me interessa sapere:

Inoltre mi servirebbe il sample di un item/appalti per farmi un'idea migliore dei campi previsti, required, opzionali, etc

Il tutto con panne, cialde a parte

grazie! :-)

aborruso commented 4 years ago

@nelsonmau ho prodotto anche una cosa di questo tipo, che mi sembra interessante, legata ai partecipanti

ID minimo massimo media moda somma primoQuartile terzoQuartile
00355870221 1 136 2.049838 1 4442 1 2
01199250158 1 94 1.809928 1 6818 1 1
80016350821 1 20 2.634855 1 635 1 3
84006890481 1 41 1.837738 1 2990 1 1
nelsonmau commented 4 years ago

perché no, l'importante è che teniamo sempre presente il nostro focus: non business intellinge sugli appalti (quella lo fa - bene - contrattipubblici.org) ma analisi della qualità e dell'accessibilità dei dati degli appalti ed eventuali approfondimenti (tipo capitolati o altre info).

Il nostro focus dev'essere coerente con la mission di Ondata, e cioè:

Siamo un’associazione che promuove l’apertura dei dati pubblici per renderli accessibili a tutti

tutto il resto imho è secondario

scusa se sembra una lezioncina, ma in realtà la terrei più che altro come una bussola generale

aborruso commented 4 years ago

@nelsonmau non voglio fare business intelligence

Siccome sopra chiedevi dei conteggi, questo conteggio esce in modo naturale.

Moreover questo in particolare è interessante, perché molto correlato alla bandiera rossa sul numero di partecipanti per appalto. Che ahimè non sembra un granché.

nelsonmau commented 4 years ago

ottima idea! tutto ciò che risponde agli indicatori ocds è interessantissimo.

ma per esempio sulle date cosa si può fare? tipo incrociando inizio/fine o altro