ondata / appaltipop

ETL scripts and issue tracking for AppaltiPOP project.
https://www.appaltipop.it
MIT License
1 stars 0 forks source link

[PER FAVORE LEGGETEMI] Più stazioni appaltanti in file sorgente #33

Open aborruso opened 4 years ago

aborruso commented 4 years ago

Scusate, sarò lungo.

Nei file sorgente si fa riferimento in termini di descrizione di livello gerarchico di primo livello al cosiddetto "ente pubblicatore", che nella grandissima parte dei casi coincide con la cosiddetta "struttura proponente". La prima è la PA, che pubblica i file XML e una PA potrebbe pubblicare l'XML di un'altro ente che per varie ragioni non ha dove pubblicarlo. Dell'"ente pubblicatore" non viene pubblicato né un CF, né altro codice previsto per identificare una PA, ma soltanto una stringa come "Comune di Prato" La "struttura proponente" è quella di cui mappiamo i Codici Fiscali, quella che formalmente e sostanzialmente si occupa delle gare.

Questa è una delle ragioni per cui in un unico file sorgente, possiamo avere più "strutture proponenti" e quindi più CF.

Le altre sono più di "processo", più formali e ne trovate qualche cenno nelle FAQ.

Ma ci sono casi odiosi, come il Comune di Prato, che è "ente pubblicatore" e "struttura proponente", che nel suo file sorgente ha i valori distinti sottostanti di CF (e descrizione).

Alcune note:

strutturaProponente:codiceFiscaleProp strutturaProponente:denominazione
84006890481 Comune di Prato
84006890481 Pubblica istruzione
84006890481 COMUNE DI PRATO
05040110487 PUBLIACQUA SPA
01386030488 REGIONE TOSCANA
00337360978 comune di prato
00337360978 Comune di Prato

05040110487 è il CF di Publiacqua S.p.A, la "società affidataria, dal 1° Gennaio 2002, della gestione del servizio idrico integrato dall'Ambito Territoriale Ottimale n.3 Medio Valdarno, un territorio, asse portante della Toscana, che interessa 4 province, Firenze Prato, Pistoia e Arezzo.". Credo che sia nell'elenco perché è un bando la cui sostanza (anche se gestito da una S.p.A) è tutta nella "cosa pubblica". Questo CF non è ovviamente in iPA.

01386030488 è il CF di Regione Toscana, che gestirà un appalto su qualcosa con effetti su Prato. Il/i lotto/i relativi andrebbero pubblicati su una scheda PA differente. Questo CF è su iPA.

Ma c'è di peggio. Il comune di Piacenza ha come CF 00229080338. Nel suo file sorgente ci sono però un mucchio di altri CF di cui non c'è traccia in alcun indice pubblico centralizzato. Il 95% delle gare ha il CF ufficiale, controllabile mappabile.

strutturaProponente:codiceFiscaleProp strutturaProponente:denominazione
00229080338 Servizi Educativi per l'Infanzia
00229080338 servizio Ambiente e Parchi
00229080338 servizi educativi e formazione
00229080338 servizio Infrastrutture e lavori pubblici
00229080339 U.O. Acquisti e gare
00229080340 U.O. Acquisti e gare
00229080341 U.O. Acquisti e gare
00229080342 U.O. Acquisti e gare
00229080343 U.O. Acquisti e gare
00229080343 Servizio Infrastrutture e Lavori Pubblici
00229080344 U.O. Acquisti e gare
00229080345 U.O. Acquisti e gare
00229080345 Ufficio Acquisti e gare
00229080346 U.O. Acquisti e gare
00229080353 U.O. Acquisti e gare

Il CF di un'azienda/ente è fatto da 11 caratteri:

Vi chiedo aiuto su questo. Io la leggo così, quello che identifica la mappatura di un ente sono i primi 7 caratteri, quindi 0022908, poi c'è un codice che mappa non l'ente a cui si assegna il CF, ma l'ente che assegna il CF (i numeri dall'ottavo al decimo) e poi l'ultimo è un carattere di controllo.

Quindi potremmo creare una regola che estrae le prime 7, le confronta con iPA, e assegna in questo caso tutto al Comune di Piacenza.

Che fare allora?

Al momento è la prima proposta, mi aspetto e vi chiedo per favore un confronto su questo.

Si potrebbe di base fare così:

Quindi, sperando che la cosa dei sette caratteri sia sensata:

Ne vogliamo parlare oggi intorno alle 12:30??

jenkin commented 4 years ago

@aborruso Io oggi non ci sono, ma non credo di poter essere utile, entro in gioco quando i dati saranno a posto... :)