zaragoza-sedeelectronica / zaragoza-sedeelectronica.github.io

21 stars 5 forks source link

NIFs y nombres de proveedores #36

Open luisgaldo opened 8 years ago

luisgaldo commented 8 years ago

Los NIFs de proveedores no están estandarizados. Existen infinidad de variantes que dificultan la búsqueda de contratos adjudicados a un determinado proveedor.

Utilizando la consulta mostrada a continuación se han extraído dos documentos (que se adjuntan al final) en los que se incluyen recomendaciones para estandarizar los NIFs.

SELECT DISTINCT ?contrato ?CIF ?empresa WHERE { ?uri a http://purl.org/procurement/public-contracts#Tender. ?contrato ?pepe ?uri. ?uri http://purl.org/procurement/public-contracts#supplier ?empresaid. ?empresaid http://www.w3.org/ns/org#identifier ?CIF. ?empresaid http://schema.org/name ?empresa. } ORDER BY(?CIF)

Tender IDs and Names.pdf Tender IDs and Names.xlsx

luisgaldo commented 8 years ago

Algunos errores, como los de los guiones o los espacios, consiguieron arreglarse mediante la utilización de funciones auxiliares de SPARQL. En este caso en concreto, se aplicaron los distintos filtros para eliminar los espacios, puntos y guiones de los CIFs. También se pusieron todos en mayúsculas. A continuación se muestran los cambios realizados sobre ?cif:

(ucase(replace(replace(replace(?cif," ",""),"-",""),"/.","")))

Para evitar duplicaciones, se utiliza la etiqueta min siempre que es posible, aunque en algunos casos puede llegar a ser perjudicial.