Open streino opened 1 year ago
Concernant territory
.
parse_dataset
), mais il n'y a rien. C'est un manque. Lorsque la propriété dct:spatial
est présente et qu'on y trouve un ou plusieurs URI du code géographique de l'INSEE ou du vocabulaire européen des territoires administratifs (ou un label permettant de reconnaître un de ces URI), il est possible d'en déduire les territoires correspondants en allant interroger les tables de synonymes des vocabulaires. Elle n'a pas encore été réécrite pour interroger des données en base et pas en JSON, mais c'est la méthode VocabularyJSONReader.get_ecospheres_territory
qui s'en charge. À titre de référence, le traitement serait assez proche de ce que j'ai écrit pour les métadonnées INSPIRE.DCATfrRDFHarvester.before_create
qui donne une valeur à la propriété, en récupérant les territoires associés à l'organisation. Et elle plante sur l'exécution de la fonction re.match
avec une erreur TypeError: expected string or bytes-like object
si, dans l'extrait de code suivant, territories_codes
est nul, ce qui arrivera s'il n'y avait pas de territoire associé à l'organisation.
territories_codes=self._get_territory(org)
res=re.match(r'{(.*)}',territories_codes)
Il est acceptable pour une organisation de ne pas avoir de territoire. Même s'il est possible que cela change à l'avenir, c'est aujourd'hui le cas pour les organisations à compétence nationale. Il faut consolider le code pour s'assurer qu'il n'y a pas d'erreur dans ce cas.
spatial
n'est pas définie et pas quand la propriété territory
n'est pas définie.
spatial=dataset_dict.get("spatial",None)
if not spatial:
re.match
et str.split
sur la liste des territoires alors que c'est un dump JSON qui a seulement besoin d'être désérialisé...
J'ai des erreurs sur les moissonnages DCAT testés hors Dido.
Data.gouv
Géocatalogue
Il semble qu'il y a au moins 3 erreurs différentes :
territory
est manquant.title
.free_tags
avec des caractères spéciaux.