Open vbombaerts opened 1 month ago
Peut-être directement lié au thésaurus. J'ai le problème aussi sur la prod actuelle et j'ai réimporté des thésaurus hier. Même le thésaurus infraSIG pose problème aujourd'hui alors qu'hier j'ai édité plusieurs fiches pour ajouter un mot-clé infrasig sans souci.
Solution temporaire pour corriger les XML : batch edit de type supprimer avec la condition suivante (sur les données/series)
/mdb:MD_Metadata/mdb:identificationInfo/mri:MD_DataIdentification/mri:descriptiveKeywords/mri:MD_Keywords/mri:thesaurusName/cit:CI_Citation/cit:date[2]
J'ai l'impression que c'est présent sur tous les thésaurus, pas uniquement sur les thésaurus DCAT. A vérifier. J'ai aussi l'impression que c'est apparu "tout à coup" alors que le problème n'était pas là avant. (mais je ne l'avais peut-être juste pas remarqué avant...)
Oui c'est pour tous les thésaurus. L'idée était d'ajouter les informations sur toutes les dates du thésaurus (création, publication, révision) quand elles sont déclarées. Y'a quelques améliorations possibles.
A déployer en test @GeryNi
Disponible en test pour validation.
C'est pas encore ça. J'ai ouvert en édition puis enregistré et fermé. https://metawal.test.wallonie.be/geonetwork/napits/api/records/5467f3bd-c898-4531-bb4f-9f7b670d794b/formatters/xml
Oui j'attends un retour de Ian pour savoir ce qu'ils voulaient faire exactement. Pour nous, le plus simple serait de n'avoir qu'une date dans le thésaurus de type années-mois-jour eg.
<dcterms:modified>2015-12-17</dcterms:modified>
Peut être que ça vaut le coup de prendre tous les thésaurus de prod et de les mettre dans github en vérifiant ça ?
Thésaurus mis à jour dans github
avec correction dans les thésaurus suivants:
Corrections:
Correction faite lors de l'import depuis un registre pour ne fixer que la date dct:issued
Je voudrais modifier le nom high-value-dataset-applicable-legislation.rdf
--> applicable-legislation.rdf
et qques infos (title, description + ajout des legilsations ITS) de https://github.com/SPW-DIG/metawal-core-geonetwork/blob/metawal-4.4.x/web/src/main/webapp/WEB-INF/data/config/codelist/external/thesauri/theme/high-value-dataset-applicable-legislation.rdf,
Est-ce qu'en faisant un batch editing pour changer le nom du thésaurus dans les fiches permettra de ne pas casser les fiches ?
Une fois les thesaurus corrigés rechargés, il faut éditer toutes les fiches ?
Thésaurus corrigés rechargés en environnement de valid
Thésaurus corrigés rechargés en prod. Il faut repérer et corriger les fiches qui ont encore l'erreur de la double date de publication via une requête SQL. A faire pour les 3 environnements.
Pour avoir la liste des fiches:
WITH ns AS (select ARRAY [ARRAY ['xlink', 'http://www.w3.org/1999/xlink'],
ARRAY ['mdb', 'http://standards.iso.org/iso/19115/-3/mdb/2.0'],
ARRAY ['cit', 'http://standards.iso.org/iso/19115/-3/cit/2.0'],
ARRAY ['mri', 'http://standards.iso.org/iso/19115/-3/mri/1.0'],
ARRAY ['mco', 'http://standards.iso.org/iso/19115/-3/mco/1.0'],
ARRAY ['mrd', 'http://standards.iso.org/iso/19115/-3/mrd/1.0'],
ARRAY ['xsi', 'http://www.w3.org/2001/XMLSchema-instance'],
ARRAY ['gco', 'http://standards.iso.org/iso/19115/-3/gco/1.0']] AS n)
SELECT * FROM (
SELECT distinct(
unnest(xpath('//mdb:identificationInfo/*/mri:citation/*/cit:title/*/text()',
XMLPARSE(DOCUMENT data), n)))::text AS currentTitle,
uuid as currentId,
unnest(xpath('count(//mri:descriptiveKeywords/*/mri:thesaurusName/*[count(cit:date) > 1]/cit:title/*/text())',
XMLPARSE(DOCUMENT data), n))::text::int AS nbThesaurusWithMoreThanOneDate
FROM metadata,
ns
WHERE isharvested = 'n'
ORDER BY uuid) AS records
WHERE nbThesaurusWithMoreThanOneDate > 0;
Sur Metawal-temp (pas vérifié sur les autres environnements), quand on ajout des mots-clés depuis un thésaurus, la date de publication du thésaurus est encodée en double
Ex: https://metawal-temp.wallonie.be/geonetwork/srv/eng/catalog.search#/metadata/cead67e8-fd93-4741-a38b-fa798f723a39 ou