Informasjonsforvaltning / fdk-issue-tracker

An issue tracking repository for data.norge.no
1 stars 0 forks source link

BUG: feil identifikator for concept i new.staging #927

Closed terjesyl closed 2 months ago

terjesyl commented 2 months ago

🐛 Bug rapport

Nåværende oppførsel

Begrepet "DCAT-AP-NO" https://new.staging.fellesdatakatalog.digdir.no/concepts/3872b708-1766-4aa2-b91f-9a24c362e38b har identifikator http://data.brreg.no/begrep/53603

image

Forventet oppførsel

Som i staging (https://staging.fellesdatakatalog.digdir.no/concepts/3872b708-1766-4aa2-b91f-9a24c362e38b) forventer vi at den skal ha identifikator https://concept-catalog.staging.fellesdatakatalog.digdir.no/collections/974760673/concepts/4b5ca436-953c-478e-a106-7a8cd7a3283c

Hvordan reprodusere?

Sammenlign https://staging.fellesdatakatalog.digdir.no/concepts/3872b708-1766-4aa2-b91f-9a24c362e38b med https://new.staging.fellesdatakatalog.digdir.no/concepts/3872b708-1766-4aa2-b91f-9a24c362e38b

I tillegg

Har staging to objekter i definition:sources mens new.staging-siden kun har ett objekt definition:sources.

fdk-search-service plukker opp riktig identifikator (mappes fra dct:identifer i RDF til SearchObject.uri) i new.staging.

Kan tyde på at feilen ligger i fdk-resource-service.

Undersøke

terjesyl commented 2 months ago

Samme feil forekommer i https://staging.fellesdatakatalog.digdir.no/concepts/4b7d4581-42f1-33d4-b8e4-deda48beeaba vs. https://new.staging.fellesdatakatalog.digdir.no/concepts/4b7d4581-42f1-33d4-b8e4-deda48beeaba

SPARQL-spørring tyder på at brreg-identifikatoren ikke er lagret i triple-storen (som forventet), og at feilen skjer senere.

SELECT ?p ?o WHERE {
  ?s ?p ?o .
  # med identifikator som vises på detaljsiden i staging.
  ?s dct:identifier "https://concept-catalog.staging.fellesdatakatalog.digdir.no/collections/974760673/concepts/67c21355-c312-4af6-8b32-992a3b7c1f9a" .
} LIMIT 100

-> gir 9 tripler. Som forventet


SELECT ?p ?o WHERE {
  ?s ?p ?o .
  # med brreg-identifikator som vises på detaljsiden i new.staging, fra resource-service.
  ?s dct:identifier "http://data.brreg.no/begrep/76346" .
} LIMIT 100

-> gir 0 tripler. Som forventet.

terjesyl commented 2 months ago

Mulig at vi må bygge opp hele Mongo-databasen til fdk-resource-service på ny.

NilsOveTen commented 2 months ago

Mulig at vi må bygge opp hele Mongo-databasen til fdk-resource-service på ny.

Dette ser til å ha løst seg vha en høsting av brreg-katalogen 1720 i går. Det kan være det ble noe krøll med innlesing av kafka-meldingene siden jeg ikke tømte databsen i mongo sist jeg resatte kafka for resource-service.

Men det kan også være krøll i kafka-meldingene pga migreringen. Mistenker at siste kafka-melding som ble sendt er basert på gamle-katalogen, siden første høsting av den nye ble gjennomført med feil fdk-id. Fulltext bryr seg kun om kataloger, så kan være noen enkelt-begrep falt gjennom.

Hvis vi finner at dette gjelder mer enn begrepskatalogene til skatt og brreg så får vi undersøke nærmere, hvis alt blir fiksa av at vi kjører høsting av de to katalogene så tenker jeg at vi setter en strek der.

NilsOveTen commented 2 months ago

Ble løst av ny høsting