Informasjonsforvaltning / behov

Et repository der vi dokumenterer behov som vi utreder og dokumenterer
8 stars 0 forks source link

[BRUKERHISTORIE] Støtte for flere standardiserte datasett-typer i registreringsløsningen #759

Open oystein-asnes opened 1 year ago

oystein-asnes commented 1 year ago

Som: datatilbyder Ønsker jeg å: registrere datasett-type Slik at: det blir mulig å filtrere på type i datasett-katalogen

Relatert til epos: #760

Oppdatere støtte for datasett-type i registreringsløsningen med følgende typer og URI-er:

URI-er og norske labels skal hentes her: https://op.europa.eu/en/web/eu-vocabularies/concept-scheme/-/resource?uri=http://publications.europa.eu/resource/authority/dataset-type

Obs: Typen "datasett" bør fjernes fra reg. løsning (og fra databasen?) ettersom "et datasettav typen datasett" ikkje gir mening

Lenke til design: Lenke til løsningsarkitektur:

Forretningsverdi (Kritisk/Viktig/Mindre viktig/Kjekt å ha):

KurtStian commented 1 year ago

Dataset-type HVD (High-value-dataset) må også støttes.

KjerstiSteien commented 1 year ago

@oystein-asnes Kurt Stian og jeg snakket litt om dette. Vi skal ikke bare støtte hele vokabularet?

oystein-asnes commented 1 year ago

obs: HVD er lagt til i lista.

NilsOveTen commented 1 month ago

@oystein-asnes @KurtStian Når jeg nå snart løser dette issuet så legger jeg til støtte for hele vokabularet: https://github.com/Informasjonsforvaltning/dataset-catalog-gui-old/issues/36

Er det ok eller skal jeg legge til noe filtrering av hvilke typer som støttes i registrering? Data.norge.no tenker jeg må støtte alt, men om nødvendig så kan vi fint filtrere ut noen av typene i registrering.

En annen ting er at ikke alt i vokabularet har norske oversetteleser, blant annet HVD.

oystein-asnes commented 1 month ago

Det er sikkert greit at alt dras inn i reference data, men en bør gjøre et utvalg i reg.-løsningen. Et par av disse begrepene har liten relevans i norsk kontekst og noen er i tillegg sære og vil kanskje oppleves som støy. Det gjelder først og fremst ATTO-tabellene.

EU har i tillegg en tendens til å la alt passere som datasett. Disse mener jeg IKKE hører hjemme i datasett-registreringen:

Etter det jeg kan se mangler disse norsk oversettelse:

Merk at de to siste ikke vises i html (browse content) - men de ligger altså i RDF-filen til EU. Bug vil jeg tro. Vi melder inn oversettelse til EU slik at dette kommer med i neste release (kommer hvert kvartal tror jeg) Dersom det er aktuelt å hardkode oversettelse i reference data, så kan du gjøre det slik:

High-value dataset nb: Datasett med høy verdi no: Datasett med høy verdi nb: Datasett med høg verdi

Provisional data nb: Midlertidige data no: Midlertidige data nb: Mellombelse data

Release nb: Versjon no: Versjon nb: Versjon

Jeg kommer forresten også til å foreslå endringer i oversettelsene av Statistical data og Syntetic data. Disse børe være Statistiske data og Syntetiske data (gjelder både bokmål og nynorsk) Definisjonene finnes bare på engelsk. De bør kanskje også inn i reg.løsningen på et vis (behov av typen kjekt å ha)

NilsOveTen commented 1 month ago

Etter det jeg kan se mangler disse norsk oversettelse:

High-value dataset Provisional data Release

Release tror jeg er en reell kode, men "Provisional data", dvs identifier = "OP_DATPRO", er noe EU legger til i alle sine kodelister som jeg lagt til at reference-data skal ignorere når den høster kodelister derfra. Så i RDF ser den ut som en reell kode, men jeg tror ikke den er det...

NilsOveTen commented 1 month ago
  • Version Skeptisk. Dette er i praksis versjonsinfo - altså metadata om versjonen til et annet datasett.

@oystein-asnes Er det "Release" du snakker om her og?

Jeg la uansett til at disse kodene skulle ignoreres i registrering 'ATTO_LEX', 'ATTO_PUB', 'DOMAIN_MODEL', 'DSCRP_SERV', 'CORE_COMP', 'RELEASE', det ser slik ut i staging:

Screenshot 2024-08-08 at 07 18 13
oystein-asnes commented 1 month ago

Stemmer. Release=versjon (ikke veldig intuitivt). Ser veldig bra ut. Mulig vi bør ignorere flere verdier for å øke brukervennligheten, men la være slik for now.