Geonovum / MIM-Werkomgeving

Werkomgeving van MIM. Bevat werk en alle pre-publicatieversies.
https://geonovum.github.io/MIM-Werkomgeving/
7 stars 16 forks source link

2.3.1.2 Definities #428

Open dkrijtenburg-GNM opened 5 months ago

dkrijtenburg-GNM commented 5 months ago

nav opmerking jesse bakker
2.3.1.2 Definities semantisch
Definitie gegeven onduidelijk "Een betekenisvolle formulering van een waargenomen feit, waaraan een waarde kan worden toegekend" snap ik niet, wat is het verschil tussen een waarde en een feit? Feitelijk hebben we het over de enkelvoudig stuk informatie die we vastleggen over object. Een gegeven is een feit of een statement, bestaande uit een waarde, een kenmerk, en een onderwerp. Ik denk dat het dan ook heel eenvoudig kan worden gedefinieerd. Een gegeven is dus niet (alleen) "1-1-1970" of "Jan"; Dat zou ik zien als gegevenselement of een waarde; een value. Een gegeven is een enkelvoudig stuk informatie over een object. Een gegeven is dan ook niet een een instantie van een datatype. In 2.4.3.29 wordt dit verhaal ook deels al geschetst: ".. een waarde van een gegeven.". Los van of we dit "gegeven", "statement", "feit" of wat dan ook noemen is het naar mijn inziens belangrijk dat we onderscheid kunnen maken in 'het gegeven', bestaande uit een onderwerp (het betreffende object), het kenmerk (attribuut of relatie) en de waarde.

aansluitend: 2.3.2.2 Definities semantisch
Een attribuutsoort is een typering van gelijksoortige kenmerken van een object; dit leg je vast in een gegeven. Conform de voorgestelde definitie van gegeven.

Pas de definitie van gegeven aan zodat het een waarde van een kenmerk van een object betreft (inclusief het kenmerk en het onderwerp). Definieer daarnaast waarde, gegevenselement of dataelement als instantie van mim:Datatype. Dan is het ook noodzakelijk om het gebruik van gegeven op andere plekken in het document aan te passen. Als we toch graag "Gegeven" willen hanteren voor een 'waarde', laten we dan een term introduceren van de subject-attribute-value tuple.

architolk commented 4 months ago

Voorstel: "Een gegeven is een vastgelegde uitspraak over een eigenschap van een concept of relatie tussen concepten". Hiermee verbindt je ook een gegeven met de elementen van een conceptueel informatiemodel. Zie ook bijgevoegd plaatje waarin 1-en-ander met elkaar in verband is gebracht (dit plaatje komt uit het Verwerkingsmodel zoals de Politie dit gebruikt) image

lennartvanbergen commented 4 months ago

Verwerking vereist wat meer werk, mogelijk een discussie.

Marco zijn tekst is beter dan wat er staat en dekt ook af dat het vastgelegd is.

Ik vind het van belang dat het woord 'waarde' erin voorkomt. Ik vind het van belang dat we in MIM termen praten, een concept komt voor op laag 1, we kiezen hier wat mij betreft een woord uit laag 2, dus object.

Een gegeven is een vastgelegde uitspraak, een waarde, over een (getypeerde) eigenschap van een object.

pmaria commented 4 months ago

Een gegeven is een vastgelegde uitspraak over een eigenschap van een concept of relatie tussen concepten

  1. Waarom moet het zijn vastgelegd om een gegeven te zijn?
  2. Van Eigenschap zou ik dan attribuut maken, om de MIM terminologie te volgen. We gebruiken overigens eigenschap en kenmerk afwisselend in het document voor bredere termen van attribuut en relatie. Hier zullen we ook wat over moeten afspreken en consequent doorvoeren.

Een gegeven is een vastgelegde uitspraak, een waarde, over een (getypeerde) eigenschap van een object.

  1. Een waarde is onderdeel van een gegeven, niet het gegeven zelf.

Ik zou er dan van maken: Een gegeven is een uitspraak over een attribuut van een object of een relatie tussen objecten en bestaat uit:

architolk commented 4 months ago

Ad (1): een uitspraak gedaan door bv Piet, terwijl hij in gesprek was met Jan is geen gegeven. Het wordt pas een gegeven als het is vastgelegd (in een bestand, een service response, een database, etc); Ad (2): prima. Zolang we beseffen dat we met "attribuut" niet iets gegevenstechnisch bedoelen, maar een echte eigenschap/kenmerk van een object. En eens dat we een keuze moeten maken t.z.t (2.0) Ad (3): eens.

Overigens: ik ben het op zich wel eens met wat Pano voorstelt, maar wellicht verengen we een "gegeven" dan te veel? Want bv een uitspraak met meer dan alleen een onderwerp een een gezegde (maar bv ook een tijdsbepaling, meewerkend voorwerp, etc, etc) kunnen we dan nog niet in 1 gegeven kwijt...

lennartvanbergen commented 3 months ago

Zoals Pano het voorstel is ook zoals ik het altijd heb gezien, een stukje data waarvan je niet weet bij welke eigenschap of bij welke object het hoort, daar heb je niks aan. Maar zit in de formulering, die zodanig moet zijn dat je wel wat meer kan zeggen.

Voor de construct denkers onder ons wil je bv. ook de link naar de betekenis willen kunnen opnemen bij een gegeven.

Een mondelinge uitspraak, in de lucht zwevend, zie ik niet een gegeven. Dat het vastgelegd is op een dragend medium, is van belang.

Er is nog een discussie over uitspraak (statement) versus propositie (een als waar bedoelde uitspraak), ik zou niet elke willekeurige uitspraak willen zien als een gegeven, maar ook onware uitspraken zijn een gegeven, maar ze representeren niet de eigenschap van een object, maar alleen de bewering erover. Misschien is bewering wel een beter woord.

Maar goed, laten we niet MIM 2.0 zaken in 1.2 proberen op te lossen.

Samengevat:

Een gegeven is een vastgelegde bewering over een getypeerde eigenschap van een object.

Een getypeerde eigenschap van een object wordt gemodelleerd als een attribuuttype, relatietype, gegevensgroep of externe koppeling.

Waarde: zoals 'Jan' of '1-1-2024'. Om zeker te zijn dat het gegeven een toegestane waarde heeft moet de waarde van het gegeven voldoen aan het opgegeven datatype en eventuele aanvullende specificaties zoals een formeel patroon of waardelijst.

Bewering: een uitspraak, die meestal als waar bedoeld is maar niet per definitie waar is. Wie de bewering gedaan heeft is vaak, maar niet altijd, relevant. Denk aan een bewering door een bevoegd gezag, of door een persoon die gegevens opgeeft voor een bepaald doel.

Vastgelegd: het gegeven bevindt zich op een medium, een drager. Dit kan een besluit in een document zijn, of een bericht of in een database.

lennartvanbergen commented 3 months ago

Bij MIM 2.0 moeten we kijken naar of een gegeven alleen een rol speelt in een logisch gegevensmodel en dat we het in een conceptueel informatiemodel helemaal niet over gegevens hebben, maar dat voor de betekenis der dingen het wel van belang is dat er een link ligt naar de betekenis die bij een gegeven hoort. Dit is nu nog niet meegenomen.

lennartvanbergen commented 3 months ago

Dit issue is verwerkt in pull request https://github.com/Geonovum/MIM-Werkomgeving/pull/509

Ik kan 'm mergen, volgens mij klopt het een stuk beter dan eerst, maar als je er nog naar wilt kijken ga je gang

lennartvanbergen commented 3 months ago

Veel tekst om iets te beschrijven wat geen onderdeel is van een model ... maar goed, het is wel hetgeen we modelleren dmv typering dus het is wel goed om hier toch aardig wat over te zeggen.

Wat nog open staat is de structuur van een gegeven zelf en hoe dit precies in een model terechtkomt, en bv. of een gegeven wordt vastgelegd voor een attribuutsoort of dat het objecttype er wel degelijk bij hoort, het is immers een eigenschap van een object en de betekenis van het object is ook relevant om te kennen om het gegeven en het attribuutsoort te snappen. Dus, misschien is er behoefte aan de term gegevenstype en dat dit precies is en hoe dit zich uit in een model.

De nieuwe tekst;

Gegeven Een object heeft eigenschappen (ook wel kenmerken genoemd) waarvoor gegevens bekend zijn.

GegevenEen gegeven is een vastgelegde waarneming of bewering over een getypeerde eigenschap van een object. Een gegeven is geen modelelement in een informatiemodel. Toelichting:

Voorbeelden van gegevens zijn: de naam van een persoon is 'Jan', de geboortedatum van Jan is ‘1-1-1970’.

Eigenschappen van een object kun je waarnemen of beweren en vervolgens vastleggen als gegeven. Aan alleen de waarde '1-1-1970' heb je niet zo veel als je niet weet dat het om de geboortedatum van een persoon gaat (de eigenschap) en om welke persoon het precies gaat (het onderwerp van gesprek). De waarde '1-1-1970' wordt vastgelegd als de geboortedatum van een specifiek persoon. Het is dus van belang om welke eigenschap van welke specifieke persoon het gaat. Verder is het uiteraard van belang om te weten wat de betekenis is die bij het gegeven hoort.

Waarneming: een observatie die wordt waargenomen voor een eigenschap van een object. Bijvoorbeeld: de sensor waarneming dat de auto met kenteken 'AA 1234' met een snelheid van 120 kilometer per uur rijd. Een foto dat een brug op een bepaalde plek op aarde staat, of een meting van een geluid van 50 decibel.

Bewering: een uitspraak, die meestal als waar bedoeld is maar niet per definitie waar is. Mijn geboortedatum is '1-1-1970', de waarde van dit huis is 200.000 euro (in het jaar 2018). Wie bewering gedaan heeft is vaak relevant. Denk bij een bewering aan hetgeen waarover besloten wordt door een bevoegd gezag, of aan een persoon die een gegeven opgeeft voor een bepaald doel. Een bewering gedaan worden over iets dat in de werkelijkheid is waargenomen, zoals bij de aangifte van een geboortedatum van een baby. Maar een bewering hoeft niet te zijn waargenomen in de werkelijkheid, zoals wanneer er een bouwvergunning is verleend.

Vastgelegd: een gegeven kan in principe al bekend zijn zodra deze wordt waargenomen of beweerd, maar de waarneming moet eerst vastgelegd worden om bruikbaar te zijn in een informatievoorziening. De vastlegging kan op papier, in digitale vorm, op een foto, in een bericht, in een database et cetera.

Getypeerd: een model specificeert niet de gegevens zelf. Een gegeven zoals '1-1-1970' noemen we een waarde voor een attribuut van Jan. In het informatiemodel wordt dit bv. het attribuutsoort 'geboortedatum' of attribuutype 'overlijdensdatum' van een objecttype Persoon genoemd. Dat twee objecten een relatie hebben, gemodelleerd in het model als relatietype, wordt ook gezien als een eigenschap waarvoor een gegeven bekend kan zijn. De modelelementen waarmee een getypeerde eigenschap van een object gemodelleerd kan worden zijn: attribuutsoort, relatiesoort en externe koppeling. Hier kunnen gegevens over bekend zijn. Het datatype is hierbij van belang voor de waarde, en het objecttype is van belang omdat het helder moet zijn om welk object het gaat.

Waarde: de waarde '1-1-1970' is een onderdeel van het gegeven. Om zeker te zijn dat het gegeven een toegestane waarde heeft moet de waarde van het gegeven voldoen aan het opgegeven datatype en eventuele aanvullende specificaties zoals een formeel patroon of dat de waarde voorkomt in een waardelijst. Er zijn waardes die:

een enkelvoudige structuur hebben, zoals bij de voornaam 'Jan', of het object Natuurlijk persoon met identificatie '123'; een interne structuur kennen die nader onderverdeeld is, zoals bijvoorbeeld een geometrie die bestaat uit meerdere coördinaten, een coördinaten referentiesysteem, enzovoorts. De onderdelen, oftewel de data elementen, vormen samen de waarde (de dataelementen zijn zelf niet een gegeven, maar zijn slechts een onderdeel ervan). Met de vastlegging van gegevens in een informatievoorziening wordt een model van de werkelijkheid bevroren in de tijd. Hoewel de werkelijkheid nooit stil staat, kan deze door het vastleggen van de gegevens toch worden bevroren. Bij een gegeven kunnen ook metagegevens worden vastgelegd, voor het bijhouden van historie, zoals de tijdslijn geldigheid en de tijdslijn registratie. Op deze manier weet een gebruiker van de informatievoorziening wanneer het gegeven geldig is (of is geweest) en wanneer het gegeven is vastgelegd op een bepaald medium. Met betrekking tot gestructureerde datatypes: het is (meestal) niet zinvol om voor een onderdeel van een gegeven, oftewel een afzonderlijk data element van een gestructureerde datatype, historie bij te houden, want een onderdeel van een gegeven representeert niet de gehele waarde.

lennartvanbergen commented 3 months ago

Opgelost met pull request 590 en later 513 (die 509 vervangt).

Bakkej commented 3 months ago

Misschien nog even een insteek. Met het informatiemodel beschrijf je welke atomaire eenheden van informatie vastgelegd kunnen worden; deze noemen we «Gegevens» (een verzameling gegevens met eenzelfde onderwerp een informatieobject/gegevensobject/voorkomen). Hoe ik de gegeven definitie van «gegeven» :) lees is in lijn met de definitie van data item welke op goede gronden is gedefinieerd. Zien jullie dat ook zo? wellicht kunnen we aan de begrippen-kant hier wel een koppeling tussen leggen. Daar worden in ieder geval de componenten 1) onderwerp, 2) kenmerk, 3) waarde en 4) tijd genoemd waarbij tijd vaak niet expliciet vastgelegd wordt als onderdeel van het gegeven. Interessant genoeg zijn het het onderwerp, kenmerk en tijd welke een gegeven identificeert en niet, zoals gebruikelijk in RDF, het onderwerp, kenmerk en waarde (de triple).

Ik denk ook dat het belangrijk is dat we erkennen dat een «waarde» niet altijd met een «datatype» wordt getypeert. We stellen immers dat het bereik van een «relatiesoort» (welke ook onderdeel van een gegeven kan zijn) juist geen «datatype» mag zijn.

Maar wat ik eigenlijk wilde inbrengen is dat er vaker modelmatig over een «gegeven» gesproken wordt. Er er is dus een ook term voor de combinatie: Objecttype, attribuutsoort/relatiesoort, datatype/objecttype. In het engels is dat data element. Beetje ongelukkig omdat in MIM met "data element" (nederlands) iets anders wordt bedoelt. Dit komt terug in meerdere ISO standaarden maar is gedefinieerd in ISO/IEC 11179-3.