Datalake technieken ondersteunen geen of zeer beperkte referential integrity. Dat wil zeggen dat het concept van foreign keys zoals we dat in een RDBMS kennen niet bestaat.
Delta Lake heeft (beperkte) functionaliteit voor constraints
Biquery heeft uberhaupt geen constraints
We willen referential integrity kunnen toepassen, waarbij bijvoorbeeld alle adressen terugverwijzen naar de BAG masterdata (leidend voor adressen). De vraag is hoe.
Zie ook dit artikel wat een vergelijkbaar issue adresseert maar dan enkel voor primary keys. Deze blogpost geeft een overzicht welke problemen er zoal zijn omdat datalake geen constraints kennen zoals een RDBMS dat wel heeft.
Issue
Datalake technieken ondersteunen geen of zeer beperkte referential integrity. Dat wil zeggen dat het concept van foreign keys zoals we dat in een RDBMS kennen niet bestaat.
We willen referential integrity kunnen toepassen, waarbij bijvoorbeeld alle adressen terugverwijzen naar de BAG masterdata (leidend voor adressen). De vraag is hoe.
Zie ook dit artikel wat een vergelijkbaar issue adresseert maar dan enkel voor primary keys. Deze blogpost geeft een overzicht welke problemen er zoal zijn omdat datalake geen constraints kennen zoals een RDBMS dat wel heeft.