Fuenfgeld / ATeamDatenmanagementUndArchivierung

MIT License
7 stars 0 forks source link

Are transformations needed for the data we use? #24

Closed lknegendorf closed 3 years ago

lknegendorf commented 3 years ago

If so, we need to do the transformations

lknegendorf commented 3 years ago

As already explained in the documentation (see here the datasets COVID-19 and ALLERGY contain duplicate valued in both TB_OBSERVATIONS and TB_SUPPLIES

fphans commented 3 years ago

ist das nicht durch das AUTO_Increment gelöst

lknegendorf commented 3 years ago

ist das nicht durch das AUTO_Increment gelöst

Ne dadurch besteht das Problem ja weiter, die Daten lassen sich nur in die Datenbank laden. Die Duplikate bei Observations lassen sich bspw. über eine AVG-Aggregatfunktion, die in supplies über eine SUM-Aggregatfunktion lösen, wäre meine spontane Antwort.

lknegendorf commented 3 years ago

As already explained in the documentation (see here the datasets COVID-19 and ALLERGY contain duplicate valued in both TB_OBSERVATIONS and TB_SUPPLIES

  • [x] Remove duplicates from TB_OBSERVATIONS
  • [x] Remove duplicates from TB_SUPPLIES

Beide Tabellen werden nicht gebraucht (vgl. #30, #16 und folgende)

lknegendorf commented 3 years ago
lknegendorf commented 3 years ago

Check