Zie hier mijn benadering voor het implementeren van automatische wide2long herkenning.
De hiervoor gebruikte progeny query staat onder de map Netherlands/Harold Tan/20180214_MRI
Een van de verschillen hierbij is dat de variabele 'ALS number' wordt gebruikt ipv 'ALS nummer #'.
Dit heeft Bas ooit aanbevolen omdat deze het best wordt bijgehouden.
Wide2Long summary:
Groepeer op adist =< 1
Kijk van elke groep wat de common string is = subgroep
Kijk of er common strings zijn tussen alle subgroepen = supergroep
Kijk of de supergroep daadwerkelijk in format1.xlsx onder Group staat
Voor elke supergroep waar punt 4 waar is, wordt een long format tabel gemaakt.
Nog een opmerking over guess_max: Read_excel default geeft aan dat als de eerste 1000 regels NA zijn, de variabele geïmporteerd wordt als class:logical. Bij de ECAS komt het voor dat de eerste regels NA kunnen zijn maar later nog wel andere class data staat.
Mijn oplossing was om een arbitrair hoog getal (ipv de eerste 1000) door te geven aan guess_max. De andere oplossing is natuurlijk om alles als character te laten importeren.
Zie hier mijn benadering voor het implementeren van automatische wide2long herkenning.
De hiervoor gebruikte progeny query staat onder de map Netherlands/Harold Tan/20180214_MRI Een van de verschillen hierbij is dat de variabele 'ALS number' wordt gebruikt ipv 'ALS nummer #'. Dit heeft Bas ooit aanbevolen omdat deze het best wordt bijgehouden.
Wide2Long summary:
Nog een opmerking over guess_max: Read_excel default geeft aan dat als de eerste 1000 regels NA zijn, de variabele geïmporteerd wordt als class:logical. Bij de ECAS komt het voor dat de eerste regels NA kunnen zijn maar later nog wel andere class data staat. Mijn oplossing was om een arbitrair hoog getal (ipv de eerste 1000) door te geven aan guess_max. De andere oplossing is natuurlijk om alles als character te laten importeren.
Ik hoor graag wat je ervan vindt.