UMCUneuro / MRI

Research done extraordinarily easy. Wisdom of the crowd. Share your own script. :-)
GNU General Public License v3.0
0 stars 4 forks source link

Wide2long #8

Closed HHGTan closed 6 years ago

HHGTan commented 6 years ago

Zie hier mijn benadering voor het implementeren van automatische wide2long herkenning.

De hiervoor gebruikte progeny query staat onder de map Netherlands/Harold Tan/20180214_MRI Een van de verschillen hierbij is dat de variabele 'ALS number' wordt gebruikt ipv 'ALS nummer #'. Dit heeft Bas ooit aanbevolen omdat deze het best wordt bijgehouden.

Wide2Long summary:

  1. Groepeer op adist =< 1
  2. Kijk van elke groep wat de common string is = subgroep
  3. Kijk of er common strings zijn tussen alle subgroepen = supergroep
  4. Kijk of de supergroep daadwerkelijk in format1.xlsx onder Group staat
  5. Voor elke supergroep waar punt 4 waar is, wordt een long format tabel gemaakt.

Nog een opmerking over guess_max: Read_excel default geeft aan dat als de eerste 1000 regels NA zijn, de variabele geïmporteerd wordt als class:logical. Bij de ECAS komt het voor dat de eerste regels NA kunnen zijn maar later nog wel andere class data staat. Mijn oplossing was om een arbitrair hoog getal (ipv de eerste 1000) door te geven aan guess_max. De andere oplossing is natuurlijk om alles als character te laten importeren.

Ik hoor graag wat je ervan vindt.

HJWesteneng commented 6 years ago

@HHGTan Ik weet nog niet precies hoe ik goed kan reviewen maar ik ga gewoon mergen en dan kijken of het OK werkt. Uitleg erbij is ook fijn!