UMCUneuro / MRI

Research done extraordinarily easy. Wisdom of the crowd. Share your own script. :-)
GNU General Public License v3.0
0 stars 4 forks source link

Ignore case voor factors? #21

Open HHGTan opened 6 years ago

HHGTan commented 6 years ago

Het veld MRI 3T: Subjecttype is niet uniform als het gaat om hoofdletters en kleine letters. Zowel Controle als controle komen bijvoorbeeld voor. Hoe zullen we dit oplossen?

  1. Veranderen in Progeny. Waarschijnlijk snel op te lossen, maar niet per se handig als dit bij meerdere velden voorkomt.
  2. Alles naar een vast format overzetten. zie hier een functie: https://stackoverflow.com/questions/27782166/r-how-to-improve-simplecap-to-handle-more-complex-names
  3. Herkenning met 'case ignore' o.b.v. de Possible_values kolom uit Format_v1, voor elke match de waarde omzetten naar hoe hij staat beschreven in Possible_values.

Zelf zou ik zeggen dat optie 3 het mooist is, omdat je het dan centraal houdt in Format_v1, maar ik ben bang dat het script technisch minder efficient wordt/onnodig ingewikkeld.

Wat denk jij @HJWesteneng ?