UMCUGenetics / DIMS

Direct Infusion Mass Spectrometry pipeline
MIT License
2 stars 2 forks source link

Files "IS plots, IS_results.RData and Pos_Contr.RData" not created in step 13 #15

Closed FiniDG closed 4 years ago

FiniDG commented 4 years ago

Error message Slurm: Slurm Job_id=2860387 Name=13-excelExport_RES_PL_20200716_Diagnosis2017_RUN4 Failed, Run time 00:17:15, FAILED, ExitCode 1

Error message in log (logs/13-excelExport/exp.e)

Error in `[.data.frame`(IS, c(names(repl.pattern), "HMDB_code")) : 
  undefined columns selected
Calls: [ -> [.data.frame
Execution halted

Problem probably lies in the script: 13-excelExport.R after the big excel file is made.

FiniDG commented 4 years ago

problem found. Sample names did not comply with the naming convention, described in the SOP "aMEZ0220 Dataverwerking Untargeted Metabolomics". Like {EXTRAINFO}_[P,C].[1-9] example: “P229.1”. In this specific project, the names were structured like P_229.1 that resulted in mismatches along the way.

Dutch description from the SOP below: · Opletten: o Kolom 1: “File_Name”; Kolom 2: “Sample_Name” o “P” en “C” zijn vereist, beide hoofdletters, deze mogen maar 1x voorkomen, dus geen “P” of “C” in de project informatie voor de underscore (zie 3 pnt verder) anders crashed het script. o Minimaal één, maximaal één punt o Gevolgd door een getal, 1-…, zonder nullen ervoor o Extra informatie toevoegen vóór de naam, gevolgd door een underscore Voorbeeld naamgeving: SMA_P100.1 o Opletten: kloppen de replicates bij alle monsters? o ERRORS: naamgeving samples, te weinig samples in fil o Alle overbodige kolommen en rijen (weer) uit Excel verwijderen