handwerk - Githubissues

naturalis / trait-geo-diverse-ungulates

Comparative analysis of abiotic niches in Ungulates

https://naturalis.github.io/trait-geo-diverse-ungulates/

2 stars 4 forks source link

handwerk #11

Open rvosa opened 5 years ago

rvosa commented 5 years ago

Het valt me op dat de naam van de vicuna verkeerd is gespeld en dat er wat inconsistenties zijn in de kolommen van de gedomesticeerde data sets (quotes ja/nee, een eerste kolom met record numbers ja/nee). Ik vermoed dat dit het resultaat is van handwerk, wat dus niet goed reproduceerbaar is. Het lijkt me toch beter dat we dat niet doen: in principe moet elke stap opnieuw te doen zijn door scripts te runnen.

ElkeHendrix commented 5 years ago

Klopt ik zie al wat ik verkeerd heb gedaan, ik heb alle zipfiles afzonderlijk gedownload en toen is er wat mis gegaan met de namen. Ik download nu alles direct van de github.

En bij het opslaan als csv voegt r een id row toe, ik kijk even hoe ik die eruit haal.

En wat bedoel je precies met de quotes, gaat dat om de underscore of om meer?

rvosa commented 5 years ago

Als je CSV wegschrijft met R dan gaan er by default double quotes om alle tekstvelden, dus de soortnamen. Die kolom met nummers en die quotes zet je zo uit: https://github.com/naturalis/trait-geo-diverse-ungulates/blob/master/script/darwincore2csv.R#L38-L44

rvosa commented 5 years ago

Sorry, maar het kan echt niet dat er stiekem toch dingen met de hand gedaan moeten worden. De gedachte is dat dit onderzoek door anderen opnieuw uitgevoerd kan worden. Als we een manuscript indienen en het blijkt niet te werken omdat er stilletjes stappen gezet moesten worden die nergens gedocumenteerd staan = reject = al het werk voor niets gedaan.