Closed jalazawa closed 6 years ago
J'ai le même problème de duplication de lignes pour CTA, CTY et BZN pour AUSTRIA, GERMANY et FRANCE. La seule différence est que la ligne dupliquée est à "02:00".
AUSTRIA : Les données sur Rstudio :
Sur le FTP :
GERMANY :
Les données sur Rstudio :
Sur le FTP :
FRANCE :
Les données sur Rstudio :
Sur le FTP :
C'est ok pour moi et toi @FabiolaAravena ?
Attention quand on subset une date posixct
, vous pouvez utiliser la fonction suivante si nécessaire:
as_ct <- function(str) fasttime::fastPOSIXct(str, tz = "GMT")
C'est ok pour moi aussi!
J'ai constaté des lignes dupliquées sur les données importées.
Après quelques recherche, il semble que la ligne n'est pas vraiment dupliqué mais une erreur dans l'heure semble provoquée la duplication et la suppression d'une autre ligne.
Par exemple, si je fais ceci
j'obtiens ce tableau
Mais sur les fichiers du FTP je constate ceci
On constate alors que la deuxième ligne à "01:00" et en fait la ligne correspondant à la donnée à "02:00".
Dans le tableau sur R, sur la ligne 3, on devrait lire la date suivante "2015-03-29 02:00:00" correspondante à la valeur 369.
J'ai aussi constaté qu'il y'a 262 lignes dupliquées dans les données importées.
On devrait faire une vérification lors de l'import (un assert dans le code ?) afin de s'assurer qu'il n'y a pas de lignes dupliquées dans la table.