J'ai un grand ensemble de données (quelques millions d'observations) qui contient une variable datetime avec un format incohérent: "% Y-% m-% d% H:% M:% S"; "% m /% d /% Y et% H:% M:% S".Mise en forme d'une variable datetime incohérente
Voici comment l'ensemble de données ressemble à:
df <- data.frame(var1 = c(1:6),
var2 = c("A", "B", "C", "A", "B", "C"),
datetime = c("2013-07-01 00:00:02", "2016-07-01 00:00:01",
"9/2/2014 00:01:20", "9/1/2014 00:00:25",
"1/1/2015 0:07", "6/1/2015 0:01"))
Y at-il un moyen efficace de formater la variable datetime dans un format de temps la date cohérente unique?
Si vous n'aviez pas de dates ambiguës (telles que 9/2/2014), vous pouvez utiliser 'anytime' du paquetage anytime. En l'état, vous ne pouvez utiliser 'as.POSIXct' avec tous les formats que vous avez dans vos données et fusionner les résultats dans un seul vecteur – Roland