J'ai i df suivant nommé:application str_split à une colonne dans dataframe
structure(list(price = c(11772, 14790, 2990, 1499, 21980, 27999
), fuel = c("diesel", "petrol", "petrol", "diesel", "diesel",
"petrol"), gearbox = c("manual", "manual", "manual", "manual",
"automatic", "manual"), colour = c("white", "purple", "yellow",
"silver", "red", "rising blue metalli"), engine_size = c(1685,
1199, 998, 1753, 2179, 1984), mileage = c(18839, 7649, 45058,
126000, 31891, 100), year = c("2013 hyundai ix35", "2016 citroen citroen ds3 cabrio",
"2007 peugeot 107 hatchback", "2007 ford ford focus hatchback", "2012 jaguar xf saloon",
"2016 volkswagen scirocco coupe"), doors = c(5, 2, 3, 5, 4, 3
)), .Names = c("price", "fuel", "gearbox", "colour", "engine_size",
"mileage", "year", "doors"), row.names = c(NA, 6L), class = "data.frame")
Certains des mots dans la colonne « année » sont dupliquées. Je voudrais les enlever. Dans un premier temps, je voudrais séparer la chaîne de caractères dans cette colonne dans des mots séparés. j'ai pu le faire pour une chaîne séparée, mais lorsque je tente de l'appliquer à l'ensemble de trame de données lui donne une erreur
unlist(str_split("2013 hyunday ix35", "[[:blank:]]"))
[1] « 2013 » « Hyunday » « ix35 »
for(k in 1:nrow(i))
+ i[k,7]<-unlist(str_split(i[k, 7], "[[:blank:]]"))
erreur dans [<-.data.frame
(*tmp*
, k, 7, valeur = c ("2013", "hyundai": remplacement a 3 rangées, les données ont une
Il fonctionne très bien . J'ai essayé d'utiliser sapply, mais je ne savais pas comment combiner deux fonctions (coller et unique) ensemble. – Vasile