J'ai dataframe avec 2 colonnes:obtenir les premières lettres des noms doubles/tripple-baril en data.frame
> df1
Surname Name
1 The Builder Bob
2 Zeta-Jones Catherine
Je veux ajouter une troisième colonne « Shortened_Surname » qui contient les premières lettres de tous les mots dans le champ de nom de famille:
Surname Name Shortened_Surname
1 The Builder Bob TB
2 Zeta-Jones Catherine ZJ
Notez le "-" dans le deuxième nom. J'ai des noms de famille barrel séparés par espaces et traits d'union.
J'ai essayé:
Etape 1:
> strsplit(unlist(as.character(df1$Surname))," ")
[[1]]
[1] "The" "Builder"
[[2]]
[1] "Zeta-Jones"
Ma recherche suggère que je pourrais peut-être utiliser strtrim
comme l'étape 2, mais tout ce que j'ai trouvé est de plusieurs façons comment ne pas faire il.
Les lettres sont-elles toujours en majuscules? – Heroka
@Heroka non, mais je vais utiliser 'casefold' pour faire tout en minuscules – gmarais