J'utilise les données de noms de bébé dans R pour la pratique.max ([colonne]) où nom = (chaque nom unique dans la colonne de nom) pour chaque année dans R
total_n <-babynames %>%
mutate(name_gender = paste(name,sex))%>%
group_by(year) %>%
summarise(total_n = sum(n, na.rm=TRUE)) %>%
arrange(total_n)
bn <- inner_join(babynames,total_n,by = "year")
df <- bn%>%
mutate(pct_of_names = n/total_n)%>%
group_by(name, year)%>%
summarise(pct =sum(pct_of_names))
La sortie dataframe ressemblait à ceci:
Pour chaque nom, il y a toutes les années et le pct lié pour cette année. Je suis coincé avec obtenir l'année avec le plus haut PCT pour chaque nom. Comment puis-je faire cela?
omg, ne peut pas croire que c'est aussi simple, je pensais à boucler. Je vous remercie! –
N'hésitez pas à accepter la réponse, aussi! – Steven