J'ai donc l'ensemble des données suivantes (ce qui est un petit échantillon/exemple de quoi il ressemble, avec les lignes et 30 colonnes étant 7k originales de plus de 7 ans):Comment utiliser résumé et grouper par pour créer un tableau récapitulatif dans r?
Year,Location,Population Total, Median Age, Household Total
2000, Adak, 220, 45, 67
2000, Akiachak, 567, NA, 98
2000, Rainfall, 2, NA, 11
1990, Adak, NA, 33, 56
1990, Akiachak, 456, NA, 446
1990, Tioga, 446, NA, NA
Je veux créer un résumé tableau qui indique le nombre d'années de données disponibles par emplacement pour chaque variable. Donc, quelque chose comme ça fonctionnerait (pour le petit exemple d'avant):
Location,Population Total, Median Age, Household Total
Adak,1,2,2
Akiachak,2,0,2
Rainfall,1,0,1
Tioga,1,0,0
Je suis nouveau à R et n'ont pas utilisé ces deux commandes ensemble, donc je ne suis pas sûr de la syntaxe. Toute aide serait merveilleuse ou alternative.
Vous devez utiliser le package 'dplyr'. Commencez par 'group_by (Location)', puis écrivez votre déclaration 'summarise' ou' count'. Je suggère de regarder dans un tutoriel sur l'utilisation de 'dplyr' cependant. –
En outre, vous recevrez un bien meilleur retour sur les questions ici si vous fournissez un exemple d'approches que vous avez essayées. Tel quel, certains pourraient interpréter cela comme une question de devoirs ... –
Merci! Je pense à changer tout ce qui n'est pas NA à 1, Na à 0 et ensuite agréger les lignes tout en emportant les années. Mais mon patron dit que je devrais essayer d'utiliser ces deux fonctions ensemble. – jules