2017-10-17 1 views
-3

J'ai un cadre de données avec des informations de permis de stationnement pour les étudiants au collège. J'ai beaucoup d'informations, mais le modèle que je cherche est en ce qui concerne les clients réguliers au cours des différentes années scolaires. Laissez-moi vous donner l'idée de base de ce que j'ai et de ce dont j'ai besoin.Extraction de modèles à partir de données

Student.ID Date.bought  Academic.year Parking.Lot 
001   Sept 7, 2008 Freshmen  West 
001   Sept 2, 2009 Freshmen  West 
001   Aug 10, 2010 Sophomore  East 
002   Aug 12, 2009 Freshmen  North 
002   Sept 4, 2011 Junior   North 

Je veux faire des drapeaux pour les personnes qui ont acheté au cours de l'année de première année, étudiants de première année + deuxième année, étudiants de première année + deuxième année + seniors, et essentiellement d'autres combinaisons. Quelqu'un pourrait-il m'aider à prendre quelques exemples, afin que je puisse créer les autres permutations par moi-même?

Le résultat final souhaité ressemblerait à ceci. Fondamentalement finir avec un vrai/faux pour chaque permutation que je crée.

+0

Qu'est-ce que la sortie de ces données d'échantillons fournir? – wallyk

Répondre

0

simplement:

df1 <- model.matrix(~Student.ID + Academic.year -1, data=df1) 

df1 <- as.data.frame(df1) 

aggregate(. ~ Student.ID, data=df1,max) 
+0

Je pense que je ne devrais pas avoir formulé ma question correctement. Je cherche les combinaisons. Donc, dans le cas de l'étudiant 001, ils ont acheté une carte de stationnement dans leur première année et deuxième année, donc je veux faire une colonne pour "Si vous avez acheté un permis de stationnement pour vos étudiants de première année et deuxième année". Dans le cas de l'élève 001, ils auraient une valeur Vrai et pour l'élève 002, ce serait faux. Dans la colonne «Avez-vous acheté un permis de stationnement pour vos étudiants de première année et votre première année», l'étudiant 001 aurait un faux et l'étudiant 002 aurait une valeur réelle. – Xanman