Je travaille actuellement avec un ensemble de données où les prêts sont affichés avec un but pour le prêt et une note de prêt associée pour chaque prêt.Grouper les catégories par paires ensemble
L'ensemble de données est appelée loancase et l'une des colonnes est le but tandis qu'une autre colonne est qualité.
Ci-dessous, j'ai la matrice qui doit être remplie deux fois avec des proportions. Chaque ligne doit totaliser 100%, ce qui signifie que chaque entrée correspond à la proportion correspondant à l'objectif spécifique ayant reçu cette note. Par exemple, la ligne pour [Car,] peut ressembler à 20, 20, 0, 0, 20, 0, 40.
Notez que l'espace réservé pour les données actuelles est NA et j'essaie de le remplacer par un vecteur répertoriant chaque entrée souhaitée.
matrix(data = NA, nrow = 14, ncol = 7, dimnames = list(levels(loancase$purpose), levels(loancase$grade)))
Comment puis-je atteindre cet objectif de remplir chaque entrée avec la valeur désirée? Je pense actuellement que j'utilise tapply() mais je ne sais pas comment y parvenir. Voici le code actuel qui ira à la place de "NA" mais ce n'est pas correct à partir de maintenant.
grades.per.purpose = tapply(loancase$grade, levels(loancase$purpose), sum)
Veuillez fournir les données sous forme de texte brut, pas d'image, afin que les utilisateurs puissent copier/coller. – neilfws
Ajouté lignes pertinentes de code – user1713336