J'ai un ensemble de données avec ~ 1 million de lignes de transaction que j'essaie de convertir d'un data.frame en une classe de transaction à utiliser dans la fonction apriori
du paquet arules
. J'utilise la forme discutée dans la documentation:R arègles - moyen rapide de créer des transactions
a_df3 <- data.frame(
TID = c(1,1,2,2,2,3),
item=c("a","b","a","b","c", "b")
)
a_df3
trans4 <- as(split(a_df3[,"item"], a_df3[,"TID"]), "transactions")
Cependant, pour de grandes parties de données, ceci est extrêmement lent. Y a-t-il des moyens d'accélérer cela?