J'ai récemment posé une question sur le comptage du nombre de fois qu'un élément s'était répété (http://stackoverflow.com/questions/7669553/how-to-assign- nombre-de-répétitions-à-base de données-sur-les-éléments-d'identification/7669607 # 7669607) dans une grande trame de données. J'ai reçu quelques conseils très utiles, qui ont fonctionné sur un petit nombre de lignes, mais qui doivent maintenant effectuer l'opération à un niveau beaucoup plus grand (plus de 255k lignes, avec environ 100k groupes formés en utilisant ddply):Problèmes avec ddply pour diviser un grand nombre de catégories en R
Si vous tentez d'effectuer cette opération sur le jeu de données le plus volumineux, R risque de s'étouffer en raison de problèmes de mémoire. Y a-t-il des solutions évidentes à cela? Merci d'avance (surtout pour la patience car je suis un nouveau "programmeur").
Cette deuxième solution a fonctionné pour le problème particulier auquel je faisais face; Je vais jouer avec data.table et revenir vers vous car je pense que ce genre de chose se produira à nouveau dans une application différente. Merci! – SMM