J'ai un grand bloc de données qui contient les données des clients. J'essaie d'activer un algorithme sur chaque client, mais face à des problèmes de performance. Pour cette raison, je voudrais sous-ensemble des données sur chaque client, mais en prenant seulement les dernières observations les plus à jour.Données de sous-ensemble avec numéro de ligne limité
questions importantes:
Je suis en mon algorithme pour chaque nouvelle observation (ce qui signifie, je besoin d'un « nouveau » sous-ensemble pour chaque nouvelle observation)
Je tiens une histoire de tous les clients (ce qui est la « grande trame de données » mentionnées ci-dessus) qui rafraîchissent une fois par jour
je pensais faire quelque chose comme (et puis en sélectionnant l'tail
ou head
ou d'une autre, plus rapide, méthode):
dfrm %>% group_by(cust_id) %>% .[order(-.[,1]),]
où ma première colonne est la date et l'heure cutomer a pris son achat dans le format suivant yyyy-mm-dd HH:MM:SS
(de la structure POSIXct
); mais je reçois une erreur de
Erreur dans
-POSIXt
(à gauche): unaire « - » est pas défini pour les objets « POSIXt »
En plus de résoudre mon problème, je serai heureux d'entendre d'autres idées pour gérer mon problème.
Pourquoi n'utilisez-vous pas 'arrange'? et peut-être «tranche» ou «filtre» –