2017-10-11 18 views
0

Je souhaite calculer la moyenne et la norme d'un ensemble de données de séries chronologiques qui ne sont enregistrées qu'en cas de changement de valeur.Calcul moyen/standard du changement de valeur de consignation de données uniquement

La série temporelle est à des intervalles de 1 seconde, ce qui présente le risque d'un ensemble de données gonflé si chaque valeur manquante entre les changements est générée.

Exemple de type ensemble de données: [Epoch, valeur]

[[152345235, 3], [152345335, 12], [152345835, 8]] 

Nous utilisons python pour le nettoyage et l'agrégation des données. Une matrice clairsemée ne suffirait pas, car elle est basée sur l'ignorance de 0 valeurs qui ne sont pas présentes. Sur la recherche, il n'y avait rien montrant qui pourrait facilement résoudre ce problème.

Ma question est, quelqu'un at-il rencontré un problème similaire, et si oui, quelles techniques ont été utilisées pour résoudre.

+1

signifie simplement sum()/n et vous devriez savoir ce que n est. std est un peu plus difficile mais la même approche de base fonctionnera. vous avez juste besoin de (0-mean) * (n-x) où x est le nombre de non-zéros. – JohnE

Répondre

1

Je voudrais commander la liste par epoch, puis multipliez le value de chacun par la différence entre epochs. Vous n'avez pas besoin de stocker des données supplémentaires de cette façon, mais vous pouvez facilement résoudre la moyenne.