2012-04-28 2 views
1

J'ai des fréquences de mots observées dans un corpus de données en un seul jour, sur une période de 10 minutes. Les données ressemble à ceci:R ts() pour spécifier que les données ont été collectées sur un intervalle de 10 minutes en un seul jour

word 00:00:00 00:11:00 00:22:00 00:33:00 . . . . 23:17:00 23:28:00 23:39:00 
Robert 10  20  22  32 . . . . 10  11  10 
Harvey 12  35  12  12 . . . . 15  26  9 

Je veux générer un objet de séries chronologiques pour ces données en utilisant R. Je sais que la fonction ts() peuvent être utilisés pour générer l'objet de séries chronologiques où je peux préciser l'année de début et l'intervalle de temps étant des mois ou des trimestres. Exemple:

ts(data, frequency=12, start=c(1946,1)) 

Mais, je ne sais pas comment puis-je utiliser ts() pour spécifier que les données ont été recueillies sur 10 minutes des intervalles de temps en une seule journée. Une idée?

En outre, comme vous pouvez le voir mes données ont des informations de temps dans l'en-tête. Est-ce que cela peut être utilisé pour générer un objet de série temporelle dans R?

Répondre

3

En bref, vos principales options sont

  1. Utilisez ts(), mais lisez la page d'aide et comprendre que vous pouvez utiliser frequency=oudeltat=. Comme votre fréquence de données est en fait régulière, vous pourriez essayer quelque chose comme deltat=24*60/11. [Et en regardant vos données, il semble que ce soit 11 minutes plutôt que 10 comme le suggère le titre de votre question. ] ts() est utile si vous voulez adapter les modèles de classe ARIMA.

  2. Utilisez le package zoo et sa classe zooreg et consultez la documentation dans les vignettes de package. Je trouve que zoo est plus facile à utiliser.

+0

merci ts() fonctionne selon votre suggestion. Je vais essayer le zoo plus tard. – tan

Questions connexes