2009-08-25 5 views
3

Je suis à nouveau confronté à un problème que je suis en train de chercher. J'ai des données de suivi, ce qui signifie que je me suis retrouvé à faire du vélo plusieurs fois sur la même piste afin d'avoir des données de test. J'ai donc des paires temps-distance. Je veux encore plus différents, mais je veux les générer. Je veux que les pilotes de test virtuels soient à la fois plus rapides et plus lents. Je ne veux pas que ce soit un algorithme de résumé linéaire.Exemple de génération de données à partir de données existantes - Algorithme?

Fondamentalement, je veux juste un indice, ce que je pourrais rechercher. Quelqu'un peut-il aider?

Répondre

2

Essayez de multiplier la valeur de temps de chaque point de données par une constante. Si c'est moins d'un, vous allez créer un lecteur de test plus rapide, et s'il y en a plus d'un, vous aurez un test plus lent. Vous pouvez également fudge la position de même si vous le souhaitez.

+0

il s'agit d'une transformation affine, y = Ax + b. b pourrait être un petit nombre aléatoire pour aider à changer la forme générale/le rythme de la course de vélo. – nlucaroni

+0

semble être une solution. pour l'avoir un peu plus réaliste, j'ajouterais ce nombre aléatoire seulement à chaque minute et j'interpellerai le changement aléatoire entre les deux, ainsi j'évite les sauts dans la performance d'un coureur. Je pense que cela reflétera assez bien le "comportement de course". Merci à tous, j'apprécie ces suggestions et jetterai un coup d'œil sur les autres. – rdoubleui

+0

juste pour votre intérêt, je vais mettre le changement sur la valeur de la distance, comme je veux garder des valeurs de temps discrètes pour permettre une comparaison facile. – rdoubleui

2

Vous pouvez utiliser un pseudo random number generator pour générer des variations aléatoires basées sur vos données d'origine. Il suffit de fournir une plage +/- de vos valeurs mesurées que vous permettez à l'aléatoire d'aller, et de générer des valeurs de jeu de données aléatoires pour le temps + la distance. Cela vous permettrait de générer autant de cas de test que nécessaire.

4

Vous pouvez consulter Markov Chains pour générer des données aléatoires bien que cela dépende de la complexité de la distribution des données. Pour une approche plus simple, la solution de Reed Copsey sera plus facile à mettre en œuvre.

Questions connexes