Suréchantillonnage avec Epsilon

J'ai une question à propos de l'exploration de données. J'ai un jeu de données de 74 instances qui appartiennent à 4 classes. Comme le nombre de chaque classe n'est pas suffisant pour obtenir une bonne précision en utilisant certains classificateurs (svm, rna, knn), j'ai besoin de "suréchantillonner" le nombre d'instances de chaque classe.Suréchantillonnage avec Epsilon

J'ai entendu dire qu'il existe une méthode pour cela. Il consiste à générer ces nouvelles instances comme suit:

new_instance <---- original_instance + u(epsilon)

mais je n'ai pas plus de connaissances à ce sujet.

Quelqu'un a utilisé cette méthode pour "suréchantillonner" ses données?

Source

2013-03-31 user2228819

Je n'ai jamais utilisé cette méthode de suréchantillonnage, mais je pense que vous pouvez trouver des pointeurs utiles in this paper.

Plusieurs suréchantillonnage ainsi que le sous-échantillonnage sont décrits. Cela devrait vous aider à trouver la méthode la plus appropriée pour votre cas.

Source

2013-03-31 09:18:55 Julien

Suréchantillonnage avec Epsilon

Répondre

Questions connexes