1

J'ai une question à propos de l'exploration de données. J'ai un jeu de données de 74 instances qui appartiennent à 4 classes. Comme le nombre de chaque classe n'est pas suffisant pour obtenir une bonne précision en utilisant certains classificateurs (svm, rna, knn), j'ai besoin de "suréchantillonner" le nombre d'instances de chaque classe.Suréchantillonnage avec Epsilon

J'ai entendu dire qu'il existe une méthode pour cela. Il consiste à générer ces nouvelles instances comme suit:

new_instance <---- original_instance + u(epsilon) 

mais je n'ai pas plus de connaissances à ce sujet.

Quelqu'un a utilisé cette méthode pour "suréchantillonner" ses données?

Répondre

0

Je n'ai jamais utilisé cette méthode de suréchantillonnage, mais je pense que vous pouvez trouver des pointeurs utiles in this paper.

Plusieurs suréchantillonnage ainsi que le sous-échantillonnage sont décrits. Cela devrait vous aider à trouver la méthode la plus appropriée pour votre cas.

Questions connexes