J'ai une question à propos de l'exploration de données. J'ai un jeu de données de 74 instances qui appartiennent à 4 classes. Comme le nombre de chaque classe n'est pas suffisant pour obtenir une bonne précision en utilisant certains classificateurs (svm, rna, knn), j'ai besoin de "suréchantillonner" le nombre d'instances de chaque classe.Suréchantillonnage avec Epsilon
J'ai entendu dire qu'il existe une méthode pour cela. Il consiste à générer ces nouvelles instances comme suit:
new_instance <---- original_instance + u(epsilon)
mais je n'ai pas plus de connaissances à ce sujet.
Quelqu'un a utilisé cette méthode pour "suréchantillonner" ses données?