2016-12-15 2 views
0

J'ai un problème de classification avec deux jeux de données avec respectivement 200 et 50 points. Sur ces 40 points de données sont pris en tant que jeu de test. J'ai choisi kNN comme classificateur en considérant cinq voisins les plus proches.Comment copier des données d'entraînement n fois pendant la classification?

n_neighbors = 5 
std = 5 

# generate data 

X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42) 
h = .1 # step size in the mesh 

X1, y1 = make_blobs(n_samples=50, centers=2, n_features=2, cluster_std = std, random_state=42) 

# split into training and test set 
X0_train, X0_test, y0_train, y0_test = train_test_split(X0, y0, test_size=0.2, random_state=42) 

X1_train, X1_test, y1_train, y1_test = train_test_split(X1, y1, test_size=0.2, random_state=42) 

Je dois enrichir les données de telle sorte que les données de formation pour la classe 1 est copié 16 fois, de telle sorte que la classe 1 a la même taille de formation de classe 0.

Comment puis-je copier le données d'entraînement seize fois? Je n'ai pas la moindre idée de ce que signifie copier ici. Est-ce que quelqu'un peut jeter quelques lignes de code pour expliquer la même chose?

Répondre