0

Je dispose d'un fichier CSV avec deux colonnes, « sentence » est une chaîne de phrases, emoID est 1-7 entier, comme suit:réseau de neurones convolutif pour la classification de texte multi-classes

sentence   emoID 
During the period of falling in love.  1 
When I was involved in a traffic accident. 2 
.....          ... 

Je dois classer chaque phrase à son emoID correspondant. J'ai vu un exemple qui aime classer deux classes suivantes:

# Generate labels 
positive_labels = [[0, 1] for _ in positive_examples] 
negative_labels = [[1, 0] for _ in negative_examples] 

Maintenant, j'ai 7 classes au lieu de deux, comment pourrais-je générer 7 étiquettes pour chaque classe? Je suis débutant en python, merci beaucoup pour votre aide!

Répondre

0

Vous pouvez utiliser un tableau avec 7 entrées, pour la classe n ayant l'entrée 1 à la position n dans le tableau avec le reste 0. Par exemple. Classe 3: [0,0,1,0,0,0,0] Et :

c3_labels = [[0,0,1,0,0,0,0] for _ in c3_examples] 
+0

Oui, ce que je thought.Is le 'pour _ dans c3_examples' signifie ajouter [0,0, 1,0,0,0,0] en c3_examples? – user2332706

+0

Désolé, j'ai mal compris votre question. 'c3_labels = [[0,0,1,0,0,0,0] pour _ dans c3_examples]' créera simplement un tableau qui contient le tableau d'étiquettes 'len (c3_labels)' fois. Donc, si vous avez trois échantillons de classe 3, les variables c3_labels contiendront '[[0, 0, 1, 0, 0, 0, 0], [0, 0, 1, 0, 0, 0, 0], [ 0, 0, 1, 0, 0, 0, 0]] '. Vous pouvez ensuite utiliser ce tableau et l'ajouter en tant que nouvelle colonne à vos données d'exemple. – molig