2017-02-23 2 views
0

Y at-il de toute façon que je puisse renvoyer mon résultat prédit au commentaire original après la classification du texte en utilisant la validation croisée 10 fois?Comment lier le résultat prédictif de 10-fcv weka au commentaire original pour la classification du texte

A partir du résultat de 2000 commentaires de la classe non SARC et SARC:

inst#,actual,predicted,error,prediction 
1,2:non-sarc,2:non-sarc,,1 
2,2:non-sarc,1:sarc,+,1 
3,2:non-sarc,2:non-sarc,,1 
4,2:non-sarc,2:non-sarc,,1 
5,2:non-sarc,2:non-sarc,,1 
. 
. 
101,1:sarc,1:sarc,,1 
102,1:sarc,2:non-sarc,+,1 
103,1:sarc,1:sarc,,1 
104,1:sarc,1:sarc,,1 
105,1:sarc,1:sarc,,1 
. 
. 

Il ressemble WEKA a réarrangé mon commentaire à split classe avant tenir pour la formation et les tests. Comment puis-je renvoyer ce résultat à des commentaires originaux qui ne sont pas dans l'ordre de séquence (pas comme après 10-fcv)? J'ai essayé de réorganiser le commentaire à la séquence de classe de non-sarc et sarc mais je suis confus quel test/entraînement d'abord, est-ce le premier test de pli en premier, ou le dernier test de pli en premier, ou un autre?

Merci d'avance.

Répondre

0

Étant donné que personne n'a répondu à ma question et que je me suis dit, j'espère que cela aidera d'autres personnes confrontées au même problème.

  1. En prétraitement; Filtre> non supervisé; AddID aux attributs, à la première position. Cela donnera pour chaque ID de l'étiquette d'origine [IDIndex: Tout d'abord]

1.Add IDIndex

  1. En Classifier; Choisissez un classificateur. Pour l'option de test, réglez 10-FCV, et en option de plus, définir les attributs pour 1. Et choisir pour le lien et le résultat de prédiction de format de sortie [attributs: 1]

2.Attribute and Output

  1. Prédiction de démarrage/exécution. La sortie montre l'étiquette et la prédiction réelles. L'erreur est la marque avec + et l'ID fait référence à l'étiquette d'origine avant la prédiction.

3.Output

Bonne chance!