2015-02-27 2 views
2

Hye là je suis nouveau à ce travail et je suis confus après la recherche sur la façon de passer à travers elle! En fait je veux créer un fichier ARFF clairsemé pour weka pour la classification de texte! J'ai cherché en ligne comment commencer avec ça. Mon exigence est de générer un fichier arff clairsemé qui devrait être compatible avec le weka! Les grandes lignes du arff devrait être comme:Générer un fichier Arff pour Weka

@relation myrelation 
@attribute att0 numeric 
@attribute att1 numeric 
@data 
{0,1,4,5 , A} 
{0,5,2,,1 B} 

tel que j'ai quelques cordes, puis une suppose que la classe mon ensemble de données est la suivante:

string is a string A 
Hello a string B 
Another is string C 
. 
. 
. 

vient d'abord la chaîne et la class comme A, B ou C ... Donc, ce que je veux est de convertir mon ensemble de données en format arff clairsemé ci-dessus. Quelqu'un peut-il me donner une direction comment puis-je le faire? S'il vous plaît Je veux le faire en Java

Répondre

2

Vous pouvez utiliser le filtre StringToWordVector de Weka pour convertir le texte en un vecteur de mot (mais pas nécessairement une matrice clairsemée). Jetez un oeil à mon tutorial à ce sujet.

+0

monsieur pouvez-vous fournir un lien autre que ce lien youtube merci –

+0

Quel est le problème avec? –

+0

lol rien mais il est difficile de le regarder je ne suis pas l'anglais –

1

je veux faire la même chose (je veux un fichier .arff) mais en utilisant le code java pas l'outil GUI .. Toutes les suggestions s'il vous plaît.

+0

Contactez-moi ici [email protected] avec la même requête, je vais vous aider. –