J'ai un ensemble de données d'entraînement (texte) pour une catégorie particulière (disons Cancer). Je veux former un classificateur SVM pour cette classe dans weka. Mais quand j'essaye de faire ceci en créant un dossier «cancer» et en mettant tous ces dossiers de formation dans ce dossier et quand je cours au code j'obtiens l'erreur suivante: weka.classifiers.functions.SMO: Ne peut pas manipuler la classe unaire! Ce que je veux faire est que si le classificateur trouve un document lié au 'cancer', il dit correctement le nom de la classe et une fois que j'ai nourri un document non cancéreux, il devrait dire quelque chose comme 'inconnu'.classification unaire classe de texte dans weka?
Que dois-je faire pour obtenir ce comportement?
Merci pour votre réponse. Je l'ai fait fonctionner. Quelle est la différence entre avoir deux séries (disons cancer et non-cancer) et faire une classification binaire et avoir un seul ensemble (cancer seulement) et faire une classification d'une classe, si je veux seulement déterminer combien de documents pertinents pour le cancer (une classe)? – KillBill
La différence est de savoir si vous avez des exemples négatifs. Si vous avez 100 exemples de cancer et 100 exemples non cancéreux, alors il y a deux classes, cancer et non cancer. Si vous n'avez que 100 exemples sains et que vous voulez savoir si quelque chose est anormal, alors c'est une classe. – karenu
J'ai fait une formation d'une classe avec le LibSVM à Weka. Mais le problème est lors des tests, toutes les instances de test sont classées dans la classe que j'ai utilisée en formation, il ne dit pas au moins une seule instance non pertinente dont je suis sûr que les instances de test sont totalement hors de propos. Quelle pourrait en être la raison? – KillBill