0

Puis-je utiliser la mise en cluster (par exemple, utiliser k-means) pour effectuer des prédictions dans Weka?Utiliser le clustering pour la prédiction dans Weka

J'ai quelques données basées sur une recherche pour les élections présidentielles. J'ai des réponses à partir des questionnaires (attributs numériques), et j'ai un attribut qui est la réponse à la question Qui allez-vous voter? (1, 2 ou 3)

Je fais des prédictions en utilisant certains classificateurs (par exemple Bayes) dans Weka. Mes résultats sont basés sur cette réponse (intention de vote) et j'ai environ 60% de rappel (taux de prédictions correctes). Je comprends que le regroupement est une chose différente, mais puis-je utiliser la mise en grappe pour faire des prédictions?

Je l'ai déjà essayé, mais j'ai réalisé que le clustering sélectionne toujours ses propres centroïdes, et il n'utilise pas ma question d'intention de vote.

Répondre

3

Explain results of K-means

doit être un de vos collègues. Il semble utiliser le même ensemble de données, et il serait utile que nous puissions tous regarder les données.

En général, la classification n'est pas une classification ou une prédiction.

Toutefois, vous pouvez essayer d'améliorer votre classification en utilisant les informations obtenues à partir du clustering. Deux de ces techniques:

  • substitution votre ensemble de données avec les centres de cluster, et l'utiliser pour le classement
  • le train d'un classificateur séparé sur chaque (au moins si vos clusters sont wrt raisonnablement pur à l'étiquette de la classe.!) cluster, et de construire un ensemble sur eux (en particulier, si vos clusters sont inhomogènes)

Mais je crois que votre compréhension de la classification ou de la mise en grappes n'est pas encore assez loin pour les essayer. Vous devez les manipuler avec soin et connaître très bien vos données.

+0

Oui, je ne comprends pas encore très bien.Puis-je faire quelque chose de facile en utilisant Weka? Y at-il un tutoriel quelque part pour faire ce que je veux? – Dchris

+0

Eh bien, il y a le livre de Weka ... c'est un très bon livre, utilisez-le! –

+0

est-ce le livre? http://www.cs.waikato.ac.nz/ml/weka/book.html – Dchris

0

Oui. Vous pouvez utiliser l'interface Weka pour effectuer une prédiction via le clustering. Commencez par télécharger vos données d'entraînement à l'aide de l'onglet Pré-traitement . Ensuite, allez à onglet Classifier, sous classificateur, cliquez sur choisir et sous méta, choisissez ClassificationViaClustering. L'algorithme de clustering par défaut utilisé par weka est SimpleKMean mais vous pouvez le modifier par en cliquant sur la chaîne d'options (ie le texte à côté du bouton choisir) et weka affichera une boîte de message, cliquez sur choisissez et un ensemble d'algorithmes de clustering sera listé au choix (par exemple EM). Après cela, vous pouvez effectuer une validation croisée ou télécharger des données de test en cliquant sur définir comme vous le faites normalement lorsque vous utilisez weka pour la classification.

Espérons que cela aidera quelqu'un ayant la même question!

Questions connexes