Je suis nouveau à tous ces Data mining, WEKA Tool etc.,Apriori dans WEKA
Dans mon projet académique, je dois faire face à des rapports de bugs. Je les ai dans mon SQL Server. J'ai pris l'attribut de résumé de bogue et appliqué la tokenisation, arrêtant la suppression de mots et les techniques de tiges.
Tous les mots terminés dans le résumé sont stockés dans la base de données; séparé. Maintenant, je dois appliquer Algorithme fréquent d'exploration de modèle et de trouver ensembles d'articles fréquents en utilisant l'outil WEKA. J'ai mon fichier arff comme ça.
@relation ItemSets
@attribute bugid integer
@attribute summary string
@data
755113,enhanc;keep;log;recommend;share
759414,access;review;social
763806,allow;intrus;less;provid;shrunken;sidebar;social;specifi
767221,datacloneerror;deeper;dig;framework;jsm
771353,document;integr;provid;secur;social
785540,avail;determin;featur;method;provid;social;whether
785591,chat;dock;horizont;nest;overlap;scrollbar
787767,abus;api;implement;perform;runtim;warn;worker
Après avoir ouvert dans Weka, sous l'onglet associé de WEKA Explorateur Je suis incapable de démarrer le processus (bouton Démarrer est désactivé) avec Apriori sélectionné.
Maintenant s'il vous plaît me suggérer comment trouver des itemsets fréquents sur l'attribut de résumé en utilisant WEKA. Je suis dans le besoin d'une aide sérieuse. L'aide sera appréciée. Merci d'avance!
Je veux juste des ensembles d'articles fréquents pour un nombre de soutien donné et la confiance. De plus je ne peux pas aller pour les attributs nominaux car mon bugid est incrémenté automatiquement et le résumé ne peut pas provenir d'un ensemble spécifique d'attributs. Cela peut être n'importe quelle chaîne composée de n'importe quel nombre de mots. – Anurag
Pourriez-vous donner un exemple de règles que vous souhaitez obtenir comme indiqué dans ma réponse éditée? – Percolator
enhanc, navigateur, js comme ça je veux 2 articles ensemble trois ensemble d'articles etc. – Anurag