J'ai une base de données dans laquelle je stocke des données basées sur les trois champs suivants: id, texte, {labels}. Notez que chaque texte a été assigné à plus d'un label \ tag \ class. Je veux construire un modèle (weka \ rapidminer \ mahout) qui pourra recommander \ classifier un ensemble de labels \ tags \ classes dans un texte donné.Classification de document multi-étiquettes
J'ai entendu parler de SVM et Naive Bayes Classifier, mais je ne sais pas si elles supportent la classification multi-étiquettes ou non. Tout ce qui me guide dans la bonne direction est le bienvenu!
Je pense que vous confondez la classification multiclasse et multilabel. Dans le premier, chaque échantillon a une classe mais il y a plus de 2 possibilités; dans ce dernier, chaque échantillon peut appartenir à plusieurs classes simultanément. –
OK, alors choisissons NB. Quels devraient être les attributs dans ce scénario? J'ai quelques idées à ce sujet, mais j'aimerais entendre la suggestion de quelqu'un qui a plus d'expérience que moi. – user2295350
@larsmans Exactement. Ce que je demande est la classification multi-étiquettes, c'est-à-dire que chaque échantillon peut appartenir à plusieurs classes simultanément. – user2295350