-2

J'utilise libsvm library pour la classification de documents de CV. J'ai plusieurs CV et je dois les classer. Ai-je besoin d'une classification multilabel ou multiclass dans ce cas. Quelle option ci-dessus devrais-je prendre en considération et suggérer un moyen de le faire?Classification de documents en utilisant libsvm dans java

+0

@severian .. pourriez-vous s'il vous plaît suggérer? – user3274576

Répondre

0

Votre exigence n'est pas simple, afin de développer un tel système, vous devez venir avec plusieurs étapes, comme exemple:

  1. Vous avez besoin d'un ensemble de données de différents types de documents (divers types

  2. Ensuite, vous devez identifier le type de fonctionnalités qui peuvent être utilisées pour les séparer (comment allez-vous les distinguer, en fonction de quoi (ex, reprendre la longueur, le nombre de mots, le contenu de l'en-tête) , etc.))

  3. Ensuite, vous devez préparer des ensembles de vecteurs de caractéristiques pour former le SVM. (Si vous avez besoin de classer uniquement les CV pertinents et non pertinents, ce sera deux classes.Si il y a plus de deux classes, ce sera multi-classe et LibSVM supporte multi-classe)

  4. Lors de la formation, vous devez effectuer la mise à l'échelle, la validation croisée afin d'augmenter la précision (read here)

  5. Vous devez effectuer les étapes ci-dessus pour réussir la prédiction.