2013-02-28 1 views
-1

Je travaille avec un grand nombre de documents et j'ai un ensemble de catégories/étiquettes prédéfinies (qui pourraient être des phrases) qui seraient présentes dans le texte des documents soit sous forme exacte soit sous forme inexacte. Je veux affecter chaque document à exactement une étiquette parmi les étiquettes qui est la plus proche de son texte.Marquage de documents avec des étiquettes prédéfinies

Veuillez me donner quelques indications sur ce que je devrais faire pour résoudre ce problème.

Répondre

-1

Vous pouvez consulter le moteur de recherche lucene qui identifie les documents lors de l'indexation. Moteur de recherche de Northernlight utilisé pour faire une tâche similaire mentionnée par vous dans leur méthodologie de recherche. Vous pouvez jeter un oeil à sa mise en œuvre afin d'avoir une idée.

Questions connexes