J'ai un ensemble d'objets Livres, Classs livre est défini comme suit:problème de classification Java texte
Class Book{
String title;
ArrayList<tags> taglist;
}
Où titre est le titre du livre, par exemple: Javascript pour les nuls.
et taglist est une liste de balises pour notre exemple: Javascript, JQuery, "dev web", ..
Comme je l'ai dit avoir un ensemble de livres parler de choses différentes: IT, BIOLOGIE, HISTOIRE, ... Chaque livre a un titre et un ensemble de balises décrivant ..
Je dois classer ces livres dans automaticaly ensembles séparés par sujet, par exemple:
LIVRES IT:
- Java pour les nuls
- Javascript pour les nuls
- Apprendre Flash en 30 jours
- C++ programmation
HISTOIRE LIVRES:
- guerres mondiales
- Amérique en 1960
- Martin luther vie du roi
BIOLOGIE LIVRES:
- ....
-vous les gars savent un algorithme de classification/méthode à appliquer pour ce genre de problèmes?
Une solution est d'utiliser une API externe pour définir la catégorie du texte, mais le problème ici est que les livres sont en différentes langues: français, espagnol, anglais ..
Oui, mais il sont quelques balises communes entre les livres: ( – Youssef
Question connexe: http://stackoverflow.com/questions/2781752/naive-bayesian-pour-les-detection-detection-du-copie-des-approches/2783356#2783356 – dmcer
nice merci (y) – Youssef