2008-08-04 7 views
24

Je me demandais s'il y avait une bonne mise en œuvre de programmation orientée objet (POO) du filtrage bayésien pour le spam et la classification de texte? Ceci est juste à des fins d'apprentissage.Filtrage de spam bayésien orienté objet?

Répondre

12

Je recommande vraiment Weka qui est un logiciel Data Mining Open Source écrite en Java:

Weka est une collection d'algorithmes d'apprentissage automatique pour les tâches d'exploration de données. Les algorithmes peuvent être appliqués directement à un ensemble de données ou appelés à partir de votre propre code Java. Weka contient des outils pour le pré-traitement des données, la classification, la régression, le clustering, les règles d'association et la visualisation. Il est également bien adapté au développement de nouveaux schémas d'apprentissage machine.

Comme mentionné ci-dessus, il est livré avec un tas de différents classificateurs comme SVM, Winnow, C4.5, Naive Bayes (bien sûr) et bien d'autres (voir le API doc). Notez que beaucoup de classificateurs sont connus pour avoir beaucoup mieux que Naive Bayes dans le domaine de la détection de spam ou de la classification de texte.

De plus Weka vous propose un très powerful GUI ...

2

nBayes - une autre implémentation C# hébergé sur CodePlex