2009-04-02 3 views
11

Une recherche rapide sur Google révèle qu'il existe un bon nombre de classificateurs bayésiens implémentés en tant que modules Python. Si je veux une fonctionnalité de haut niveau enveloppée semblable à dbacl, lequel de ces modules est bon pour moi?Quels modules de classification de texte Python Bayesian sont similaires à dbacl?

Formation

% dbacl -l one sample1.txt 
% dbacl -l two sample2.txt 

Classification

% dbacl -c one -c two sample3.txt -v 
one 

Répondre

9

Je pense que vous trouverez l'utile nltk. Plus précisément, le classify module.

+0

Je ne crois pas que NLTK inclut un algorithme de sélection de caractéristiques, mais il a des outils de dist distension, etc., vous pouvez donc écrire les vôtres et les transmettre au classificateur de votre choix. – apexdodge

0

Si vous essayez de détecter la langue this fonctionne très bien, même avec des textes assez courts.

L'API est assez proche de la vôtre mais Je ne sais pas si elle s'appelle un classificateur bayésien.

1

Remarquant cette question. J'ai mis mon implémentation d'un classificateur bayésien naïf sur gitHub.

Here it is - beiyesi

Il faut encore beaucoup d'amélioration. Toute aide est appréciée.

-1

Essayez Mallet et LingPipe. ils fournissent plus de modèles pour le classificateur.

+0

Ce sont des bibliothèques Java, pas Python. – tripleee

Questions connexes