2009-09-25 8 views
0

Je travaille sur un système de surveillance des médias sociaux. Nous ne rampons pas nous-mêmes sur le web, nous recevons des flux d'agrégateurs comme Spinn3r. Dans la plupart des cas, les «blogs» qui ne sont rien d'autre que des pages de liens vers des sites pornographiques sont filtrés, mais nous aimerions que nous puissions nous entraîner plus rapidement que d'attendre que les fournisseurs en amont apportent des changements.Filtrage anti-spam immédiat?

J'ai regardé Spamassassin, et ce serait idéal pour nos besoins si nous avions affaire à l'email. Existe-t-il une bibliothèque qui ne prend qu'un corps de texte et lui attribue un score de qualité basé sur des éléments tels que les fréquences de travail, le nombre de liens, le texte d'arrière-plan caché, etc.

Idéalement, je cherche quelque chose en Java, mais s'il n'y a rien, je serais d'accord avec le client-serveur ou l'intégration d'une bibliothèque jruby ou jython.

Je pense que je vais finir par devoir le construire moi-même, mais ça vaut toujours le coup.

Répondre

0

Il existe des plugins de spam pour WordPress permettant d'intercepter les commentaires spam. Une recherche google donne: WP-SpamFree Anti-Spam et Spam Karma 2.3

Les plugins WordPress semblent être implémentés en PHP. Peut-être qu'il pourrait y avoir quelque chose d'utile là-bas.