2011-02-03 10 views
5

Je souhaite implémenter une solution de recherche pour un site web écrit en Django. Parmi les options disponibles (j'ai recherché Solr, Sphinx, Xapian, PostgreSQL/Tsearch3, MySQL), Sphinx ressemble à la plus belle. Cependant, il ne supporte pas le polonais, et c'est le langage des données que je veux rendre consultable. Quelles sont les meilleures façons de gérer les langues non supportées dans Sphinx? J'ai l'intuition que je pourrais créer un corpus stemming à partir du dictionnaire Ispell. Comment puis-je faire cela avec Sphinx? Mailing, vous pourriez trouver quelques informations si quelqu'un a essayé de créer un stemmer polonais.polonais de recherche pour Sphinx?

Répondre

0

Recherche dans http://snowball.tartarus.org/ Il y a 2 stemmers libres disponibles, mais ils sont faits en java (je pense qu'au moins un est fait pour solr/lucene). D'Ispell, je ne sais pas si le corpus stemming peut vous aider, vous pouvez créer des fichiers à utiliser pour des wordforms ou des excepts.