2010-08-08 4 views
7

J'ai récemment ajouté des fonctionnalités de recherche à mon site alimenté par django pour permettre aux employeurs de rechercher des employés à l'aide de mots-clés. Lorsque l'utilisateur télécharge initialement son CV, je le transforme en texte, je me débarrasse des mots vides, puis j'ajoute le texte à un objet TextField pour cet utilisateur. J'ai utilisé Django-Haystack avec le moteur de recherche Whoosh.Recherche sous-chaîne Django Haystack

Trois choses-

1) En plus de fonctionnalités supplémentaires que je vais probablement pas utiliser, est-il un avantage concret pour passer à Solr ou Xapian?

2) En transformant le résumé en texte, j'indexe essentiellement le pdf moi-même. Je sais que Xapian et Solr supportent l'indexation .pdf, mais Haystack ne l'a pas. Des conseils sur la façon de contourner cela? Ou devrais-je continuer à l'indexer moi-même? Si oui, devrais-je faire plus que simplement fournir un fichier texte de mots-clés?

3) Whoosh ne renvoie un résultat que si le mot-clé correspond exactement. Si un utilisateur a "mathématique" comme mot-clé, et que je recherche "math", je veux que cet utilisateur apparaisse. Je ne pouvais pas dire définitivement si Xapian ou Solr supportaient cela. Pensées?

Merci pour votre suggestion. Je vais continuer à creuser moi-même pour l'instant.

+1

Avez-vous trouvé une réponse à votre question? voulez-vous partager avec nous s'il vous plaît – Armance

Répondre

6

Malheureusement, je ne sais pas assez pour répondre à vos autres questions, cependant pour le point 3.) Whoosh soutient réellement cela.

Vous devez utiliser la fonction de saisie semi-automatique de SearchQuerySet.

détaillée: http://docs.haystacksearch.org/dev/autocomplete.html

J'utilise actuellement Whoosh et la correspondance sur moi-même correspond partielle.

Questions connexes