2009-07-29 3 views
0

Les états de documentation pour sphynx-0.9.9-RC2:En utilisant Ruby-on-Rails, Sphinx ou UltraSphinx et une source HTML (pas une base de données)

Les données à indexer peut proviennent généralement de sources très différentes : Bases de données SQL , fichiers texte, fichiers HTML, boîtes aux lettres, etc.

Cependant, je ne trouve aucune documentation sur la configuration d'une source en dehors de SQL. Le fichier de configuration ne semble pas indiquer que la source peut être autre chose qu'une base de données. Quelqu'un at-il des liens utiles pour configurer sphinx avec une source HTML?

Répondre

1

Êtes-vous à la recherche de la fonctionnalité xmlpipe (maintenant appelée xmlpipe2) sur Sphinx? Je l'ai essayé pour les fichiers XML et cela fonctionne exactement comme pour SQL. Je n'ai pas essayé Sphinx avec des fichiers HTML vanilla, donc je suppose que vous aurez besoin d'analyser votre fichier HTML et de créer des fichiers XML avec les attributs/champs que vous voulez indexer et les nourrir à Sphinx en utilisant xmlpipe . Vous pouvez voir here et here pour plus d'informations.

HTH

+0

Non, je voulais spécifiquement lire dans les fichiers html, les indexer et ensuite utiliser que pour construire un moteur de recherche pour mon site. J'ai abandonné l'idée d'utiliser Sphinx et j'ai abordé le problème d'une autre manière. Voici le plus d'informations que j'ai pu trouver, pour quiconque regarde: http://www.sphinxsearch.com/forum/view.html?id=3867 –

Questions connexes