2011-03-22 5 views
0

Je suis en train de développer une application qui va récupérer des données de sites web. Les détails comme page_url, site_url, last_modified seront stockés dans la base de données et page_content sera stocké dans le fichier. Plus tard, je veux rechercher le contenu du fichier. J'essaie de Thinkingsphinx pour y parvenir. Est-ce que n'importe quel corps a une idée de comment l'implémenter?Indexer des fichiers avec SPHINX/ultrasphinx

Répondre

1

Je ne crois pas que Sphinx/ThinkingSphinx vous convient, car ils sont destinés à communiquer avec des bases de données.

Jetez un oeil à ce fil: http://groups.google.com/group/thinking-sphinx/browse_thread/thread/69cdc1c8e1c096ff/aa4ae8e21c42e67c?lnk=gst&q=files#aa4ae8e21c42e67c

+0

Pouvez-vous me suggérer une bonne solution puis? – Pravin

+0

Je n'en connais pas moi-même. Je suis en train de jeter un rapide coup d'œil sur le moment et je vous ferai savoir si je trouve quelque chose. Je peux dire que Solr/Sunspot ne ressemble pas non plus à des options :) – lebreeze

+0

qu'en est-il des options xmlpipe sous sphinx? J'essayais en fait de l'implémenter, mais je n'arrivais pas à le faire .. – Pravin

0

Pourriez-vous passer à Solr recherche plein texte à la place? Je l'entends peut même indexer les fichiers binaires comme PDF ou mot

description lien http://lucene.apache.org/solr/tutorial.html[enter ici] [1]

Questions connexes