Je suis en train de développer une application qui va récupérer des données de sites web. Les détails comme page_url, site_url, last_modified seront stockés dans la base de données et page_content sera stocké dans le fichier. Plus tard, je veux rechercher le contenu du fichier. J'essaie de Thinkingsphinx pour y parvenir. Est-ce que n'importe quel corps a une idée de comment l'implémenter?Indexer des fichiers avec SPHINX/ultrasphinx
0
A
Répondre
1
Je ne crois pas que Sphinx/ThinkingSphinx vous convient, car ils sont destinés à communiquer avec des bases de données.
Jetez un oeil à ce fil: http://groups.google.com/group/thinking-sphinx/browse_thread/thread/69cdc1c8e1c096ff/aa4ae8e21c42e67c?lnk=gst&q=files#aa4ae8e21c42e67c
0
Pourriez-vous passer à Solr recherche plein texte à la place? Je l'entends peut même indexer les fichiers binaires comme PDF ou mot
description lien http://lucene.apache.org/solr/tutorial.html[enter ici] [1]
Questions connexes
- 1. Comment indexer des fichiers html vers elasticsearch?
- 2. Comment indexer et rechercher des fichiers .doc
- 3. Comment indexer des fichiers PDF et rechercher des mots-clés?
- 4. Indexer un tas de fichiers texte
- 5. Indexer un grand nombre de fichiers XML
- 6. Importer plusieurs fichiers et les indexer
- 7. NEST - Indexer des champs individuels
- 8. indexer plusieurs fichiers csv avec des pandas à partir de dossiers?
- 9. Comment indexer des documents dans SOLR?
- 10. Comment indexer des requêtes mathématiques?
- 11. .NET 4.0 Indexer avec ObservableCollection
- 12. Comment indexer le code source avec ElasticSearch
- 13. Comment indexer des noms de fichiers (et d'autres métadonnées de fichiers) dans nutch?
- 14. Quand indexer, quoi indexer dans Mongoid?
- 15. utiliser nutch pour indexer mes fichiers HTML locaux
- 16. Lucene Indexer plusieurs documents
- 17. Comment indexer 300 000 fichiers texte pour la recherche?
- 18. Comment puis-je indexer un tas de fichiers en Perl?
- 19. Lucene indexer des objets en mémoire
- 20. Comment indexer des combinaisons de balises?
- 21. Comment puis-je obtenir le script svnindex.cmd inclus avec SrcSrv pour indexer les fichiers sources avec des espaces d'URI échappés?
- 22. comment puis-je indexer mes fichiers matlab (.m)
- 23. Indexer nodejs ou browserify composants avec gulp
- 24. Demander des jetons Lucene sans indexer
- 25. Comment puis-je indexer des documents HTML?
- 26. Comment indexer des attributs à partir d'associations?
- 27. Comment utiliser Windows Search Service au lieu de l'ancien service d'indexation pour indexer des fichiers?
- 28. Puis-je indexer RDB avec lucene?
- 29. Utiliser ExtractingRequestHandler de Solr CELL pour indexer/extraire des fichiers à partir de formats de paquets
- 30. Comment extraire les métatags des fichiers HTML et les indexer dans SOLR et TIKA
Pouvez-vous me suggérer une bonne solution puis? – Pravin
Je n'en connais pas moi-même. Je suis en train de jeter un rapide coup d'œil sur le moment et je vous ferai savoir si je trouve quelque chose. Je peux dire que Solr/Sunspot ne ressemble pas non plus à des options :) – lebreeze
qu'en est-il des options xmlpipe sous sphinx? J'essayais en fait de l'implémenter, mais je n'arrivais pas à le faire .. – Pravin