Y a-t-il un paramètre dans la commande bin/nutch solrindex
indiquant le cœur Solr à indexer?Utilisation de Nutch solrindex pour indexer plusieurs cœurs?
6
A
Répondre
8
Je ne connais aucun paramètre de base. Vous devriez juste inclure le nom du noyau dans votre paramètre solr url comme ceci: http://localhost:8983/solr/core0
.
0
Dans nutch 1.4, ce que j'utilise pour indexer différents noyaux:
bin/nutch crawl urls/url1 -solr http://localhost:8983/solr/core1 -depth 10 -topN 10000
Questions connexes
- 1. fichiers séparés regex Nutch à explorer et à indexer à plusieurs cœurs Solr
- 2. solrindex façon de mapper schéma de nutch à solr
- 3. Solr index vide après la commande nutch solrindex
- 4. utiliser nutch pour indexer mes fichiers HTML locaux
- 5. Différentes pages vers différents cœurs Nutch (dans le même domaine)
- 6. Apache Nutch pour indexer uniquement une partie du contenu de la page
- 7. Nutch + Solr - Indexer provoque java.lang.OutOfMemoryError: Java heap space
- 8. C# Indexer Utilisation
- 9. Utilisation multi-cœurs et CPU
- 10. nutch 1.1 schema.xml
- 11. Lucene Indexer plusieurs documents
- 12. h2o ec2 utilisation maximale des cœurs
- 13. Threading avec plusieurs cœurs C++
- 14. Configurer Nutch pour indexer uniquement les types de fichiers spécifiques dans Solr
- 15. Utilisation de Solr pour indexer des balises HTML avec des attributs
- 16. javac utilisant plusieurs cœurs de processeur
- 17. Connexion à plusieurs cœurs lors de l'exécution
- 18. Utilisation correcte des cœurs multiples dans Solr 4
- 19. Utilisation de Solr pour plusieurs sites
- 20. MATLAB et l'utilisation de plusieurs cœurs pour effectuer des calculs
- 21. Problème d'utilisation de pthread pour utiliser plusieurs cœurs
- 22. Ai-je besoin d'utiliser Nutch pour analyser les fichiers locaux si je veux les indexer?
- 23. Utilisation des 4 cœurs en C++/c
- 24. Utilisation d'enums pour indexer un tableau de bits
- 25. Utilisation du crawler Nutch avec Solr
- 26. Combien de cœurs pour SSIS?
- 27. Comment indexer des noms de fichiers (et d'autres métadonnées de fichiers) dans nutch?
- 28. Nutch regex pour crawl
- 29. Solr 4.0 est-il capable d'utiliser 'join' pour plusieurs cœurs?
- 30. RSS Feeds in Nutch
Cela fait logique maintenant. – Ramsel
Cela fonctionne définitivement, ne soyez pas rebutés par le fait que vous voyez un 404 lorsque vous accédez à http: // localhost: 8983/solr/core_name, c'est la façon de choisir un noyau Solr spécifique pour votre araignée Apache Nutch. ..thanks – Carlton
juste ajouter/admin à lui pour éviter d'obtenir 404. Nutch utilisera les gestionnaires de demande de sélection et de mise à jour, en ajoutant leur chemin à l'url de base solr configuré. – javanna