2010-06-02 6 views
0

Ce que je veux faire est d'indexer certains documents dans Solr et de savoir comment cela fonctionne. J'ai installé Solr et Tomcat et peut voir l'interface utilisateur de Solr Admin à localhost: 8080/solr/admin/ Maintenant, je veux ajouter quelques documents à l'index, puis-je savoir comment aller plus loin? Je trouve très peu de documentation sur Internet à ce sujet. Dans le tutoriel http://lucene.apache.org/solr/tutorial.html#Indexing+Data, ils ont demandé d'exécuter la commande java -jar post.jar solr.xml monitor.xml, mais après l'exécution, j'ai obtenu une erreur de connexion refusée car il s'agit d'une jetée. Après avoir installé jetty j'ai essayé telnet: J'ai l'erreur "Connection refused"Problème d'indexation des fichiers dans Solr sur Ubuntu

Je ne suis pas capable de comprendre le problème.

+0

Vous devez spécifier l'URL correcte, y compris le numéro de port, dans la procédure de publication. – bmargulies

Répondre

2

Comme les états manuels, il existe plusieurs façons de données d'indexation en Solr:

  • Importer des enregistrements à partir d'une base de données à l'aide du Data Import Handler (DIH).
  • Load a CSV file (valeurs séparées par des virgules), y compris celles exportées par Excel ou MySQL.
  • Indexez les documents binaires tels que Word et PDF avec Solr Cell (ExtractingRequestHandler).
  • Utilisez SolrJ pour Java ou un autre Solr clients pour créer par programme des documents à envoyer à Solr.

Le scénario post.jar ne semble pas être destiné à d'autres usages que les tests. C'est juste une implémentation simplifiée d'un client Solr (gérant uniquement les imports XML).

J'ai utilisé avec succès le DIH et un client (PHP) Solr à cette fin. Le premier est une extension de Solr qui vous permet de mapper votre source de données (dans mon cas MySQL) à l'index Solr. L'installation sous la forme de base n'est pas difficile et c'est assez bien expliqué dans le DataImportHandler section of the Solr Wiki. Dans le cas où vous préférez contrôler votre processus d'indexation (ou une partie de celui-ci) au niveau du logiciel, vous pouvez avoir une application personnalisée qui utilise l'un des existing clients.

Je vous suggère d'essayer avec l'une de ces options.

Questions connexes