2009-12-13 16 views
10

je ne peux jamais comprendre comment fonctionne solr.comment importer des tables mysql à SOLR

Il ne parle que de fichiers de schéma, mais comment importer le contenu de la base de données avec une méthode indolore? J'ai essayé de le comprendre en lisant leurs tutoriels, mais ça me gâche la tête.

son écrit pour les Einstein parce qu'il semble y avoir beaucoup de gens qui ont aussi du mal à le comprendre.

et ils continuent à parler de l'exemple de dossier. "tapez simplement java -jar ./start.jar". je veux dire .. est-ce un exemple ou pouvez-vous l'utiliser comme final pour votre site Web? où se trouve data-config.xml ??? Il n'y a tout simplement pas de bons tutoriels expliquant à cette première fois que les débutants peuvent comprendre.

Répondre

5

Pour les personnes qui ne connaissent pas le Solr, cela fait partie du projet Apache Lucene. C'est un serveur qui s'exécute dans un conteneur tel que Tomcat. Solr héberge un index Lucene et fournit une interface "REST-like" pour mettre à jour et interroger un index via HTTP. Le tutoriel "Getting Started" parle du démarrage du serveur Solr avec java -jar start.jar, mais uniquement pour faire fonctionner le serveur Solr. C'est comme démarrer une instance de MySQL Server - nécessaire avant de pouvoir l'interroger, mais cette seule étape ne la remplit pas de données ou ne la rend pas utilisable.

Le tutoriel continue de montrer un exemple de l'affichage de documents sur le serveur Solr:

user:~/solr/example/exampledocs$ java -jar post.jar solr.xml monitor.xml 

Cet exemple deux documents, messages solr.xml et monitor.xml à indexer. Vous n'avez pas besoin d'utiliser leur exemple post.jar - étant donné que Solr prend en charge HTTP, vous devriez pouvoir utiliser n'importe quel client HTTP, tel que curl.

Pour indexer le résultat entier d'une requête SQL de cette manière, vous devez écrire un script pour faire une boucle sur le résultat et publier des données sur Solr ligne par ligne, mais cela prendrait probablement trop de temps, ce qui rendrait une requête HTTP POST distincte par ligne de données.

Je suppose que le moyen le plus rapide est d'utiliser le support de Solr pour les données de lot au format CSV. Voir http://wiki.apache.org/solr/UpdateCSV pour des exemples.

+0

J'ai téléchargé un livre électronique expliquant comment Solr fonctionne en 300 pages. maintenant je sais plus de comment cela fonctionne. – ajsie

Questions connexes