Nous exécutons Solr sur une instance Amazon Web Services EC2 avec un volume EBS de 1 To pour stocker l'index afin que nous puissions facilement lancer des serveurs supplémentaires avec le même index (en lecture seule). Cependant, notre index va bientôt dépasser 1TB, et je ne veux pas vraiment traiter le striping de plusieurs volumes EBS pour contenir l'indice. En outre, la régénération de l'index est très lente. Je voudrais déplacer la génération d'index - et peut-être l'hébergement - vers Hadoop, et de préférence vers Elastic MapReduce d'Amazon, bien que je puisse configurer des serveurs Hadoop distincts si nécessaire. Nous utilisons RightScale, donc leur bibliothèque de ServerTemplates est disponible pour nous.Quelle est la meilleure façon d'exécuter Lucene/Solr sur Hadoop?
Quel serait le meilleur endroit pour commencer à utiliser Lucene/Solr sur Hadoop?
Avez-vous regardé Katta (http://katta.sourceforge.net/)? Il fournit les moyens de partitionner et de distribuer les indones Lucene. –
Je voudrais vraiment que ma création d'index soit accélérée, pas seulement la livraison. Il semble que Katta aiderait avec la livraison, mais pas avec la création? –