j'ai écrit un utilitaire de ligne de commande pour diviser un index Lucene en tessons, selon la méthode recommandée de
document.uniqueId.hashCode() % numShards
Vous pouvez saisir de GitHub: Hash-Based Index Splitter
Voir aussi Multi Pass Index Splitter, qui peut diviser votre index soit séquentiellement (par exemple [1,1,1,2,2,2,3,3,3,4,4,4]
) ou round-robin (par exemple [1,2,3,4,1,2,3,4,1,2,3,4]
).
Étant donné que les documents ne comprennent pas l'utilisation de ce dernier, la voici:
Usage: MultiPassIndexSplitter -out <outputDir> -num <numParts> [-seq] <inputIndex1> [<inputIndex2 ...]
inputIndex path to input index, multiple values are ok
-out ouputDir path to output directory to contain partial indexes
-num numParts number of parts to produce
-seq sequential docid-range split (default is round-robin)
Est-il possible de deleteByQuery en utilisant un champ et sa valeur? Je voudrais supprimer tous les enregistrements dont le champ 'leg' est égal à 6. – Medley
@Medley: Oui c'est possible. Exemple pour vous: jambe: 6 Cela supprimera alors les documents correspondant à cette requête. Vous l'envoyez à l'url/update –
Merci. C'est d'accord maintenant. Les deux index sont plus petits et la recherche distribuée en utilisant 'shards' fonctionne bien. – Medley