Contexte: 2 sur 3 de nos machines Zookeeper
ont été bloquées, ce qui a provoqué la fermeture de mon système SOLR
. J'ai ajouté de nouvelles machines Zookeeper
et mis à jour chaque config machine SOLR
avec la nouvelle machine Zookeeper
. Après cela, j'ai démarré le SOLR
et utilisé la page d'administration pour interroger *:*
qui renvoyait un nombre différent chaque fois que je demandais au pool.Le nombre de Solr est incorrect
Alors, je tous les enregistrements purgé dans SOLR
nuage et a couru un batch-job
pour remplir toutes les données à nouveau d'Oracle à SOLR. (Tout semblait bien).
Problème: J'ai un batchjob
quotidien qui met à jour le SOLR
avec DELTA(Inserts + Updates)
de Oracle
.
Depuis cette instance. Le nombre dans le pool SOLR
ne correspond pas au DELTA(insert + update)
. Par exemple: même si 1000 enregistrements ont été mis à jour ou insérés un jour, les comptes SOLR diffèrent de plus de 10000.
Les numéros renvoyés par *:*
ne correspondent pas. Nous avons essayé de purger les enregistrements plusieurs fois. Les choses semblent bien quand nous insérons l'enregistrement pour la première fois après la purge mais dès que les mises à jour commencent à arriver, les chiffres ne correspondent pas.
Il n'existe aucun enregistrement en double. et Si je demande un enregistrement spécifique, nous obtenons le bon enregistrement, mais les numéros de facettes sont également erronés.
Le fichier d'index est-il corrompu?
1. Combien d'instances Solr pour le cluster? 2. Combien de tessons? 3. Comment faites-vous l'indexation? Par SolrJ ou autre chose? –
25 instances dans le cluster, 3 fragments. J'ai un travail de lot de printemps qui lit les enregistrements et les a mis à jour dans 'SOLR' – user1324887
fait zk suivre le bon état de toutes les instances? –