J'essaie d'anonymiser un grand ensemble de données d'environ 600 000 enregistrements (en supprimant des informations sensibles telles que les courriels, etc.) afin de pouvoir l'utiliser pour certains tests de performance. J'utilise Scala (Casbah) avec Mongo. Le script réel est assez simple et direct. Lorsque j'exécute le script, l'ensemble du processus démarre assez rapidement - en analysant 1000 enregistrements toutes les 2-3 secondes, mais il ralentit énormément et commence à ramper très lentement.MongoDB - anonymisation 600k enregistrements
Je sais que c'est assez vague sans trop de détails, mais aucune idée de la raison pour laquelle cela se produit, et des conseils sur la façon dont je pourrais accélérer cela?
Avez-vous des index sur l'un des champs que vous anonymisez? –
pouvez-vous partager une sortie de votre 'mongostat'? y a-t-il trop de verrous d'écriture et de fautes de page? – DhruvPathak
Êtes-vous sur une machine 64 bits? – Matt