2017-01-23 5 views
1

Puisque mon cluster Cassandra est répliqué sur trois zones de disponibilité, je souhaite sauvegarder une seule zone de disponibilité pour réduire les coûts de sauvegarde. J'ai également expérimenté la restauration de nœuds dans une seule zone de disponibilité et récupéré la plupart de mes données dans un environnement de test. Je voudrais savoir s'il y a des inconvénients à cette approche avant de déployer cette solution en production. Est-ce que quelqu'un suit cette approche dans vos clusters de production?Pouvons-nous sauvegarder une seule zone de disponibilité pour le cluster Cassandra répliqué AZ

Note: Comme je sauvegarde à intervalles réguliers, je sais que je peux perdre les mises à jour arrivées aux deux autres quatres AZ au moment de l'instantané, mais ce n'est pas un problème.

Répondre

0

Vous ne pouvez sauvegarder que des nœuds précis, voire des nœuds. AFAIK, le seul inconvénient est que vos données sont cohérentes/à jour, et puisque vous pouvez vous permettre de perdre des données, cela ne devrait pas poser de problème. Et si vous, par exemple en effectuant des écritures avec un niveau de cohérence ALL, les données doivent être à jour sur tous les nœuds. MAIS, vous devez être sûr que vos données sont effectivement répliquées entre plusieurs a-z, en jouant avec les propriétés rack/dc ou en utilisant le commutateur ec2 qui prend en charge multi-z.

EDIT:

global instantané

L'exécution instantané nodetool est exécuté uniquement sur un seul nœud à la fois. Cela crée uniquement une sauvegarde partielle de l'ensemble de vos données. Vous voulez que exécute snapshot nodetool sur tous les nœuds de votre cluster. Mais il est préférable de les exécuter exactement au même moment, de sorte que vous n'avez pas de données fragmentées à partir d'une perspective temporelle. Vous pouvez le faire de deux façons différentes. La première consiste à utiliser un programme ssh parallèle à pour exécuter la commande nodetool snapshot en même temps. La seconde, consiste à créer un travail cron sur chacun des noeuds à exécuter en même temps. La deuxième suppose que vos nœuds ont des horloges synchronisées, ce sur quoi s'appuiera aussi Cassandra .

Lien vers la page: http://datascale.io/backing-up-cassandra-data/

+0

Merci! Pouvez-vous me diriger vers la documentation officielle/blog qui l'indique? – theeminence

+0

Ajout d'un lien vers "docs". Comme Cassandra Snapshot est juste un lien physique effectué au niveau du nœud, c'est à vous de décider ce que vous voulez sauvegarder. – nevsv