Je suis en train de configurer un cluster spark. J'ai des nœuds de données hdfs et des nœuds spark master sur les mêmes instances.Acquisition de données dans elasticsearch à partir de hdfs, de la configuration du cluster et de l'utilisation
configuration actuelle est 1-maître (allumage et HDFS) travailleurs 6 bougies et données de HDFS noeuds
Toutes les instances sont identiques, dual core 16Gig (malheureusement).
J'ai encore 3 machines, toujours les mêmes spécifications. Maintenant, j'ai trois options 1. Il suffit de déployer es sur ces 3 machines. Le cluster ressemblera 1-maître (allumage et HDFS) travailleurs 6 bougies et HDFS nœuds de données noeuds 3 ElasticSearch
- Déployer le maître sur 1, étendre étincelle et hdfs et es sur tous les autres. Cluster ressemblera 1-maître (allumage et HDFS) 1-maître ElasticSearch travailleurs 8 bougies, HDFS nœuds de données, es noeuds de données
Mon application est d'utiliser beaucoup étincelle pour les jointures, ml, etc, mais nous recherchons des capacités de recherche. Nous n'avons certainement pas besoin de temps réel de recherche et un intervalle de rafraîchissement de 30 minutes est même bien avec nous.
En même temps, le cluster d'amorçage a d'autres tâches de longue durée en dehors de l'indexation.
La solution ne doit pas nécessairement être l'une des précédentes, je suis ouverte à l'expérimentation si quelqu'un le suggère. Ce serait pratique pour d'autres développeurs aussi une fois conclu.
Aussi j'essaye avec es hadoop, projet d'es-étincelle mais j'ai senti l'ingestion est très lente si je fais 3 noeuds dédiés, c'est comme 0,6 million d'enregistrements/minute.
Merci pour la suggestion, Je vais regarder et mettre à jour mes conclusions. Bien que je pense que je ne suis pas en mesure de vous transmettre le problème exact, j'ai mis à jour ma question et vous demande de passer par. Merci – rohit
@rohit Je vois, encore je pense que la solution probable à vos problèmes de performance est plus d'instances ES. –
Je suis entièrement d'accord avec vous en même temps, je n'ai aucun moyen d'ajouter une instance. C'est absolument ce que je peux avoir. J'apprécierai vos pensées. Je vais essayer en ajoutant une instance avec le générateur d'étincelles, mais je crains que cela ne ralentisse l'étincelle. Essaiera de voir l'impact sur les performances. – rohit