Dites que votre cluster spark qui s'exécute sur Amazon EMR doit accéder à une base de données postgresql. Quel est le meilleur moyen de lui donner son identifiant et son mot de passe? Ce sont des moyens que nous avons essayé:Comment passer les mots de passe à étincelle sur EMR
- Avez fichier de configuration sur S3 avec des informations (pas idéal puisque le mot de passe est en clair sur S3)
- passer comme variable d'environnement comme une partie d'étincelles env sur Paramètres EMR (ne fonctionne pas puisque les exécuteurs n'ont pas accès aux variables d'environnement.) Il peut être défini dans spark config avec spark.executorEnv. [EnvironmentVariableName], mais cela nécessiterait une nouvelle saisie du mot de passe dans le fichier spark config devrait également être en S3).
Y at-il un meilleur moyen qui me manque?
Y at-il des documents sur la façon de pousser les métadonnées EC2 instance? Je n'ai rien trouvé. – user2944397