J'utilise la bibliothèque spark-redshift fournie par les briques de données pour lire les données d'une table redshift dans Spark. Lien: https://github.com/databricks/spark-redshift.La connexion a expiré avec le redshift spark sur EMR
Remarque: Le compte AWS pour le cluster redshift et le cluster EMR sont différents dans mon cas.
Je suis capable de me connecter à redshift en utilisant spark-redshift en mode Spark LOCAL. Mais le même code échoue sur EMR avec l'exception suivante: java.sql.SQLException: Erreur lors de la définition/fermeture de la connexion: la connexion a expiré.
J'ai essayé d'ajouter Redshift dans la règle de trafic entrant sur le groupe de sécurité EC2 de mon cluster EMR mais cela n'a pas aidé. J'avais utilisé Source comme MyIP en faisant cela.