2015-03-30 1 views
1

J'ai construit un pipeline de données AWS et je reçois toujours des avertissements sur le champ TerminateAfter d'une ressource EC2. Mon DataPipeline est conçu pour utiliser la même instance plusieurs fois tout au long du processus, qui doit être exécuté toutes les heures (je n'ai pas encore exécuté le pipeline). Donc, si je mets le champ Terminate After à 3 minutes, je me demande si l'instance EC2 se termine 3 minutes après chaque rotation. Ou l'instance EC2 est-elle terminée 3 minutes après la dernière utilisation dans le pipeline?Comment AWS Data Pipeline exécute-t-il une instance EC2?

Répondre

1

TerminateAfter est utilisé pour indiquer lorsque la ressource Ec2 est terminée après la création de la ressource. Ainsi, si vous définissez le champ TerminateAfter sur 3 minutes, votre ressource Ec2 sera supprimée 3 minutes Après la création de votre ressource. "TerminateAfter" est utilisé pour empêcher les processus d'emballement.

+0

Êtes-vous sûr? Je crois que terminateAfter termine le cluster 'x minutes' (3 minutes ici) après son _actual start time_. Cela n'a rien à voir avec l'achèvement de l'activité prévue. En fait, une valeur très basse terminateAfter peut conduire à déplacer l'activité supposée s'exécuter sur l'état _cancelled_. – panther

+0

accepté, modifié la réponse – AravindR

1

Vous pouvez définir une limite de temps supérieure pour le processus afin d'empêcher l'utilisation des ressources indéfiniment. La minuterie démarre lorsque le processus commence.

https://books.google.com/books?id=uBtRAgAAQBAJ&pg=PA69&lpg=PA69&dq=aws+resources+%22terminate+after%22&source=bl&ots=N50id8RFbJ&sig=ac2dSsLkMOmhNV8wBWdvgCceYrw&hl=en&sa=X&ei=CVQtVeulIIzmsAS46IH4Dg&ved=0CEoQ6AEwCA#v=onepage&q=aws%20resources%20%22terminate%20after%22&f=false

+0

Dans le livre lié, j'ai trouvé le texte suivant utile: "L'option Terminer après vous permet de définir une limite supérieure de temps pour l'opération de copie à effectuer. défaillances de pipeline ou problèmes S3. " – mnd