2016-07-27 3 views
0

Je veux écrire deux emplois programmés pour mon serveur Ubuntu 14.04.4. Les tâches doivent être séquentielles.emplois séquentiels programmés dans le serveur Ubuntu

Le premier travail doit décompressez un fichier .gz (SQL Dump), puis importer la table "myTable" dans la base de données MySQL (localhost).

Le deuxième emploi (écrit en utilisant l'outil Pentaho Data Integration) extrait des données de la table « myTable », transforme et charge dans une nouvelle base de données.

je pourrais avoir accompli la première tâche à l'aide cuillère Pentaho IPD, mais il ne fournit aucune fonction pour dézipper un fichier .gz & après quelques recherches et à venir accross ces postes:

http://forums.pentaho.com/showthread.php?82566-How-to-use-the-content-of-a-tar-gz-file-in-Kettle

How to uncompress and import a .tar.gz file in kettle?

Je rassemblerai que je devrais écrire manuellement un travail pour accomplir la première tâche à savoir décompresser un fichier .gz puis importer la table « myTable » dans la base de données MySQL.

Ma question est que la façon de créer une tâche cron qui exécute les deux successivement à savoir un premier emploi d'abord terminé, puis le second est exécuté.

S'il y a une meilleure approche alternative à cette s'il vous plaît suggérer.

Répondre

1

Vous pouvez utiliser l'étape « SHELL » dans un emploi IPD. Codez la partie décompressée de votre code dans l'étape shell suivie séquentiellement par votre transformation. Une image de l'échantillon ressemble à ceci:

enter image description here

Maintenant, vous pouvez planifier ce travail complet en CRON ou tout autre programmateur. Pas besoin de scripts séparés.

Note: Cela ne fonctionne que dans un env linux. ce que je suppose que vous utilisez.

Espérons que cela aide :)