2017-02-03 1 views
0

Ma question est simple, Je veux savoir pourquoi toutes mes lignes ne sont pas insérées dans mon PostgresDB. Parce que j'ai besoin de toutes les lignes insérées. L'étape (Combinaison L/U) est obtenue avec une graduation verte. L'étape ne devrait-elle pas avoir une marque de couleur rouge si elle ne réussit pas? Voici les paramètres étape de ma transformation:Pentaho Data Integration: Combination Lookup/Update: toutes les lignes ne sont pas insérées

Transformation Step :

Combination L/U configuration :

+2

Pouvez-vous ajouter une capture d'écran de la configuration de la combinaison recherche/mise à jour de l'étape? Il est très probable que certains de vos enregistrements aient des valeurs identiques pour tous les champs de recherche. La recherche n'a donc pas besoin de changer quoi que ce soit, elle renvoie uniquement la clé de l'enregistrement de dimension existant. – Cyrus

+0

J'ai ajouté une capture d'écran de la combinaison L/U step, merci. – blackgee

Répondre

0

On dirait que vous remplissez une table de fait, pas une dimension. Une étape Table Output est le bon choix pour cela, car vous n'avez plus besoin de chercher quoi que ce soit, vous l'avez déjà fait dans les étapes précédentes.

Une note sur vos données et la table de faits:

de la question, vous avez des lignes en double (celles qui disparaissent dans la mise à jour de recherche de combinaison). Veuillez vérifier soigneusement s'ils doivent être présents en fonction des données sources et s'ils respectent la "granularité" que vous avez en tête.

Par exemple:

  • si la table contient un enregistrement fait par la vente, il est tout à fait bien pour qu'il y ait deux lignes avec le même temps, bureau, etc, et même le même montant. Votre table contient beaucoup, presque 10%.
  • si la table de faits contient les ventes par jour par bureau, etc. Ensuite, il faut PAS être deux lignes avec toutes les mêmes clés et même les mêmes montants. Il est probable que certaines opérations de jointure soient effectuées dans les doublons créés par ETL.
+0

Désolé j'ai oublié de mentionner, c'est en effet une table de faits. Je viens de réaliser que je peux utiliser la sortie de table pour ma table de faits parce que je fais déjà toute la recherche dont j'ai besoin. Comme j'examine le fichier source, vous aviez raison, il contient quelques lignes en double pour la combinaison que je recherche. Donc, les lignes 130k est déjà le bon numéro pour ma table de faits. Merci. – blackgee