2017-08-09 2 views
0

Je règle greenplum pour la première fois. Je suis le documentation. Je veux installer la connexion de sql à la base de données de greenplum. Actuellement, déterminer quelle est la meilleure façon d'y parvenir. Je suis tombé sur gpfdist et gpload.gpfdist vs gpload greenplum

Comment sont les deux différents? Comme les deux utilisent des tables externes, les deux fonctionnent sur des nœuds esclaves et sont utilisés pour le chargement en parallèle. Alors Y a-t-il un avantage à utiliser l'un plutôt que l'autre?

+0

gpload est un outil qui automatise l'utilisation de tables externes et de gpfdist. Vous pouvez utiliser gpfdist directement ou bien via gpload. C'est fondamentalement la même chose. –

Répondre

0

Répondre à votre question pour "Je veux configurer la connexion de sql à la base de données greenplum" ... Il est ambigu pour quelle base de données SQL vous faites référence.

De plus, aucun pilote de connectivité directe n'est disponible pour connecter une base de données non greenplum à la base de données greenplum. Toutefois, si vous souhaitez migrer des données d'Oracle vers Greenplum, vous pouvez utiliser l'outil fastclone d'Informatica.

Pour répondre à votre deuxième partie de question concernant gpfdist et gpload. GPFDIST est un processus distribué par fichier qui s'exécute sur le système hôte et sert les fichiers parallèlement à de nombreux segments. Lors de l'initialisation de la table externe à lire/écrire à partir du fichier, vous devrez spécifier quel processus servira le fichier. Dans votre cas, ce sera GPFDIST. Il y a aussi d'autres processus comme FTP, GPHDFS, HTTP. GPLOAD est un utilitaire wrapper qui facilite votre travail en créant automatiquement des processus gpfdist et des tables externes.

Sachez également que GPLOAD ne peut créer que des tables externes lisibles.