2010-09-21 7 views
11

Je travaille sur un entrepôt de données et je recherche une solution ETL qui utilise Python. J'ai joué avec SnapLogic en tant que ETL, mais je me demandais s'il y avait d'autres solutions.ETL utilisant Python

Cet entrepôt de données vient de commencer. Je n'ai pas encore apporté de données. Il sera facilement plus de 100 concerts avec le sous-ensemble initial de données que je veux charger dans celui-ci.

+0

Pourriez-vous décrire la taille d'un entrepôt de données sur lequel vous travaillez? Est-ce un entrepôt de longue date ou est-ce juste commencé? – eksortso

+0

Vérifiez les pandas, petl et autres outils etl. –

+0

Pourquoi l'exigence "utilise-t-elle Python"? Vous devriez choisir le meilleur outil pour le travail. –

Répondre

17

Oui. Il suffit d'écrire Python en utilisant une interface DB-API pour votre base de données.

La plupart des programmes ETL proposent des «langages de haut niveau» sophistiqués ou des interfaces graphiques par glisser-déposer qui n'aident pas beaucoup.

Python est tout aussi expressif et facile à utiliser.

Obfuscation d'esche. Utilisez simplement du vieux Python.

Nous le faisons tous les jours et nous sommes très, très satisfaits des résultats. C'est simple, clair et efficace.