2010-09-30 11 views
1

J'ai suivi Hadoop pendant un moment, cela semble être une excellente technologie. La carte/Réduire, Clustering c'est juste de bonnes choses. Mais je n'ai trouvé aucun article concernant l'utilisation de Hadoop avec SQL Server. Disons que j'ai une énorme table de revendications (600 millions de lignes) et je veux profiter de Hadoop. Je pensais mais corrigez-moi si je me trompe, je peux interroger ma table et extraire toutes mes données et les insérer dans hadoop en morceaux de tout type (xml, json, csv). Ensuite, je peux profiter de Map/Reduce et Clustering avec au moins 6 machines et quitter mon SQL Server pour d'autres tâches. Je ne fais que jeter un os ici je veux juste savoir si quelqu'un a fait une telle chose.Meilleures pratiques Hadoop et MS SQL Server

Répondre

2

L'importation et l'exportation de données depuis et vers une base de données relationnelle est un cas d'utilisation très courant pour Hadoop. Jetez un oeil à l'utilitaire Sqoop Cloudera, qui vous aidera dans ce processus:

http://incubator.apache.org/projects/sqoop.html

+1

Merci pour le Sqoop :) –