2013-08-21 4 views
1

en passant par le hadoop dans le livre d'action je suis tombé sur plusieurs classes concernant les jointures réduites, certains d'entre eux sont DataJoinMapperBase, TaggedMapOutput, DataJoinReducerBase.Joints dans MapReduce

mais quand je suis allé google à la recherche de concept de jointures sur hadoop, aucun d'entre eux sont basés sur les classes spécifiées ci-dessus. Au lieu qu'ils implémentaient leurs propres logiques et beaucoup sont basés sur plusieurs entrées.

Maintenant, ma question est quelle est la meilleure approche pour les jointures sur hadoop? Que pourrait-on faire pour obtenir de meilleurs résultats? Des suggestions à ce sujet?

+0

Pouvez-vous donner des exemples de ce que vous essayez d'accomplir? –

+0

dès maintenant je voulais un innerjoin de deux tables – user1585111

Répondre

0

Vous pouvez essayer la bibliothèque Pangool, cela permet de réduire les jointures latérales très facilement. Les jointures côté carte ne sont qu'une recherche de mémoire.