en passant par le hadoop dans le livre d'action je suis tombé sur plusieurs classes concernant les jointures réduites, certains d'entre eux sont DataJoinMapperBase, TaggedMapOutput, DataJoinReducerBase.Joints dans MapReduce
mais quand je suis allé google à la recherche de concept de jointures sur hadoop, aucun d'entre eux sont basés sur les classes spécifiées ci-dessus. Au lieu qu'ils implémentaient leurs propres logiques et beaucoup sont basés sur plusieurs entrées.
Maintenant, ma question est quelle est la meilleure approche pour les jointures sur hadoop? Que pourrait-on faire pour obtenir de meilleurs résultats? Des suggestions à ce sujet?
Pouvez-vous donner des exemples de ce que vous essayez d'accomplir? –
dès maintenant je voulais un innerjoin de deux tables – user1585111