Cette question n'a pas une seule "bonne" réponse.Carte réduire les algorithmes sur téraoctets de données?
Je suis intéressé par l'exécution d'algorithmes Map Reduce, sur un cluster, sur des téraoctets de données.
Je veux en savoir plus sur le temps de fonctionnement desdits algorithmes.
Quels livres devrais-je lire?
Je ne suis pas intéressé par la configuration de clusters de réduction de carte ou l'exécution d'algorithmes standard. Je veux des traitements théoriques rigoureux ou du temps de course.
EDIT: Le problème n'est pas que la carte réduise les changements de durée. Le problème est que la plupart des algorithmes ne distribuent pas bien pour mapper les frameworks. Je suis intéressé par les algorithmes qui s'exécutent sur la carte de réduire le cadre.