J'essaie de résoudre un problème avec la théorie de l'implémentation du PageRank avec MapReduce.Implémentation du PageRank en utilisant MapReduce
Je le scénario simple suivant avec trois nœuds: AB C.
La matrice de contiguïté est ici:
A { B, C }
B { A }
Le PageRank B par exemple, est égal à:
(1-d)/N + d (PR(A)/C(A))
N = number of incoming links to B
PR(A) = PageRank of incoming link A
C(A) = number of outgoing links from page A
Je vais bien avec tous les schémas et comment le mapper et le réducteur fonctionneraient mais je ne peux pas comprendre comment au moment du calcul par le réducteur, C (A) serait connu. Comment le réducteur, en calculant le PageRank de B en agrégeant les liens entrants à B connaîtra le nombre de liens sortants de chaque page. Cela nécessite-t-il une recherche dans une source de données externe?
Peut-être pourrait obtenir une meilleure réponse sur: http://cstheory.stackexchange.com/ – Orbling