Je construis un graphique à partir d'un RDD de tuples de noeuds source et destination, comme ceci:Comment obtenir la taille du plus grand composant connecté d'un graphique dans Spark?
Graph.fromEdgeTuples(rawEdges = edgeList, 1)
Tout d'abord, je ne comprenais pas tout à fait ce que le second paramètre est. De la documentation,
defaultValue le sommet des attributs avec lesquels pour créer des sommets référencés par les bords
Je ne comprends toujours pas. Deuxièmement, je ne trouve rien pour calculer la taille du plus gros composant. Il n'y a pas
foreach
mis en œuvre, nimap
oureduceByKey
, ou toute autre chose après l'appel de la méthodeconnectedComponents
.