Vous pouvez probablement adapter le graphique en mémoire (dans la représentation que chaque sommet connaît une liste de ses voisins). Puis, à partir de chaque sommet n, vous pouvez exécuter une recherche en largeur d'abord (en utilisant une file d'attente) à la profondeur de 6 et compter le nombre de sommets visités. Si tous les sommets ne sont pas visités, vous avez réfuté le théorème. Dans les autres cas, continuez avec le prochain sommet n.
Ceci est O (N * (N + #)) = N * (N + N * 100) = 100N^2, si l'utilisateur a 100 connexions en moyenne, ce qui n'est pas idéal pour N = 20 millions. Je me demande si les bibliothèques mentionnées peuvent calculer le diamètre en meilleure complexité temporelle (l'algorithme général est O (N^3)).
Les calculs des sommets individuels sont indépendants, ils peuvent donc être effectués en parallèle.
Une petite heuristique: commencez par les sommets qui ont le degré le plus bas (meilleure chance de réfuter le théorème).
Est-ce que six degress est un maximum ou une moyenne? La plupart des analyses que j'ai lues utilisent la moyenne et non le maximum. –
La conception commune de "six degrés de séparation" est que c'est un maximum. Bien sûr, ce n'est pas vrai du tout dans la réalité. C'est juste plus impressionnant de le dire de cette façon et difficile de trouver des contre-exemples. –