2012-12-31 3 views
0

J'ai extirpé un ensemble d'URL qui sont sur le même sujet. Je veux trouver des liens entre eux afin que je puisse former un graphique en utilisant python. les URL ou sites Web représenteraient comme des nœuds et des liens entre eux, représentent comme des bords. S'il vous plaît aidez-moi ..graphe web pour un ensemble de sites utilisant python

+0

Quelle est votre question? Qu'avez-vous essayé? –

Répondre

0

Vous pouvez suivre cette approche simple -

Parse pages Web en utilisant BeautifulSoup [1] et de garder la propriété balises d'ancrage href stockées dans une liste imbriquée (en supposant LST). Donc, si une page Web (en supposant web1) des liens vers 3 autres pages web (en supposant des liens href1, href2, href3), puis -

lst['web1'][0] = 'href1' 
lst['web1'][1] = 'href2' 
lst['web1'][2] = 'href3' 

Parse De même d'autres pages web et créé des listes pour eux. Ce web1 peut être hrefx pour webx. J'espère que vous avez eu l'idée.

[1] http://www.crummy.com/software/BeautifulSoup/

+0

Merci pour la réponse theharshest. Maintenant j'ai un graphique de résultat de recherche de Web. Maintenant, je veux faire des grappes de graphiques sur cela. Actuellement, j'utilise networkx, mais il ne fournit pas any..can quelqu'un s'il vous plaît dites-moi une bonne méthode de clustering graphique que je peux utiliser en gardant à l'esprit que mon graphique est non pondéré et non orienté. Aussi, je suis confronté à un problème avec le paquet igraph. quelles sont les exigences avec ceci? aidez s'il vous plaît. – nishat

Questions connexes