2009-02-03 6 views
1

Je suis nouveau à Python et il semble avoir beaucoup de bonnes fonctions que je ne connais pas. Quelle fonction puis-je utiliser pour obtenir le nom du site racine? Par exemple, comment puis-je obtenir faqs.org si j'ai donné à la fonction l'URL "http://www.faqs.org/docs/diveintopython/kgp_commandline.html"?obtenir le nom du site d'une URL en python

+0

Juste pour clarifier, voulez-vous vraiment juste "faqs.org" ou voulez-vous "www.faqs.org"? Essayer d'obtenir le premier est une mauvaise idée, car il n'est pas portable dans des domaines comme "www.amazon.co.uk". –

+0

http://docs.python.org/library/urlparse.html – vartec

Répondre

5
>>> from urllib.parse import urlparse 
>>> urlparse('http://www.cwi.nl:80/%7Eguido/Python.html').hostname 
'www.cwi.nl' 
2

Le module de urlparse beaucoup négligé:

from urlparse import urlparse 
scheme, netloc, path, params, query, fragment = urlparse("http://www.faqs.org/docs/diveintopython/kgp_commandline.html") 
print netloc 
+0

netloc peut inclure le numéro de port – SilentGhost

2

Quelle version de Python vous apprenez avec? Notez que la réponse de SilentGhost est pour Python 3.0, tandis que Alabaster Codify fonctionnera avec la série 2.x.

Questions connexes