Python 3 Obtenir la page HTTP

Comment puis-je demander à python d'obtenir le contenu d'une page HTTP? Jusqu'à présent, tout ce que j'ai est la demande et j'ai importé http.client.Python 3 Obtenir la page HTTP

Source

2010-01-07 BiscottiGummyBears

urllib.request est probablement à l'aide de la meilleure façon de le faire:

import urllib.request 
f = urllib.request.urlopen("http://stackoverflow.com") 
print(f.read())

Source

2010-01-07 21:48:08

Essayé cela et j'ai "AttributeError: 'module' objet n'a pas d'attribut 'urlopen'" – BiscottiGummyBears

En fait, le module correct à importer est urllib2. –

Désolé, je viens de remarquer que vous utilisiez Python 3. J'ai mis à jour mon exemple pour correspondre. –

Ajouter ce code qui peut formater des données pour la lecture humaine:

text = f.read().decode('utf-8')

Source

2015-10-15 07:53:13 SKGoC

Vous pouvez également utiliser la bibliothèque de demandes. J'ai trouvé cela particulièrement utile parce qu'il était plus facile de récupérer et d'afficher l'en-tête HTTP.

import requests 

source = 'http://www.pythonlearn.com/code/intro-short.txt' 

r = requests.get(source) 

print('Display actual page\n') 
for line in r: 
    print (line.strip()) 

print('\nDisplay all headers\n') 
print(r.headers)

Source

2016-05-18 06:04:34 dimsum88

Est-ce Python 3? –

Cela fonctionnera-t-il pour Python 3? –

Module intégré Utilisation "http.client"

import http.client 

connection = http.client.HTTPSConnection("api.bitbucket.org", timeout=2) 
connection.request('GET', '/2.0/repositories') 
response = connection.getresponse() 
print('{} {} - a response on a GET request by using "http.client"'.format(response.status, response.reason)) 
content = response.read().decode('utf-8') 
print(content[:100], '...')

Résultat:

200 OK - a response on a GET request by using "http.client" {"pagelen": 10, "values": [{"scm": "hg", "website": "", "has_wiki": true, "name": "tweakmsg", "links ...

utilisation de la bibliothèque tiers "demandes"

response = requests.get("https://api.bitbucket.org/2.0/repositories") 
print('{} {} - a response on a GET request by using "requests"'.format(response.status_code, response.reason)) 
content = response.content.decode('utf-8') 
print(content[:100], '...')

Résultat:

200 OK - a response on a GET request by using "http.client" {"pagelen": 10, "values": [{"scm": "hg", "website": "", "has_wiki": true, "name": "tweakmsg", "links ...

Module intégré Utilisation "urllib.request"

response = urllib.request.urlopen("https://api.bitbucket.org/2.0/repositories") 
print('{} {} - a response on a GET request by using "urllib.request"'.format(response.status, response.reason)) 
content = response.read().decode('utf-8') 
print(content[:100], '...')

Résultat:

200 OK - a response on a GET request by using "http.client" {"pagelen": 10, "values": [{"scm": "hg", "website": "", "has_wiki": true, "name": "tweakmsg", "links ...

Notes:

Python 3.4
Résultat des réponses les plus sera probablement différent que le contenu

Source

2016-12-17 08:57:38

https://stackoverflow.com/a/41862742/8501970 Check this out à la place. C'est à peu près le même problème que vous avez et celui-ci est très simple et très peu de lignes de codes. Cela m'a vraiment aidé quand j'ai réalisé que python3 ne pouvait pas simplement utiliser get_page.

Ceci est une bonne alternative.

Source

2017-10-21 20:23:21

Python 3 Obtenir la page HTTP

Répondre

Questions connexes