J'essaye d'écrire une fonction pour poster des données de formulaire et enregistrer les informations de cookie retournées dans un fichier de sorte que la prochaine fois que la page est visitée, les informations cookie sont envoyé au serveur (comportement normal du navigateur). J'ai écrit ceci relativement facilement en C++ en utilisant curlib, mais j'ai passé presque toute une journée à essayer d'écrire ceci en Python, en utilisant urllib2 - et toujours pas de succès.Python formulaire POST en utilisant urllib2 (également question sur la sauvegarde/utilisation de cookies)
C'est ce que j'ai jusqu'à présent:
import urllib, urllib2
import logging
# the path and filename to save your cookies in
COOKIEFILE = 'cookies.lwp'
cj = None
ClientCookie = None
cookielib = None
logger = logging.getLogger(__name__)
# Let's see if cookielib is available
try:
import cookielib
except ImportError:
logger.debug('importing cookielib failed. Trying ClientCookie')
try:
import ClientCookie
except ImportError:
logger.debug('ClientCookie isn\'t available either')
urlopen = urllib2.urlopen
Request = urllib2.Request
else:
logger.debug('imported ClientCookie succesfully')
urlopen = ClientCookie.urlopen
Request = ClientCookie.Request
cj = ClientCookie.LWPCookieJar()
else:
logger.debug('Successfully imported cookielib')
urlopen = urllib2.urlopen
Request = urllib2.Request
# This is a subclass of FileCookieJar
# that has useful load and save methods
cj = cookielib.LWPCookieJar()
login_params = {'name': 'anon', 'password': 'pass' }
def login(theurl, login_params):
init_cookies();
data = urllib.urlencode(login_params)
txheaders = {'User-agent' : 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'}
try:
# create a request object
req = Request(theurl, data, txheaders)
# and open it to return a handle on the url
handle = urlopen(req)
except IOError, e:
log.debug('Failed to open "%s".' % theurl)
if hasattr(e, 'code'):
log.debug('Failed with error code - %s.' % e.code)
elif hasattr(e, 'reason'):
log.debug("The error object has the following 'reason' attribute :"+e.reason)
sys.exit()
else:
if cj is None:
log.debug('We don\'t have a cookie library available - sorry.')
else:
print 'These are the cookies we have received so far :'
for index, cookie in enumerate(cj):
print index, ' : ', cookie
# save the cookies again
cj.save(COOKIEFILE)
#return the data
return handle.read()
# FIXME: I need to fix this so that it takes into account any cookie data we may have stored
def get_page(*args, **query):
if len(args) != 1:
raise ValueError(
"post_page() takes exactly 1 argument (%d given)" % len(args)
)
url = args[0]
query = urllib.urlencode(list(query.iteritems()))
if not url.endswith('/') and query:
url += '/'
if query:
url += "?" + query
resource = urllib.urlopen(url)
logger.debug('GET url "%s" => "%s", code %d' % (url,
resource.url,
resource.code))
return resource.read()
Lorsque je tente de vous connecter, je passe le nom d'utilisateur et ,. PWD cependant, la connexion échoue et aucune donnée de cookie n'est enregistrée.
Mes deux questions sont:
- quelqu'un peut-il voir ce qui ne va pas avec la fonction de connexion(), et comment puis-je résoudre ce problème?
- comment puis-je modifier la fonction get_page() pour utiliser les informations de cookie que j'ai enregistrées?
+1 pour l'extrait de code. Votre code est tellement plus propre et net que le mien (eh bien je commence juste à apprendre à être un Pythonista!;) J'ai lu et relu votre message - il y a deux choses qui ne me sont pas claires. 1). Je ne comprends pas pourquoi vous devez appeler loginToFacebook() deux fois. Il semble que le cookie sera défini chaque fois que l'identifiant de la méthode loginToFacebook() est invoqué. Pourriez-vous clarifier s'il vous plaît? 2). pouvez-vous donner des directives sur la façon de vérifier si un cookie ACTIVE existe? – morpheous
Avec les connexions basées sur les cookies, le serveur vous attribue d'abord un cookie, * puis * vous connectez. Si vous essayez de supprimer l'une des connexions, vous constaterez que vous n'êtes pas connecté - FB a vérifié votre réponse, vu que vous n'avez pas de cookie et que vous êtes redirigé vers la page de connexion.Un moyen plus clair serait de remplacer le premier appel par un pour obtenir la page d'accueil du FB comme 'def getFBCookie (self): self.opener.open ('https://www.facebook.com/')' qui serait faire la même chose. Et oui, c'est un code assez soigné. Cela prend un peu plus de temps à l'avance, mais paye quand vous avez besoin de le lire plus tard, ou de le réutiliser :) –