2015-07-26 1 views
2

Actuellement, j'utilise mécaniser comme ceci:Mécaniser Python et la méthode addheader - comment puis-je connaître les derniers en-têtes?

 browser = mechanize.Browser() 
     browser.set_handle_robots(False) 
     browser.set_handle_equiv(False) 
     browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')] 

Cependant, les systèmes d'exploitation et navigateurs sont mis à jour et je suppose que cet en-tête: Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1 devrait être mis à jour.

Existe-t-il un modèle, une méthode de construction d'une telle chaîne d'en-tête? Où puis-je trouver les dernières valeurs disponibles pour construire un tel en-tête?

Répondre

1

Pourquoi avez-vous toujours besoin de l'agent utilisateur le plus récent dans votre faux-entête? Les sites ne vous empêcheront pas d'utiliser un navigateur plus ancien dans la plupart des cas. Il suffirait donc de mettre à jour de temps en temps (ou pas du tout.) Souvent, il suffit d'ajouter "Mozilla" au début de la chaîne UA pour obtenir une réponse au fur et à mesure que le navigateur obtient). Une autre réponse serait si vous avez un serveur Web en cours d'exécution, obtenez une chaîne aléatoire (non-bot) à partir de vos http-logs.

0

Consultez la page http://www.useragentstring.com/pages/useragentstring.php pour obtenir la liste des chaînes d'utilisateur-agent actuelles du navigateur. Il peut également détecter et expliquer automatiquement les détails de l'utilisateur de votre navigateur actuel si vous cliquez sur home.

Vous pouvez également coller des chaînes User-Agent pour les avoir expliquées.

J'avais votre même question en tête et je suis tombé sur ce site tout à l'heure. J'y suis arrivé en recherchant sur Google une chaîne User-Agent, Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1'.

Bonne codification!