2017-10-12 14 views
0

J'essaie de scrap web certains Tweets de cette URL en utilisant Python 3,5% 20d% 20s% 20u en lien Python 3.5

url = "https://twitter.com/search?l=en&q=ecb%20draghi%20since%3A2012-09-01%20until%3A2012-09-02&src=typd"

Mon problème est que% 20d% 20s% 20u sont déjà codés dans Python 3.5, donc mon code ne fonctionne pas sur cette URL. Y a-t-il un moyen de résoudre ce problème?

Merci à l'avance, Meilleur

+0

Le lien que vous avez fourni est déjà un travail avec python 3.5. Je n'ai trouvé aucun problème pour utiliser votre lien fourni. – SIM

Répondre

0

% 20 est le codage URL pour l'espace (0x20 être le code ASCII de l'espace). Il suffit de remplacer tous ces% 20 par des espaces et tout va probablement fonctionner.

0

Vous pouvez utiliser urllib2.unquote() en python 2 ou urllib.request.unquote() en python 3 pour décoder l'URL.

import urllib.request 
url = "https://twitter.com/search?l=enq=ecb%20draghi%20since%3A2012-09-01%20until%3A2012-09-02&src=typd" 
decoded_url = urllib.request.unquote(url) 
print(decoded_url) 
0

cela fonctionne bien dans MY PC,% 20 est pour l'espace seulement Les URL ne peuvent pas contenir d'espaces.

Lire de

URL remplace le codage normalement un espace avec un plus (+) signe ou avec 20%.