J'écris un simple programme python qui récupère des informations à partir d'un site Web, le problème est qu'il y a des mots qui contiennent des caractères spéciaux tels que "°", "Ψ" et beaucoup plus .Python 2.7.13 UnicodeEncodeError et caractères spéciaux
Voici mon code:
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen('http://www.samplepage.sample').read()
soup = BeautifulSoup(r, "lxml")
text = soup.find_all("a", class_="some_class")
for word in text:
word = word.get_text()
word = word.encode('utf-8')
print word
la sortie doit être « ° », mais au lieu de cela, je reçois « Â ° »
Si je tente de l'encoder avec ascii je reçois la classique UnicodeEncodeError:
for word in text:
word = word.get_text()
word = word.encode('ascii')
print word
>>> UnicodeEncodeError: 'ascii' codec can't encode characters in position 7-8:
ordinal not in range(128)
Des idées?
Quel est le _samplepage.sample_ ici? – ksai
C'est juste n'importe quelle page Web – devmon
Nous ne pouvons pas voir la sortie de votre script jusqu'à ce que vous fournissiez le _url_ – ksai