2011-08-25 2 views
1

J'ai fait gratter le texte de la page Web en utilisant scrapy. En araignée, je code comme:Scrapy problème avec le texte international

title = hxs.select("//h1/text()").extract() #1 
final_text = title[0].encode('utf-8') #2 

problème est ici ligne n ° 1 donne [u'Puerto Ban \ xfas'] ligne n ° 2 donne Puerto Ban \ xc3 \ xbas

Mais le texte original était Puerto Banús. Comment puis-je obtenir cet original enregistré et affiché?

Répondre

1
>>> print u'Puerto Ban\xfas' 
Puerto Banús 
>>> print 'Puerto Ban\xc3\xbas' 
Puerto Banús 

Je ne vois pas de problème ici.