2010-08-28 4 views
0

J'écris une application pour GAE (Python 2.5) et je me demandais s'il y a une bibliothèque comme PyQuery (qui fonctionne sur Python 2.6+).Analyser HTML facilement comme PyQuery en Python 2.5

Tout ce que j'ai à faire est de charger un fichier HTML et d'obtenir le contenu d'un tag spécifique grâce à son ID. Dans PyQuery, ou même les bibliothèques de Python2.6 comme lxml, c'est très facile, mais je ne sais pas comment faire avec Python 2.5.

Quelqu'un peut-il m'aider? ^^

Merci les gars. :)

+1

PyQuery dépend crucialement de lxml, qui est une bibliothèque tierce disponible pour Python 2.3 ou ultérieur, incluant complètement 2.5 et 2.6 - et malheureusement _not_ disponible sur GAE, voir par ex. http://stackoverflow.com/questions/1894696/python-lxml-on-app-engine. Ce n'est pas ** un problème de 2,5 vs 2,6! Veuillez éditer votre question pour corriger les fausses affirmations et implications en question (ce qui pourrait dérouter les autres), merci. Quant à votre Q, les réponses existantes suggérant BeautifulSoup (qui est pure-Python et donc très bien pour GAE) sont bien - mais, soyez sûr d'obtenir BS 3.0.8.1, ** pas ** BS 3.1! –

+0

Qu'en est-il de la version 3.2.0 de BeautifulSoup avec GAE? C'est la version actuelle .. – timbo

Répondre

2

BeautifulSoup est un choix commun pour l'analyse HTML, et est compatible avec Python 2.5.

Questions connexes