2009-11-03 6 views

Répondre

10

Html2Text semble être une bonne option

+0

celui-ci fonctionne très bien –

+0

Le site n'est plus accessible depuis Aaron, l'auteur n'est plus. –

+1

mais le code peut être trouvé sur https://github.com/aaronsw/html2text –

4

Voici une bibliothèque Python qui fait l'analyse syntaxique HTML:

BeautifulSoup est une autre option.

+2

Pour éviter que d'autres ne reviennent de Google à SO, voici un Q & A qui explique que Beautiful Soup n'est plus vraiment maintenu: [WebScraping with BeautifulSoup ou LXML.HTML] (http://stackoverflow.com/questions/5493514/webscraping-with-beautifulsoup-or-lxml-html). – sage

+1

Belle soupe semble être maintenue maintenant je pense. – contrebis

Questions connexes