2009-09-17 7 views
1

de nombreuses pages Web utilisent onload JavaScript pour manipuler leur DOM. Existe-t-il un moyen d'automatiser l'accès à l'état du HTML après ces opérations JavaScript?état de HTML après onload javascript

A pris comme wget n'est pas utile ici car il télécharge simplement la source d'origine. Existe-t-il un moyen d'utiliser un moteur de rendu de navigateur Web?

Idéalement, je suis à la recherche d'une solution avec Python.

merci!

+0

Que voulez-vous faire exactement? Je ne suis pas sûr s'il y a une possibilité de js et python jouant bien, D –

+0

un certain grattage d'écran. Il semble qu'il y ait une solution Java: HtmlUnit – hoju

+0

semble possible, mais difficile: http://mail.python.org/pipermail/python-list/2009-March/706800.html – hoju

Répondre

2

La seule bonne façon que je connais de faire de telles choses est d'automatiser un navigateur, par exemple via Selenium RC. Si vous n'avez aucune idée de la façon de déduire que la page a fini d'exécuter le javascript pertinent, alors, juste un vrai utilisateur en direct visitant cette page, il vous suffit d'attendre un instant, de prendre un instantané, d'en attendre un autre , et vérifiez qu'il n'y avait pas de changement entre eux pour vous convaincre que c'est vraiment fini.