2012-05-07 3 views
0

J'essaie de comprendre la différence entre la sortie résultante d'une page de chargement simple avec QtWebkit et une commande wget, à part que QtWebkit a une grande API que nous pouvons utiliser dans une page web pour faire beaucoup de choses avec Python.wget vs charger la page avec QtWebkit

Quel est le processus d'un wget et comment puis-t-il télécharger une page Web avec tous ses composants (images, etc.). Y a-t-il une différence dans la taille de sortie des deux processus?

Et dernière question: Qu'est-ce qui est en cours d'exécution (javascript) dans une page de chargement avec QtWebkit (en plus d'un gestionnaire d'événements onload)?

Répondre

1

Par défaut, wget ne récupère aucune page requise sauf si vous l'indiquez via le -p/--page-requisites or the -r/--recursive flags. Il ne traite aucune commande JavaScript et ne tente pas de faire quoi que ce soit avec le balisage ou le CSS, à moins que vous le lui disiez explicitement. Même dans ce cas, je suis à peu près sûr qu'il utilise simplement une simple correspondance de chaîne pour déterminer les noms de ressources et les URL de liens. Dans l'ensemble, c'est assez stupide jusqu'à ce que vous le configuriez correctement (la base pour à peu près tous les puissants * outils NIX).

Étant donné que la bibliothèque WebKit est très étendue, il serait utile de savoir ce que vous essayez d'en faire, comme le code que vous exécutez. Mais, puisque vous savez déjà ce que vous faites est effectuer des appels JavaScript, il est raisonnable de supposer qu'il fait beaucoup plus que simplement récupérer la page. Peut-être que si vous donniez quelques exemples de ce que vous essayez de faire, je serais en mesure de répondre de manière plus approfondie à votre question.

+0

Il ne s'agit pas d'exemples, je cherche plutôt un document ou un article comparatif qui montre comment fonctionnent les deux, peut-être un schéma de processus. – user1319236