Lorsque je charge une page avec Firebug, je peux voir une liste de toutes les images requises par le site. Comment automatiser la recherche d'une liste des URL d'images utilisées par une page Web, y compris celles référencées dans des feuilles de style CSS externes?automatiser la recherche de toutes les images utilisées par la page Web
Répondre
à la fin je webkit pour charger chaque page Web et regarder les ressources téléchargées
Avec PHP Simple HTML DOM Parser il est aussi facile que:
$html = file_get_html('http://www.google.com/');
$ret = $html->find('img');
analyseur simple HTML DOM inclut également des options pour obtenir les attributs de chaque objet, vous devriez donc être en mesure de saisir l'URL facilement. Quelque chose comme:
$URL = $ret->src;
(Ce regarde à travers les DOM, donc je suppose qu'il trouvera des images insérées par CSS, mais je n'ai pas eu la chance de le tester.)
extraire les balises img de HTML est facile. Même une regex fera l'affaire. Le bit dur est de trouver des images référencées à partir de CSS externes ou chargées dynamiquement avec JavaScript, ce que cet outil ne fera pas. – hoju
Il y a quelques extensions Firefox qui traitent de télécharger des images à partir d'une page Web. Pourquoi ne pas essayer le module "Image Download"?
Je dois automatiser cela pour les sites 100K + ... – hoju
- 1. Chargement de la page Web avant la fin de toutes les images
- 2. Automatiser obtenir rapport à partir de la page Web
- 3. C# - libère toutes les ressources utilisées par un objet
- 4. protéger les images sur la page Web d'être copié/enregistré?
- 5. images de phrase de la page Web coldfusion
- 6. automatiser la navigation d'un site Web alimenté par JavaScript
- 7. Recherche de toutes les images dans un FlowDocument
- 8. Comment automatiser la recherche de directives #include inutilisées?
- 9. Jquery: Automatiser Mousemove toutes les 20secondes
- 10. Supprimer toutes les images
- 11. Comment intercepter toutes les pages/images sur mon site Web?
- 12. Localisation de la page Web
- 13. IIS7: Afficher les ressources utilisées par un site Web spécifique
- 14. Précharger des images avant les chargements de page Web
- 15. Images sur les sites Web
- 16. Existe-t-il un moyen de trouver où toutes les ressources utilisées par un exécutable PE?
- 17. développeur web visuel redimensionner "toutes les images" ensemble?
- 18. comment voir toutes les images dans la galerie intégrée d'android d'une page de php
- 19. Activer la page Web pour le fournisseur de recherche IE
- 20. Comment afficher la page de chargement avant la page avec les résultats de recherche affichés?
- 21. définir par défaut sur la page Web
- 22. Images recherche de moteur de recherche par la couleur principale dans l'image
- 23. Saisir les détails de la page Web
- 24. comment remplacer les images brisées dans la page Web avec une image d'erreur avec mootools1.2
- 25. normalisation de la table Automatiser
- 26. télécharger la page Web par asp.net
- 27. Accéder aux images utilisées dans les thèmes du navigateur?
- 28. Versions du journal de toutes les DLL utilisées
- 29. Placer deux images dans les coins supérieurs de la page Web sans chevauchement
- 30. Taille de la page HTML - poids de la page
Où trouver les images téléchargées par webkit? – Treper