2009-10-17 6 views
59

J'ai souvent besoin de télécharger une page Web, puis de la modifier hors ligne. J'ai essayé quelques outils et la principale caractéristique qui leur manque est le téléchargement d'images référencées dans les fichiers CSS.télécharger la page Web et les dépendances, y compris les images css

Existe-t-il un outil (pour Linux) qui va tout télécharger afin que la page Web rende la même chose hors ligne (hors AJAX)?

+0

Cela a fonctionné pour moi le meilleur ::::::::::: wget --no-clobber --page-requis --html-extension --convert-liens --restrict-file-names = windows --no-parent http://example.com/ – rsharpy

Répondre

79
wget --page-requisites http://example.com/your/page.html 

This option provoque wget pour télécharger tous les fichiers qui sont nécessaires pour afficher correctement une page html donnée. Cela inclut des éléments tels que des images, des sons et des feuilles de style référencés.

EDIT: meder a raison: stock wget n'analyse pas et ne télécharge pas les images css. Il y a, cependant, un patch qui ajoute cette fonctionnalité: [1, 2]

MISE À JOUR: Le patch mentionné ci-dessus has been merged into wget 1.12, publié le 22-Sep-2009:

** Added support for CSS. This includes: 
- Parsing links from CSS files, and from CSS content found in HTML 
    style tags and attributes. 
- Supporting conversion of links found within CSS content, when 
    --convert-links is specified. 
- Ensuring that CSS files end in the ".css" filename extension, 
    when --convert-links is specified. 
+3

Pour autant que je sache, cela ne va pas télécharger les images référencées dans les fichiers CSS, ce qui est ce que l'OP avait l'intention. Je pense que vous auriez à écrire un script qui analyse les fichiers CSS, ou trouver quelqu'un est fait, je suis curieux à ce sujet aussi. –

+0

Vous devriez télécharger le répertoire entier images récursivement – OscarRyz

+0

semble que le patch a été autour depuis 07, et toujours pas intégré ... – hoju

6

je suis tombé sur le même problème l'autre jour, travailler pour un client. Un autre outil qui fonctionne vraiment bien est HTTrack. Le logiciel est disponible dans une version en ligne de commande pour Windows et Linux. Pour Linux, ils ont pré-compilé des paquets pour la plupart des systèmes d'exploitation les plus courants trouvés. here

Pour mes objectifs, cela a mieux fonctionné que wget avec certaines fonctions/commutateurs supplémentaires qui corrigent les liens dans le fichier html.

+0

Quelle syntaxe utilisez-vous pour cette tâche? –

+0

La documentation assez complète est ici [link] (http://www.httrack.com/html/shelldoc.html) Je ne me souviens pas des paramètres précis que j'ai utilisés, mais j'ai essayé quelques combinaisons différentes pour trouver ce dont j'avais besoin. –

+0

@EveretteMills que ce que je cherchais merci –

9

Il est possible de le faire à travers Firefox, voir ce formulaire

  1. clic droit
  2. Voir la page d'info
  3. Sélectionnez l'onglet média
  4. Sélectionnez tous les fichiers
  5. Enregistrer sous

Référence - http://www.webdeveloper.com/forum/showthread.php?t=212610

+5

Cela ne aide pas quand il s'agit de sauvegarder les fichiers css ou js –

+3

ne reçoit pas CSS, qui a été spécifié par l'Op. C'est un truc/processus cool cependant. Je n'y aurais pas pensé moi-même. Merci d'avoir posté. – BishopZ

+1

Cela a fonctionné pour moi, sauvé tous les PNG utilisés via css, merci beaucoup. – user9349193413

8

wget est un excellent choix pour vous. Juste pour plus d'informations, la version wget sur Windows à ce moment il n'y a pas de version officielle sur gnu pour wget version 1.12. La version actuelle est 1.11

wget version 1.11 ne peut pas télécharger des images/polices dans des fichiers CSS. Heureusement, vous pouvez trouver une version de 1.14 à partir de cette page. Il a résolu ces problèmes.

http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html

+2

+1 pour nous avoir fait savoir qu'il n'y avait pas de version de Windows '1.12' –

2

Dans Firefox:

Fichier-> Enregistrer la page As-> Page Web, complète

Enregistre tous javascript et images et css.Rien d'autre requis :)

+3

Malheureusement, cette méthode ne téléchargera pas les images référencées dans les fichiers CSS (dans le dernier FF 21 et plus récent). – sgnsajgon

3

La version actuelle d'Opera (12) permet d'enregistrer une page en tant que 'HTML avec images'. Par conséquent, Opera télécharge également les images qui sont référencées dans les fichiers CSS et adapte les URL des images dans le CSS en conséquence.

+0

A fonctionné parfaitement là où d'autres options ont échoué. –

Questions connexes