2012-11-20 2 views
3

J'ai réussi à collecter le comportement d'un site web complexe dans un webarchive. Par la suite je voudrais transformer cette archive web en un ensemble html de répertoire imbriqué. Pourtant, quand je l'ai fait à la fois avec Waf et avec un logiciel commercial acheté sur le magasin Apple, ce que je reçois est juste le répertoire imbriqué avec la page html en bas et aucune image, ni css ni liens de travail. Si vous êtes intéressé le document webarchive est à:Convertir webarchive en html

http://www.miafoto.it/it/GiroMilano.webarchive

alors que le produit faible de l'extraction est à:

http://www.miafoto.it/it/Giromilano/Pagine/default.aspx

et les répertoires vides au-dessus. En plus du look différent, le webarchive affiche le même comportement que le site web officiel - quand une liste de valeurs est sélectionnée puis le bouton poussé - alors que la version extraite produit une page sans contenu en se chargeant plutôt que la page officielle . Comme vous pouvez voir l'archive web est plus de 1 Mo alors que l'extraction juste un peu plus de 1 Ko.

Qu'est-ce qui ne va pas et comment puis-je effectuer une activité apparemment banale avec des résultats utilisables?

Merci,

+0

J'ai découvert le site Web à: http://www.atm.it/it/Giromilano/Pagine/default.aspx crée des fichiers de type axd avec du code Javascript intégré et prédéfini à l'intérieur. Ce qui me bat, c'est comment Safari est capable de compacter tout cela dans son webarchive et cela ne fait que rivaliser avec l'étonnement de ne pas pouvoir exploiter cette magie. De plus j'ai essayé de télécharger une copie du site Web complet par WinHTTPTrack mais le fichier est apparu comme un fichier .html au lieu de .aspx. Été concentré sur Mac et Linux je dois dire que je ne pouvais pas être plus confus. Quelqu'un pourrait-il jeter quelque lumière? Merci, Fabrizio – user1785898

Répondre

0

je parvins la question en trouvant tous les paramètres soumis à la page et les soumettre trop dans mon script, en ignorant le webarchive.

3
textutil -convert html example.webarchive 
  • Attention - html avec des fichiers est créé dans le même dossier que webarchive!
  • De plus, j'ai dû ouvrir .html avec l'éditeur de texte et remplacer les liens "file: ///image.tiff" (remplacer "file: ///" par "") afin qu'ils pointent vers le chemin relatif.
  • De plus, tous les navigateurs n'affichent pas les images .tiff.

Qui savait que nous avions Stack Overflow wiki?