2017-07-11 3 views
1

que je suis le HTTrack docs exemple ici: http://httrack.kauler.com/help/User-defined_structureComment puis-je obtenir httrack pour enregistrer les fichiers avec leurs noms d'origine plutôt que l'index ****. Html?

Le site que je dois gratter a des URL dans cette structure:

https://www.example.com/index.php?HelpTopics

https://www.example.com/index.php?MoreHelp

etc.

Avec HTTrack, je veux télécharger le site enregistrer les fichiers au format

HelpTopics.htmlMoreHelp.html etc.

J'utilise ceci sur la ligne de commande modifiée des documents liés ci-dessus:

httrack "https://www.example.com" %n%[index.php?:-:::].%t

mais Je reçois toujours tous les fichiers enregistrés comme index2b26.html et index2de7.html etc.

Qu'est-ce que je fais de mal avec les options HTTrack? Est-ce briser parce qu'il n'y a aucune extension de fichier sur le site d'origine example.com?

Répondre

0

J'ai trouvé qu'il est beaucoup plus facile d'utiliser wget pour enregistrer le fichier avec leurs noms d'origine. Cela fonctionne:

wget --mirror -p --convert-links --content-disposition --trust-server-names -P examplefolder http://www.example.com