2017-06-23 1 views
0

Je veux enregistrer plusieurs pages Web avec tout leur contenu, ce qui n'est pas si difficile en soi, et il existe plusieurs outils pour cette tâche.Enregistrer la page Web RENDERED avec du contenu. C# ou peut-être un outil/plugin spécialisé

Mais les pages elles-mêmes sont difficiles à travailler.

Ils sont rendus côté client (par javascript), donc saisir simplement ce qui se trouve dans html sur le serveur ne sert à rien.

Certains outils peuvent gérer cela, ils récupèrent le html correctement traité, recherchent les URL des images dans html et essaient ensuite de les télécharger.

Et voici un autre problème, les images ne peuvent pas être téléchargées directement, uniquement en tant que contenu de la page Web. Et là je suis coincé.

J'ai essayé de faire mon propre outil pour cette tâche en C#, et ressemble à webBrowser + ShowSaveAsDialog fonctionne très bien, mais il ne peut pas être automatisé.

Y at-il un moyen de rendre html et enregistrer tout son contenu en "mode silencieux"?

Répondre

0

si le problème est le « dialogue Enregistrer le fichier » vous pouvez enregistrer silentently: https://stackoverflow.com/a/2976716/1271037

mais je vous suggère de voir cette série d'article: Webscraping with C#

+0

Je n'ai pas trouvé la méthode '' SaveDocument' dans webBrowser'. [lien] (https://msdn.microsoft.com/ru-ru/library/system.windows.forms.webbrowser (v = vs.110) .aspx) Mais merci pour le lien, allez y voir. – Constantine

+0

@Constantine droite. édité. – dovid