2010-01-21 6 views
0

Je veux développer une page asp.net à travers lequel je peux spécifier l'URL de n'importe quelle page qui contient des liens de nombreux fichiers & répertoires. Je veux les télécharger tous. Similaire au plugin DownThemAll de FireFox.Télécharger tous les liens à partir de n'importe quelle page

fichier

dire

« de mypage.htm » contient de nombreux liens vers des fichiers/répertoires situés sur le même serveur.

maintenant je veux écrire une fonction qui peut télécharger tous ces fichiers si je fournis

« www.mycustomdomain.com \ mypage.htm » comme entrée.

J'espère que la question est claire.

+1

non, la question est pas claire. Quelle est votre question, exactement? – naivists

+0

Je suppose que vous envisagez seulement HTTP/HTML? Êtes-vous capable d'analyser le HTML? Jetez un oeil à HTML Agility Pack. –

+1

Vous n'avez pas posé de question. Vous venez de poster une "liste de souhaits". – Oded

Répondre

1

Fetch la page Web au format HTML. Google (C# récupère le fichier à partir du Web). Le premier lien vous donnera l'idée.

Ensuite, trouvez les liens avec les expressions régulières. Quelques exemples de modèle regex pour les liens dans www.x.com devrait être aussi (http://www.x.com/. *?) (Mais mieux si vous comprennent également la Une balise dans votre modèle regex)

et télécharger les fichiers comme indiqué dans : http://www.csharp-examples.net/download-files/

1

J'espère avoir compris votre question. Vous avez un fichier HTM avec une liste de liens et ces liens sont des liens vers des fichiers spécifiques sur un serveur distant et vous voulez télécharger tous les fichiers.

Il n'y a pas de façon infaillible de le faire.

Cochez cette question. How do you parse an HTML in vb.net Même si c'est pour VB.net c'est lié à ce que vous avez demandé. Vous pouvez obtenir un tableau de liens, puis commencer à télécharger les fichiers.

Vous pouvez utiliser la méthode Computer.Network.DownloadFile pour télécharger le fichier remot en l'enregistrant sur un de vos emplacements.

Thi est pas un échec méthode prrof parce que si un téléchargement requiert une authentification alors il téléchargera la page HTML [la plupart du temps page de longe]

Questions connexes