J'essaie de lire le code HTML d'une page qui contient une redirection non retardée. L'extrait suivant (C#) me donnera la page de destination/redirigé, pas celui initial Je dois voir:Comment capturer le HTML de la page de redirection avant qu'elle ne redirige?
using System.Net;
using System.Text;
public class SomeClass {
public static void Main() {
byte[] data = new WebClient().DownloadData("http://SomeUrl.com");
System.Console.WriteLine(Encoding.ASCII.GetString(data));
}
}
Y at-il un moyen d'obtenir le code HTML d'une page de redirection? (Je préfère .NET mais un extrait en Java ou en Python serait bien aussi .. Thx!)
Intéressant. Je suppose que je n'ai vu que des redirections basées sur le script côté client auparavant, je ne connaissais pas le type de serveur. (Web dev n'est pas mon fort. ;-) +1, merci –
Il veut obtenir la source de la page qui fait la redirection, pas celui qui est redirigé vers. – CyberDude
Certains programmeurs moche créent des pages Web qui envoient un en-tête de redirection mais oublient d'arrêter l'exécution, donc si le navigateur et le client http suivront la redirection, il y aura toujours des octets de contenu le long du fil. (Habituellement, un serveur Web produirait du code HTML avec un lien vers la page cible, pour les anciens clients et d'autres choses). – aularon