2017-04-18 1 views
0

Je sais que la page doit être accessible et ouverte à l'indexation. J'ai quelques pages avec problème d'enregistrement dans les archives web. La plupart d'entre eux ont le protocole https. Par exemple, page https://www.asterra.ru/Impossible d'enregistrer la page dans https://archive.org/web/

Pourquoi obtenir une réponse "Bummer.Cette adresse URL n'est pas disponible sur le Web en direct ou ne peut pas être archivée."?

+0

Je vote pour clore cette question hors-sujet parce que cela n'a rien à voir avec la programmation. – DavidW

Répondre

0

Comme indiqué sur https://archive.org/web/ dans le bloc "Enregistrer la page maintenant":

Uniquement disponible pour les sites qui permettent aux robots d'exploration.

Votre robots.txt bloque le robot d'indexation webarchive afin qu'il ne puisse pas créer d'instantané de votre site.

+0

Que voulez-vous dire? Page https://www.asterra.ru/ n'est pas interdite dans robots.txt – karpo518

+0

Je ne peux pas enregistrer la page https://www.asterra.ru/robots.txt dans les archives web aussi. Il autorise dans robots.txt et ne contient pas de fichiers, qui interdits dans robots.txt – karpo518

+0

Supprimer robots.txt et essayer d'enregistrer la page sans elle sur le site. –