Je travaille avec un client pour migrer un site Web du matériel de production existant vers un nouvel environnement matériel. Cela semble maintenant être un excellent moment pour effectuer un audit et supprimer tout contenu ancien ou obsolète plutôt que de simplement le copier à nouveau.Outils pour le nettoyage de contenu de site Web?
Y a-t-il des bons outils gratuits ou des scripts que je peux utiliser pour comparer le contenu Web accessible sur un serveur pour les fichiers réels sur un serveur pour voir ce contenu est réellement lié et utilisé?
Merci d'avance pour toute aide!
Le site est très grand, quelque part dans la gamme de 2-3000 pages, plus les images et les fichiers référencés. Ce n'est pas pratique de le faire à la main. Je pourrais écrire un script pour analyser chaque page, extraire les liens et les vérifier jusqu'à la fin, en enregistrant chaque page trouvée. Comparez ensuite avec le système de fichiers, mais cela prendrait beaucoup de temps. Je ne suis pas la première personne à avoir à faire cela, donc je pense qu'il doit y avoir un outil gratuit ou open source qui pourrait aider, je n'en connais tout simplement pas. –