2009-07-07 6 views
2

Je travaille avec un client pour migrer un site Web du matériel de production existant vers un nouvel environnement matériel. Cela semble maintenant être un excellent moment pour effectuer un audit et supprimer tout contenu ancien ou obsolète plutôt que de simplement le copier à nouveau.Outils pour le nettoyage de contenu de site Web?

Y a-t-il des bons outils gratuits ou des scripts que je peux utiliser pour comparer le contenu Web accessible sur un serveur pour les fichiers réels sur un serveur pour voir ce contenu est réellement lié et utilisé?

Merci d'avance pour toute aide!

Répondre

0

Je suis sûr qu'il est mais je suis sûr qu'il n'y a pas un qui pourrait faire un meilleur travail que vous pourriez vous-même, tu sais? Quelle est la taille de ce site et l'avez-vous codé vous-même?

+0

Le site est très grand, quelque part dans la gamme de 2-3000 pages, plus les images et les fichiers référencés. Ce n'est pas pratique de le faire à la main. Je pourrais écrire un script pour analyser chaque page, extraire les liens et les vérifier jusqu'à la fin, en enregistrant chaque page trouvée. Comparez ensuite avec le système de fichiers, mais cela prendrait beaucoup de temps. Je ne suis pas la première personne à avoir à faire cela, donc je pense qu'il doit y avoir un outil gratuit ou open source qui pourrait aider, je n'en connais tout simplement pas. –

2

Eh bien, pour commencer, vous pouvez utiliser un outil comme Xenu's Link Sleuth à l'araignée toutes vos pages pour trouver des liens cassés et autres. Nous avons utilisé cet outil sur notre intranet pour trouver et réparer nos liens brisés. C'est gratuit et fait le travail.

Un autre outil que nous avons utilisé pour les migrations entre systèmes est un moteur de recherche. Un bon moteur de recherche spider toutes vos pages et montrer la relation bidirectionnelle entre les liens. Cela peut vous aider à trouver quel contenu est le plus lié et ce qui est peut-être orphelin. Malheureusement, ces types des outils ne sont pas libres.

Questions connexes