Je crée une application Java qui vérifie si une page Web a été mise à jour.Alerte si la page Web a été mise à jour
Toutefois, certaines pages Web ne comportent pas d'en-tête «Dernière modification».
J'ai même essayé de vérifier une modification de la longueur du contenu, mais cette méthode n'est pas fiable car parfois la longueur du contenu change sans modification de la page Web donnant une fausse alarme.
J'ai vraiment besoin d'aide ici car je ne suis pas capable de penser à une seule méthode infaillible.
Des idées ???
bien ... mais ma longueur de contenu ne cesse de changer de 2-3 caractères. .. qui pourrait changer le hashcode .... aucune idée pourquoi la longueur du contenu change par de si petites quantités ??? – DanMatlin
Je suppose que vous pourriez affiner la "vérification de diff" en ignorant les caractères d'espace ou des trucs comme ça avant d'appliquer l'algorithme de hachage. Essayez quelque chose comme '.trim()' en premier. Je pense qu'il n'y a pas de solution pare-balles pour cela, vous devrez appliquer des heuristiques. –
Le changement de hachage ne fonctionnera pas dans de nombreux cas. – bjedrzejewski