J'ai besoin de construire un scanner Web. cette application Web doit analyser n'importe quelle page Web et enregistrer le résultat si certaines données ont été modifiées. il devrait rechercher des mots clés et chercher si leurs valeurs ont été modifiées/changées. je vais créer cette application avec asp.net mvc. Que devrais-je utiliser pour scanner une page Web? si je vais insérer dans ma page toute URL de la page que je vais scanner, que se passe-t-il? sont-ils des robots qui le cherchent si certains contenus changent? s'il vous plaît aidez-moi à comprendre ce dont j'ai besoin pour construire une telle chose.comment construire un scanner web? numériser la page Web si le contenu a été modifié et l'enregistrer
Répondre
Vous pouvez charger le balisage de la page, l'utiliser pour générer une somme de contrôle, puis l'enregistrer pour la comparer à la page du jour suivant.
Vrai, mais que se passe-t-il si certains contenus ("date d'aujourd'hui") changent naturellement? Qu'en est-il des choses comme viewstate que vous ne vous souciez pas? –
D'accord. Ce sont des considérations pour qui que ce soit définit les exigences. Je donne simplement au PO un aperçu d'une solution technique possible. @Ragim vous devez définir ce qui constitue exactement un «changement» et intégrer cette compréhension dans la logique utilisée pour charger une partie ou la totalité du balisage. Certains peuvent vous suggérer d'utiliser RegExp pour analyser le code HTML et l'utiliser pour inclure/exclure des parties non pertinentes de la page, comme les dates dans les en-têtes, etc. Ceci n'est pas recommandé: http://stackoverflow.com/questions/1732348/regex-match -open-tags-except-xhtml-self-contained-tags Bonne chance. – 5arx
- 1. Alerte si la page Web a été mise à jour
- 2. Ouverture de la page Web comme si un lien a été cliqué de la page Web
- 3. Déterminer rapidement si un contenu de dossier a été modifié
- 4. Vérifiez si la page web a été modifiée
- 5. Comment vérifier si ChildControlsCreated a été modifié?
- 6. Comment détecter si l'état de lecture/pause audio HTML5 a été modifié en dehors de la page Web?
- 7. Comment vérifier si un EditText a été modifié ou non?
- 8. Test si JavaScript a été modifié
- 9. Vérifiez si NSTextView a été modifié
- 10. JS comment vérifier si la page Web a été ajoutée en tant que page d'accueil?
- 11. Comment savoir si un formulaire a été modifié
- 12. Détecter comment un select a été modifié
- 13. Déterminez si la page a été actualisée
- 14. Le contenu du panier Wordpress Jigoshop a été modifié
- 15. Comment pouvez-vous voir le nom de fichier d'une page web si elle a été cachée
- 16. Script Bash - détermine si le fichier a été modifié?
- 17. Comment savoir si une page Web a été chargée dans un contrôle WebBrowser
- 18. Wicket: Prévenez si le modèle de page a été modifiée
- 19. javascript - Comment savoir si la page a été chargée correctement
- 20. fichier batch Windows - vérifier si le fichier a été modifié
- 21. Détecter si un objet Java a été modifié?
- 22. Comment vérifier si la page Web a été chargée (sans JS)?
- 23. Comment détecter une page Web a été chargée en java
- 24. Scanner de codes-barres mobile Web dynamique
- 25. Comment déterminer si itérateur de sortie a été modifié
- 26. Comment zoomer le contenu d'une page Web?
- 27. Copiez et collez un autre contenu de la page Web
- 28. construire un robot d'indexation Web
- 29. Vim: Afficher seulement les « fichier a été modifié » avertissement si le contenu est différent
- 30. Vérification si le contenu a été partagé sur Facebook
Changer? Par rapport à quand? Sauvegarder? Jusqu'où? – spender
changez entre hier et aujourd'hui. enregistrer dans une base de données. Je veux dire que dois-je faire pour ça? mettre en œuvre un robot en tant qu'application qui lit une page Web pour une clé donnée donnée par l'utilisateur? –