Bonjour Je souhaite enregistrer le code source d'un site Web dans un fichier à l'aide de Java. Du code source je veux obtenir seulement <script> </script>
contenu de l'étiquette comment puis-je faire cela?Obtenir le contenu d'une balise Javascript
Répondre
Utilisez un analyseur HTML en Java pour extraire du texte à partir du HTML.
Pour étendre la (droite) réponse un peu: voici plusieurs énumérés: http://java-source.net/open-source/html-parsers – BalusC
Une fois que vous avez chargé le code source dans une variable Java, trouvez la position <script>
et la position </script>
dans le fichier et supprimez tout ce qui ne se trouve pas dans cette plage.
Quelque chose comme:
String sourceCode = "source code here"
String startTag = "<script>";
String endTag = "</script>";
int startInt = sourceCode.indexOf(startTag);
int endInt = sourceCode.indexOf(endTag);
Ainsi, la sous-chaîne serait:
String jsCode = sourceCode.substring(startInt,endInt);
(Cela peut être une erreur manifeste, je ne peux pas tester pour le moment, désolé)
Je ne sais pas comment faire cela pouvez-vous s'il vous plaît me diriger vers un tutoriel ou un exemple que j'avais recherché en utilisant Google quelques jours déjà ne peut pas trouver exactement ce que je veux – user236501
Cela ne fonctionnera que s'il y a un seul élément de script dans la page ... – Val
Salut merci, mais mon code source a plusieurs élément de script, une solution pour saisir multi
faire vous voulez dire Java ou JavaScript? Ce sont des technologies complètement différentes ... – Val
Il veut sortir le Javascript d'une page, en utilisant Java. –
Vous avez Javascript dans votre sujet, mais Java dans votre question. Lequel est-ce? Java est à Javascript comme ham est à hamster. –