2009-12-23 4 views
0

Bonjour Je souhaite enregistrer le code source d'un site Web dans un fichier à l'aide de Java. Du code source je veux obtenir seulement <script> </script> contenu de l'étiquette comment puis-je faire cela?Obtenir le contenu d'une balise Javascript

+0

faire vous voulez dire Java ou JavaScript? Ce sont des technologies complètement différentes ... – Val

+1

Il veut sortir le Javascript d'une page, en utilisant Java. –

+2

Vous avez Javascript dans votre sujet, mais Java dans votre question. Lequel est-ce? Java est à Javascript comme ham est à hamster. –

Répondre

3

Utilisez un analyseur HTML en Java pour extraire du texte à partir du HTML.

+0

Pour étendre la (droite) réponse un peu: voici plusieurs énumérés: http://java-source.net/open-source/html-parsers – BalusC

1

Une fois que vous avez chargé le code source dans une variable Java, trouvez la position <script> et la position </script> dans le fichier et supprimez tout ce qui ne se trouve pas dans cette plage.

Quelque chose comme:

String sourceCode = "source code here" 
String startTag = "<script>"; 
String endTag  = "</script>"; 

    int startInt = sourceCode.indexOf(startTag); 
    int endInt = sourceCode.indexOf(endTag); 

Ainsi, la sous-chaîne serait:

String jsCode = sourceCode.substring(startInt,endInt); 

(Cela peut être une erreur manifeste, je ne peux pas tester pour le moment, désolé)

+0

Je ne sais pas comment faire cela pouvez-vous s'il vous plaît me diriger vers un tutoriel ou un exemple que j'avais recherché en utilisant Google quelques jours déjà ne peut pas trouver exactement ce que je veux – user236501

+0

Cela ne fonctionnera que s'il y a un seul élément de script dans la page ... – Val

+0

Salut merci, mais mon code source a plusieurs élément de script, une solution pour saisir multi