2010-01-15 5 views
0

J'essaie d'extraire un contenu spécifique (liens, texte, images) d'une page HTML. Y at-il un programme que je peux utiliser pour produire une représentation visuelle du modèle DOM de la page? Je sais que je pourrais écrire un tel programme en Java en utilisant un analyseur HTML, mais avant de le faire, j'ai pensé que je verrais s'il existe déjà un tel programme.Obtenir la représentation visuelle d'un DOM HTML

Mon objectif principal est d'extraire certains liens, URL d'images et textes; et envoyez-les à une applet Flex sur la page. Merci, Vance

+0

Un tel programme n'est-il pas appelé "navigateur Web"? Je veux dire, Firebugs dans Firefox ou l'inspecteur de Safari peut vous laisser faire ça. – zneak

Répondre

0

Si vous voulez juste extraire quelques bits d'information (plutôt que d'imprimer la structure entière de la page par exemple), vous pouvez utiliser l'extension FireBug pour Firefox.

Choisissez l'onglet HTML puis cliquez sur la deuxième icône à gauche (ressemble à un curseur pointant sur une case) puis cliquez sur la partie de la page qui vous intéresse pour accéder à cette partie du DOM.

+0

Merci! C'est exactement ce que je voulais! Je pensais que ce type de programme devait exister, mais je ne savais pas comment il s'appellerait. – JavaMan

-1

Je pense que votre meilleur pari serait jQuery et Greasemonkey ... Greasemonkey inséraient le script et jQuery peuvent analyser efficacement le DOM HTML. Notez que c'est peut-être la seule solution FireFox, puisque je pense que GreaseMonkey est un utilitaire FireFox uniquement.

+0

GreaseMonkey est uniquement Friefox ... mais l'OP essayait d'éviter d'écrire son propre logiciel pour cela, et votre solution fournit juste quelques bibliothèques qu'un programme personnalisé pourrait utiliser. – Quentin

+0

Ce n'est pas comme ça que je l'ai pris, étant donné qu'il voulait les envoyer à un autre programme ... Pour moi, cela implique qu'il voulait du code pour pouvoir le faire. Mais je suppose qu'en considérant qu'il a accepté l'extension FireBug (qui est aussi FF seulement) que je me suis trompé. –

Questions connexes