2010-01-14 3 views
1

J'ai besoin d'un outil que je peux pointer vers un site Web basé sur Flash, le parcourir et vérifier le contenu sur des pages données.Naviguer et extraire le contenu de l'application Web flash

Je ne pense pas que je peux le faire avec du sélénium, car je ne peux pas cibler les éléments dans l'application flash via xpaths.

Est-ce que quelqu'un d'autre a des idées?

Répondre

1

Il y a deux façons de procéder. Si les données que vous recherchez se trouvent dans le swf, vous devrez télécharger le swf et extraire les données à l'aide d'un décompilateur.

Si les données sont externes, vous pouvez utiliser Firebug pour voir les appels et essayer de les désosser.

2

En ce qui concerne TimScollick's answer, le contenu est rarement situé à l'intérieur d'un fichier SWF. Les fichiers SWF sont généralement remplis d'ActionScript. Vous ne vous attendez pas à trouver une liste de numéros de téléphone dans un fichier JavaScript. Firebug peut travailler pour identifier le contenu spécifique que vous recherchez, mais le fait de le remplacer par un proxy comme Charles Proxy ou le proxy intégré du scraper d'écran pourrait fonctionner mieux.

En ce qui concerne la navigation sur le site, vous devrez peut-être configurer votre grattoir de sorte qu'il fasse des demandes spécifiques afin d'obtenir certaines valeurs que vous devrez ensuite utiliser dans les demandes suivantes. Encore une fois, le fait de passer par le site ne révélera pas seulement le contenu que vous recherchez, mais il vous montrera également quelles données sont nécessaires pour effectuer les demandes appropriées et quelles données doivent être incluses dans ces demandes.

L'utilisation de fichiers SWF peut ressembler à une boîte noire, mais vous pouvez essayer de décompiler les différents fichiers SWF à l'aide de showmycode.com ou du Trillix Flash Decompiler d'Elitma. Gardez à l'esprit qu'ActionScript est principalement composé de JavaScript. Si nécessaire, il est possible de supprimer l'AS existant dans un analyseur JavaScript afin de répliquer le comportement qui se produit dans l'un des fichiers SWF. l'écran-racleur a cette capacité intégrée. Si vous traitez avec un site où l'interaction entre le client (film Flash) et le serveur est facilitée par AMF, alors Charles est un excellent choix puisqu'il dispose d'un désérialiseur AMF intégré (chose rare) .

Questions connexes