2010-10-05 4 views
-1

Mon but est de permettre aux personnes moins expérimentées de configurer les paramètres requis pour extraire des informations d'un site Web.WYSIWYG web grattage/crawling configuration en utilisant Javascript/html5?

L'idée est qu'un utilisateur entre une URL, après laquelle cette URL est chargée dans un cadre. L'utilisateur devrait alors être en mesure de sélectionner du texte dans ce cadre, ce qui devrait me donner suffisamment d'informations pour récupérer ces informations lorsque ce texte spécifique change dynamiquement.

La question est, s'il est même possible de détecter quelle partie de la source d'un site externe correspond à la sélection de l'utilisateur dans une trame?

Sinon, existe-t-il des alternatives?

Merci d'avance.

Cordialement, Tom

+1

La réponse courte est non. Si vous ne contrôlez pas le contenu de l'iframe, il n'y a pas grand-chose à faire pour interagir avec. Cependant, vous pouvez créer un bookmarklet qui fait quelque chose comme vous le décrivez, ou un plugin de navigateur. La partie que je ne suis pas complètement en train de suivre est la "qui devrait me donner assez d'informations pour réécrire cette information quand ce texte spécifique change dynamiquement". –

+0

@georgemandis donnez votre avis Une réponse. c'est une réponse complète actualluy. ;) –

+0

@Geogermandis, si je copie la source et fais des liens internes et des sources d'image externes pour l'exécuter dans un cadre que je possède, cela me permettrait de faire ce que je veux? – Tom

Répondre

3

La réponse courte est non. Si vous ne contrôlez pas le contenu de l'iframe, il n'y a pas grand-chose à faire pour interagir avec. Toutefois, vous pouvez créer un bookmarklet qui fait quelque chose comme vous le décrivez, ou un plugin de navigateur.

+0

Je vais poser une question de suivi à une date ultérieure. Merci. – Tom

0

Découvrez les iMacros. Il fournit des addons de navigateur pour IE, Firefox et Chrome pour enregistrer une séquence de navigation Web. Les addons Firefox/Chrome sont open-source/freeware. Vous pouvez ensuite utiliser la « macro » créé par cet enregistreur comme entrée pour votre code de grattage écran (ou même se iMacros rejouer sur votre serveur)

http://www.iopus.com/imacros/firefox/ (gratuite + open source)

http://www.iopus.com/imacros/chrome/ (gratuit + open source)

http://www.iopus.com/download/imacros-ie/ (« seulement » libre)

1

Il y a eu des tentatives de grattoirs à base visuel avant, mais ils deviennent plus rapidement lourde et complexe à apprendre que le code écrit. Avec quelques abstractions (une fonction pour gratter, une fonction pour sélectionner une table par ID et la convertir en un tableau etc) vous pouvez faire quelque chose qui convient encore aux débutants.