parse html dans l'air d'adobe

2010-01-10 11 views 2 likes

L'objectif principal étant d'extraire le titre, les balises META et les liens. J'ai essayé le HTMLLoader mais j'obtiens toutes sortes d'erreurs, principalement des exceptions javascript uncaught.parse html dans l'air d'adobe

J'ai également essayé de charger le contenu html directement (en utilisant URLLoader) et de pousser le texte dans HTMLLoader (en utilisant loadString (...)) mais j'ai eu la même erreur. Le dernier recours consistait à essayer de charger le texte dans xml, puis à utiliser des requêtes E4X ou xpath, sans aucune chance car le html n'est pas bien formé.

Mes questions sont les suivantes:

Y at-il simple et fiable (air/script d'action) composant DOM là (je ne ai pas besoin pour afficher la page et le mode sans tête ferai)?
Existe-t-il une bibliothèque pour convertir (corrompre) html en xml bien formé ainsi je peux employer xpath/E4X
D'autres suggestions sur comment faire ceci?

thx

Source

2010-01-10 Meir

Répondre

ActionScript est censé être un surensemble de JavaScript, et heureusement, il y a ...

Pure JavaScript/ActionScript HTML Parser

créé par le gourou Javascript et créateur John jQuery Resig :-)

Une approche consiste à exécuter le code HTML via HTMLtoXML() puis utilisez E4X comme vous le souhaitez :)

Source

2011-08-04 13:40:51

AFAIK:

Pas :-(
Pas :-(
Je pense que la meilleure façon de saisir le titre et les balises meta est en train d'écrire des expressions régulières. Vous pouvez charger le code HTML de la page dans une chaîne et ensuite lire ce que vous avez besoin comme ceci:

var str: String = ""; // placer le code HTML ici

var pattern:RegExp = /<title>(.+)<\/title>/i; 

trace(pattern.exec(str));

Source

2010-01-19 14:44:12 Thomas

Questions connexes

1. Parse Document HTML?
2. Parse HTML Offline
3. PHP Parse code HTML
4. Parse html belle soupe
5. php - parse html page
6. Parse html avec ajax JSON dans
7. parse html chaîne avec jquery
8. Excel 2008 Cant Parse HTML
9. C# parse html using XPathDocument
10. parse onclick liens en html
11. Parse un Résultat Valeur en HTML
12. jQuery: Parse/HTML sans Manipulez scripts d'exécution
13. Parse Html réponse en-têtes iPhone
14. parse chaîne html partielle avec jquery
15. Parse complète page html avec jquery
16. flash caroussel xml Parse lien html
17. parse html code pour trouver un champ
18. Parse HTML doc avec HtmlAgilityPack-Xpath, RegExp
19. Parse HTML "style" attribut en utilisant Java
20. Parse JSON dans jquery
21. Parse Date dans Bash
22. Parse formules dans .NET
23. Parse JSON dans TSQL
24. Parse date dans MySQL
25. Parse error dans Haskell
26. Parse JSON dans jquery
27. Parse xml dans powershell
28. Parse js/format de chaîne html les bien
29. parse javascript objet retourné par ajax comme html
30. parse utf code dans vbscript