2010-08-17 6 views
1

J'ai besoin d'analyser une liste de signets exportés à partir d'un navigateur comme Chrome, Firefox et IE. Peut-être même google etcParse exporté fichier de signets avec ColdFusion

J'ai joué et fait quelque chose comme cette boucle reMatchNoCase("(<h3)(.*?)(</dl>)",myfile1). Ensuite, j'utilise reMatchNoCase("(<dt[>])(.*?)(</a>)",i) dans les balises h3/dl , puis beaucoup de nettoyage, mais ce n'est vraiment pas fiable. Le fait est qu'ils ont des catégories en utilisant h3 étiquettes entourées par dl étiquettes, puis les signets dans cela. Je ne peux pas juste analyser toutes les URL puisque je veux obtenir les catégories comme dans le navigateur.

Merci.

Répondre

3

si elle est XHTML, utilisez XPath

si ce n'est pas, il ne serait pas facile. Recherche https://stackoverflow.com/search?q=parse+html

pouvez-vous envisager d'utiliser une approche hybride, analyser avec jQuery sur le côté client d'abord et post à CF?

+0

FF3 n'enregistre pas XHTML valide. Ressemble à un sous-ensemble de HTML 3 ou à peu près. Étiqueté en interne un fichier "Netscape Navigator". –

+0

peut-être que cela aide? http://java.sun.com/products/jfc/tsc/articles/bookmarks/Bookmarks.java – Henry