2010-08-26 4 views
1

J'ai besoin de convertir le fichier HTML au format iXBRL. Le format iXBRL est essentiellement html avec quelques noeuds incorporés ou certaines informations du fichier html encapsulées sous des tags ixbrl. Pour cela, je vais devoir RECHERCHER et SUPPRIMER des nœuds du fichier HTML et WRAP certains nœuds sous les balises iXBRL.Modification d'un fichier html comme fichier xml

Je ne peux pas utiliser XML DOM car il extrait une exception sur le type de contenu. La classe .net htmldocument ne prend pas en charge la suppression des noeuds et leur remplacement, ni l'option Enregistrer.

J'ai essayé d'utiliser HTML Agility Pack mais il ne trouve pas les nœuds à cause des espaces de noms dans le nom de nœud et il n'a aucune option pour spécifier des espaces de noms (gestionnaire d'espace de noms de ligne dans .net). Puis-je spécifier l'espace de noms dans l'expression XPATH? Comment?

Quelqu'un peut-il m'aider dans l'édition de fichiers HTML (ou XHTML) en utilisant .net ou toute bibliothèque gratuite.

+0

vous devriez poster votre entrée XHTML et la sortie XHTML + iXBRL souhaitée –

Répondre

0

Si vous souhaitez utiliser XPATH avec des espaces de noms, il vous suffit de préfixer les noeuds avec le bon espace de nom.

Si votre Namespace ressemble à ceci:

xmlns:xbrli="http://www.xbrl.org/2003/instance" 

Et vos éléments sont comme ceci:

<root> 
<xbrli:elementname></xbrli:elementname> 
<root> 

Ensuite, vous pouvez les sélectionner dans XPATH comme:

//xbrli:elementname 
+0

Tant que vous enregistrez l'URI de l'espace de noms dans l'XPa le contexte du moteur. –