2009-10-15 4 views
0

J'ai besoin d'ajouter un tas de documents Word à un wiki, mais je veux nettoyer le HTML résultant donc idéalement j'ai des étiquettes de texte et d'image ... Quelqu'un veut relever un défi? : o)Dénuder le document Word pour le formatage mais pas les images?

Ce n'est pas grave si la solution consiste à utiliser un éditeur de texte et à faire de la "gymnastique" dessus.

Répondre

2

Il existe des outils qui effectuent une grande partie de ce nettoyage pour vous, comme here ou here et Dreamweaver inclut également un tel outil.

Je ne sais pas ce que ces outils font avec les images si ... Si vous choisissez un itinéraire plus de bricolage, this peut vous aider je pense.

+0

L'outil Textism semble fonctionner (le premier supprime les tags d'image), mais il est payant lorsque la taille du fichier est supérieure à 20 Ko. Le JavaScript peut également être utile: o) – noesgard

1

Je voudrais copier le texte hors de Word et le coller dans le Bloc-notes, puis entrer manuellement mes images dans le document Wiki.

+0

Cette solution n'est pas valide. Avec des centaines de documents chargés de photos - les insertions manuelles sont un non. Il est possible de faire du textediting avancé ou peut-être une application en utilisant par ex. VSTO, en parcourant les documents en les sauvegardant en html filtré et en corrigeant les liens de l'image pour s'adapter à la structure du fichier wiki ... – noesgard

1

Salut, j'ai travaillé un peu avec Open XML.

Vous pouvez simplement parcourir le document Word en vérifiant chaque paragraphe et convertir chaque élément en literalcontrols. Ou vous pouvez également utiliser LINQ pour filtrer des jeux de nœuds spécifiques. Vous pouvez également traiter votre fichier Word comme un ensemble de nœuds XML et naviguer avec XPath, LINQ to XML, DOM. Essayez simplement de télécharger le jeu d'outils Open XML avec SDK et commencez à chercher dans vos documents.

Questions connexes