2009-01-19 8 views
0

J'utilise google docs, et certains modèles que nous utilisons ont été créés avec MS-Office.
Le HTML résultant est gros et moche, et la limite de 500 Ko par doc sur google rend un nettoyage obligatoire. J'ai été capable de trouver des attributs "style" redondants et de les déplacer vers une classe CSS, et de renommer les noms de classes les plus redondants en noms plus courts, ce qui me permet d'économiser environ 50% de la taille d'origine.
Etes-vous conscient de certains outils/scripts/lib qui pourraient faire ce travail pénible pour moi, ou au moins m'aider à écrire cet outil magique?Outils pour réduire la taille HTML générée

Merci d'avance!

EDIT: J'ai donné un essai à la fois bien rangé, et demoronizer "rewrite manuel":
- Entrée: 140Kb
- Tidy'ed: 110Kb
- Demoronized: 135Kb

Ma réponse préférée sera être "réécrire!"

Merci!

Répondre

3

MS-Office rend le HTML foireux, point. Vous êtes mieux de passer du temps à reconstruire le code HTML à partir du texte original que d'essayer de traverser ce champ de mines.

J'ai fait quelques macros qui font des fonctions de recherche/remplacement sur Word pour faire des choses de base comme envelopper des balises <p> autour des paragraphes et des trucs comme ça, puis re-baliser le tout à partir de zéro.

3

Vous pouvez essayer tidy il va nettoyer beaucoup de choses.

0

Sans se prononcer sur son nom, je pourrais citer demoronizer, que l'auteur décrit comme:

... un programme Perl disponible pour le téléchargement sur ce site qui corrige de nombreuses erreurs et les incompatibilités en HTML générées par, ou édité avec, applications Microsoft.

YMMV.

0

L'un de mes utilitaires préférés est maintenant Windows Live Writer - il supprime les détritus des fichiers doc Word. Certains pourraient être en désaccord mais je l'utilise assez souvent!

Questions connexes