2009-12-01 5 views
1

J'ai quelques fichiers de code source qui me sont venus par une sortie HTML, donc ils sont assez inutilisables.Y at-il quelque chose pour convertir les caractères spéciaux HTML dans les fichiers en caractères normaux?

J'ai des choses comme ceci:

%include "macros.mac" 

qui devrait être:

%include "macros.mac" 

Y at-il un script (sh, perl, lot, ...) pour convertir tous les fichiers (il y a environ 200) aux caractères appropriés? Les personnages comprennent & lt;, & gt;, ... (je mets un espace au milieu pour qu'il les convertir à l'habitude < et>.

Merci, il est très apprécié.

Répondre

2

S'il est à peu près les quatre personnages &"<>, sed(1) pourraient aider:

sed 's/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g; s/&amp;/\&/g' 

Mise à jour: Ma proposition initiale était la suivante et avait un bug:

sed 's/&amp;/\&/g; s/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g' 

Ce serait convertir "& amp; gt;" dans ">" qui est faux.

+0

Merci, j'ai créé un script pour échanger ces caractères (ceux que j'ai vus à travers quelques fichiers). J'espère qu'il n'y a plus de personnages comme ça. –

+0

Existe-t-il un outil ou une librairie pour gérer tous les caractères spéciaux (liste dans specialcharacters.info)? – Xiao

0

vous pouvez essayer un outil comme les fenêtres grep ou TextCrawler pour cette

Questions connexes