J'ai été chargé de prendre une traduction en chinois du HTML anglais, et de le redessiner pour qu'il corresponde au HTML anglais original. Le "HTML" chinois n'a plus aucun des Divs originaux ou le style du HTML anglais. Le codage de caractères chinois est GB2312.Prenez le contenu HTML chinois et déplacez-le dans le div approprié dans un autre fichier HTML
Je veux créer un programme/script pour automatiser cela car il y a 182 fichiers HTML qui ont besoin de re-style et je ne veux pas le faire à la main. Je suis plus familier avec PHP mais je suis ouvert à tout.
Here is a one of the English HTML files
Here is the equivalent Chinese HTML file
Comme vous pouvez le voir, ils sont très différents. Si ce n'était que quelques fichiers, je copierais simplement les caractères chinois et les collerais dans le DIV correspondant - en remplaçant le texte anglais en même temps. Ensuite, modifiez le codage en GB2312 dans le <head>
afin que les caractères chinois s'affichent correctement. par exemple:
<meta charset="gb2312">
Ma pensée en ce que la conversion des deux est d'analyser dans le fichier chinois, trouver chaque chaîne indépendante de chinois, Farcir chaque chaîne dans son propre variable, puis analyser dans le fichier équivalent anglais, localisez les chaînes de texte anglais et remplacez-les par les caractères chinois équivalents de la variable. Ajout d'exceptions pour & reg et & copie. Est-ce que quelqu'un sait comment je pourrais commencer à faire cela? Est-ce que la plupart des langages de script supportent même la recherche de caractères non-UTF8?