2015-12-03 2 views
0

J'ai été chargé de prendre une traduction en chinois du HTML anglais, et de le redessiner pour qu'il corresponde au HTML anglais original. Le "HTML" chinois n'a plus aucun des Divs originaux ou le style du HTML anglais. Le codage de caractères chinois est GB2312.Prenez le contenu HTML chinois et déplacez-le dans le div approprié dans un autre fichier HTML

Je veux créer un programme/script pour automatiser cela car il y a 182 fichiers HTML qui ont besoin de re-style et je ne veux pas le faire à la main. Je suis plus familier avec PHP mais je suis ouvert à tout.

Here is a one of the English HTML files

Here is the equivalent Chinese HTML file

Comme vous pouvez le voir, ils sont très différents. Si ce n'était que quelques fichiers, je copierais simplement les caractères chinois et les collerais dans le DIV correspondant - en remplaçant le texte anglais en même temps. Ensuite, modifiez le codage en GB2312 dans le <head> afin que les caractères chinois s'affichent correctement. par exemple:

<meta charset="gb2312"> 

Ma pensée en ce que la conversion des deux est d'analyser dans le fichier chinois, trouver chaque chaîne indépendante de chinois, Farcir chaque chaîne dans son propre variable, puis analyser dans le fichier équivalent anglais, localisez les chaînes de texte anglais et remplacez-les par les caractères chinois équivalents de la variable. Ajout d'exceptions pour & reg et & copie. Est-ce que quelqu'un sait comment je pourrais commencer à faire cela? Est-ce que la plupart des langages de script supportent même la recherche de caractères non-UTF8?

Répondre

0

Je ne suis pas familier avec PHP, mais seulement avec un C#.

Comme je ne vois pas vraiment l'image (comme la hiérarchie html de tous les fichiers que vous avez et les différences entre les fichiers, s'il y a), je ne peux que vous conseiller ...

Vous pouvez:

  1. Vous pouvez parcourir vos fichiers dans la boucle.
  2. Utilisez une bibliothèque tierce (telle que NTextCat ou Language Detection API) pour les lire, de sorte que vous puissiez facilement prendre ce que vous voulez (texte, attributs, déterminer des modèles) et le stocker temporairement, comme vous le souhaitez.
  3. Utilisez une bibliothèque tierce (par exemple Html Agility Pack) pour déterminer la langue de ce fichier (en fait, cela fait partie de "l'étape 2", car vous ne voulez analyser que les fichiers html avec le chinois).
  4. Deux options:
    1. Rechercher un fichier équivalent en anglais et remplacer les textes (vous pouvez utiliser « l'étape 2 »). Je suppose que vous saurez mieux que nous, comment figurer, quel texte vous devez remplacer par ce que ...
    2. Ou vous pouvez préparer un (des) modèle (s) de style "MVC", et utiliser une bibliothèque tierce (comme RazorEngine) pour modéliser.

Espérons que cela vous aidera. Si vous avez des questions, remplissez gratuitement pour demander :)