La majorité du contenu du site Web de ma société commence sous la forme d'un document Word (encodé sous Windows-1252) et est finalement copié-collé dans notre système de gestion de contenu codé en UTF-8. La conversion s'interrompt généralement sur quelques caractères (caractères spéciaux de rupture, citations intelligentes, notations scientifiques) qui doivent être nettoyés manuellement, mais bien sûr, quelques-uns passent toujours inaperçus.Détection des problèmes de conversion d'encodage
Selon vous, quelle serait la meilleure façon de détecter ces problèmes?
Malheureusement, la formation des utilisateurs finaux n'a pas été très réussie. Copier-coller du mot au bloc-notes, puis le CMS résout tous les problèmes, mais les utilisateurs sont réticents à suivre cette étape fastidieuse. J'essaie de trouver une solution qui peut résoudre ce côté serveur. –
Pouvez-vous installer Word sur le serveur CMS? Si c'est le cas, vous pourriez utiliser COM interop pour convertir le texte en quelque chose que le CMS va gérer. –