Je suis en train de faire un tas de traduction de texte codé html en utf-8 pour le mettre dans ma base de données. Il y a une tonne de caractères qui sont manqués à la fois avec html_entity_decode, ou iconv avec Translit.html_entity_decode caractères comme & Yuml vs & yuml
J'ai écrit une longue liste de caractères à effacer, mais maintenant je vois que & Yuml n'est pas traduit, mais & yuml est.
Je suis sûr qu'il y a d'autres symboles similaires qui manquent également.
Des conseils sur la meilleure façon de gérer ces incohérences? et assurez-vous que chaque caractère est correctement traduit?
merci derobert, J'espérais qu'il y avait un moyen de le faire sans passer par une liste si longue (en espérant que quelque chose existait déjà). On dirait que je vais faire le nettoyage pour cela et je posterai la fonction pour ceux qui en ont besoin à l'avenir. – pedalpete