Je travaille sur des pages d'exploration pour plus d'informations, et j'ai rencontré de nombreux problèmes avec l'analyse des pages dans Groovy. J'ai fait demi-solution qui fonctionne la plupart du temps à l'aide chardet juniversal et la numérisation seulement la page pour la balise dans la tête, mais parfois deux de ces balises se trouvent sur une page, par exemple:Deux balises charset sur une page, que prendre?
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
...
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
Est il existe une norme sur laquelle utiliser (premier, dernier, les deux ..?) ou un moyen plus facile de le faire? Merci.