Nous essayons de télécharger la source des pages Web, mais nous ne pouvons pas voir certains caractères spécifiques, comme ü, ö, ş, ç- proprement en raison de l'encodage des caractères. Nous avons essayé le code suivant pour convertir le codage de la chaîne (variable « texte »):Conversion de l'encodage de caractères HTML en Java
byte[] xyz = text.getBytes();
text = new String(xyz,"windows-1254");
Nous avons observé que si le codage est utf-8, nous ne pouvons toujours pas voir les pages correctement. Que devrions nous faire?
vous devez montrer le code qui lit réellement les données, y compris e La déclaration du flux d'entrée et/ou du lecteur que vous utilisez. En outre, quelques exemples d'entrée (ou un lien vers la page que vous essayez de lire). –