Je dois analyser le contenu obtenu sur le Web et contenir des caractères spéciaux. Dans ce cas, la chaîne de contenu apparaît comme ce qui suit:Problème de codage
<?xml version="1.0" encoding="UTF-8"?>
<products>
<product>
<id>1</id>
<price>2.14</price>
<title>test ž test</title>
Lorsque le Contet ci-dessus est transmis aux caractères de la méthode(), dans la classe qui est prolongée de org.xml.sax.helpers.DefaultHandler:
public class ProductsXMLHandler extends DefaultHandler {
...
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
String elementValue = new String(ch, start, length);
...
}
Je remarqué le tableau test ž test
est divisé en trois tableaux: « test », « ž
» et « test » de sorte que le valeurElément ne correspond pas test ž test
qui devrait être le résultat. Est-ce que quelqu'un sait comment résoudre le problème?
Est-il nécessaire de recoder la chaîne source:
<?xml version="1.0" encoding="UTF-8"?>
<products>
<product>
<id>1</id>
<price>2.14</price>
<title>test ž test</title>
avant qu'il ne soit transmis à la classe de gestionnaire XML?
Merci!