Compte tenu de l'entrée: ""XMLParser les revendications Pharo U + 00A0 est "UTF-8 non valide"
<?xml version='1.0' encoding='UTF-8' standalone='yes' ?>
<sms body=". what" />
Lorsque le caractère après le dans l'attribut body de l'étiquette de sms est U+00A0;
Je reçois l'erreur:
XMLEncodingException: Invalid UTF-8 character encoding (line 2) (column 13)
IIUC, la représentation UTF-8 de ce caractère est 0xC2 0xA0
per Wikipedia. Effectivement, les octets 72 et 73 de l'entrée sont respectivement 194 et 160.
Cela ressemble à un bug dans XMLParser, ou est-ce que quelque chose me manque?
peut ne pas reproduire: parse 'de XMLDOMParser: '? Xml version =' '1.0' » encoding = '' UTF-8 '' autonome = '' oui ''?>