0

Est-il possible de détecter si un caractère ascii appartient à un jeu de caractères asiatiques double octet ou cyrillique? Peut-être des gammes de codes spécifiques? J'ai googlé, mais je ne trouve rien à première vue.Dectect codes ASCII pour les jeux de caractères asiatiques double octet/cyrillique?

Il y a un flux RSS dans lequel les paramètres régionaux sont définis comme 'en-gb'. Mais il y a des caractères asiatiques à deux octets dans le flux lui-même - que je dois gérer différemment. Ne sais pas comment le détecter car les données de méta locale sont incorrectes. Je n'ai pas accès à corriger le flux public.

+2

Le codage ASCII ne supporte pas ces caractères, vous pourriez vouloir UTF-8. – Kitsune

+0

Bien, merci. En fin de compte, j'ai une chaîne et j'ai besoin de déterminer si elle contient des caractères non-EN. Une détection basée sur JS ou ActionScript3 est ce dont j'ai besoin, mais je prendrai n'importe quel extrait de code à ce stade. – jfroom

Répondre

0

Si votre flux rss utilise utf-8, il n'a probablement - il suffit de regarder cette valeur de caractère est supérieur à 255.

0

Un rapide Google suggère que vous voudrez peut-être regarder String.charCodeAt

Je ne Je connais le code ActionScript, mais je m'attendrais à ce qu'un extrait de code ressemble à

var stringToTest : String; 

for each (var i : Number = 0; i < stringToTest.length; i++) { 
    if (stringToTest.charCodeAt(i) > 255) { 
     // Do something to your double-byte character here 
    } else { 
     // You have a plain ASCII character here 
    } 
} 

J'espère que cela aide!

Questions connexes