Dans quel jeu de caractères de type ASCII 8 bits pour l'anglais est 0x9d
significatif? Je nettoie certains anciens fichiers de données et, à l'occasion, trouve un 0x9d
dans du texte autrement ASCII. (Non, ce n'est pas UTF-8.)Dans quel jeu de caractères 8 bits est 0x9d significatif?
Ce n'est pas valide dans Windows-1252. Le codec Python "latin-1" le convertit en Unicode 0x9D, qui est "Operating System Command". Cela n'a pas de sens. En Unicode, vous obtenez une boîte avec [009d]. (En Python, vous pouvez convertir n'importe quoi en Latin-1 sans élever les erreurs, mais cela ne signifie pas que cela soit significatif.)
Exemples, avec des échappements de type Python, provenant d'une base de données désordonnée que je nettoie up qui combine le texte provenant de nombreuses sources:
Guitar Pro, JamPlay, RedBana\\\'s Audition,\x9d Doppleganger\x99s The Lounge\x9d or Heatwave Interactive\x99s Platinum Life Country,\\"
for example \\"I\\\'ve seen the bull run in Pamplona, Spain\x9d.\\" Everything
Netwise Depot is a \\"One Stop Web Shop\\"\x9d that provides sustainable \\"green\\"\x9d living
are looking for a \\"Do It for Me\\"\x9d solution
Dans le contexte, je suspecterais ™ ou ®. Mais quel est le code 8 bits?
'\ 0x99' est en effet ™ dans Windows-1250 et 1252. –
Peut-être lié. Expérience de la copie de texte d'un fichier PDF https://superuser.com/questions/1146479/converting-non-ascii-characters-to-ascii-characters-using-vi –
Tous les exemples ci-dessus peuvent être trouvés dans la boîte de détails de la société sur Crunchbase. Peut-être spécifique à Crunchbase. –