le vrai problème peut être plus compliqué, mais pour l'instant, j'essaie d'accomplir quelque chose d'un peu plus facile. J'essaye d'enlever l'espace entre 2 caractères chinois/japonais, mais en même temps en maintenant l'espace entre un nombre et un caractère. Un exemple ci-dessous:Python - Comment supprimer les espaces entre les caractères chinois tout en restant les espaces entre un caractère et un nombre?
text = "今天特别 热,但是我买了 3 个西瓜。"
La sortie que je veux est
text = "今天特别热,但是我买了 3 个西瓜。"
j'ai essayé d'utiliser des scripts Python et d'expression régulière:
import re
text = re.sub(r'\s(?=[^A-z0-9])','')
Cependant, le résultat est
text = '今天特别热,但是我买了 3个西瓜。'
Alors je me bats Comment puis-je maintenir l'espace entre un personnage et un nombre à tout moment? Et je ne veux pas utiliser une méthode d'ajout d'un espace entre "3" et "个".
Je vais continuer à y penser, mais laissez-moi savoir si vous avez des idées ... Merci beaucoup d'avance!
Juste pour vous assurer: est-ce Python 3? –
@ WiktorStribiżew yep – Penny
Essayez 're.sub (? <= [^ \ W \ d _]) \ s + (? = [^ \ W \ d_]) ',' ', texte)' si vous devez supprimer 1 + espaces entre les lettres. –