Je voudrais analyser une chaîne pour obtenir une liste comprenant tous les mots (mots coupés, aussi). Code actuel est:Python regex chaîne à la liste des mots (y compris les mots avec des tirets)
s = '-this is. A - sentence;one-word'
re.compile("\W+",re.UNICODE).split(s)
retours:
['', 'this', 'is', 'A', 'sentence', 'one', 'word']
et je voudrais qu'il revienne:
['', 'this', 'is', 'A', 'sentence', 'one-word']
Pourquoi vous voulez avoir le « »? –