2017-07-21 1 views

Répondre

1

Je ne suis pas familier avec un filtre qui vous permet de supprimer des jetons arbitraires (même si cela ne devrait pas être trop difficile à écrire), mais vous pouvez éventuellement contourner ce problème en utilisant un PatternReplaceCharFilter.

Si vous avez un séparateur commun (c'est-à-dire un espace/un espace), vous pouvez supprimer tout ce qui se trouve après le séparateur, ne laissant que le premier jeton présent. Cela ne fonctionnera pas si vous avez besoin de tokenization plus avancé, mais tant que vous l'exprimez comme une expression régulière, vous devriez être OK.

+0

Oh vraiment? Comment pouvez-vous enlever quelque chose après le séparateur? Je suis en train de séparer strictement les espaces blancs. – Sam

+0

Une expression régulière correspondant à tout sauf à un espace et l'utilisant comme clé de remplacement devrait fonctionner; essayez 'pattern =" ([^] +). * "replacement =" $ 1 "' et modifiez jusqu'à ce que vous obteniez le résultat souhaité. – MatsLindh