Recentrly J'ai trouvé méthode très utile dans la bibliothèque StringUtils qui estSuppression des accents de chaîne
StringUtils.stripAccents(String s)
je l'ai trouvé vraiment utile avec la suppression de caractères spéciaux et de le convertir en quelque ASCII « équivalent », pour instace s = c
Maintenant, je travaille pour un client allemand qui a vraiment besoin de faire une telle chose, mais seulement pour les caractères non-allemands. Tous les trémas devraient rester intacts. J'ai réalisé que strinAccents ne serait pas utile dans ce cas.
Est-ce que quelqu'un a de l'expérience dans ce domaine? Existe-t-il des outils/bibliothèques/classes utiles ou des expressions régulières? J'ai essayé d'écrire une classe qui est l'analyse et de remplacer ces caractères, mais il peut être très difficile de construire cette carte pour toutes les langues ...
Toutes les suggestions appriciated ...
Il semble avoir la fonctionnalité pour détecter la langue utilisée. Pouvez-vous clarifier comment cela va vous aider? – eis
Vous pouvez avoir la chaîne brute en tant qu'entrée, mettre la détection de la langue en allemand et ensuite détecter les caractères allemands et rejeter le reste –