De JavaDoc.
La classe BreakIterator implémente méthodes pour trouver l'emplacement des limites dans le texte. Instances de BreakIterator conserver une position actuelle et de numériser sur le texte retournant l'index des caractères où se produisent les limites . En interne, BreakIterator analyse le texte à l'aide d'un CharacterIterator , et est ainsi capable de numériser du texte détenu par n'importe quel objet implémentant ce protocole. A StringCharacterIterator est utilisé pour objets String d'analyse transmis à setText.
Vous utilisez les méthodes d'usine fournies par cette classe pour créer des instances de différents types d'itérateurs de rupture. En particulier, utilisez getWordIterator, getLineIterator, getSentenceIterator, et getCharacterIterator pour créer BreakIterators qui exécutent mot, ligne, phrase, et l'analyse limite de caractères respectivement. Un seul BreakIterator ne peut fonctionner que sur une unité (mot, ligne, phrase, et donc ). Vous devez utiliser un itérateur différent pour chaque analyse de limite d'unité que vous souhaitez exécuter.
L'analyse des limites de ligne détermine lorsqu'une chaîne de texte peut être rompue lorsque est encapsulé. Le mécanisme correctement gère la ponctuation et les traits d'union .
analyse de frontière de phrase permet sélection d'interprétation correcte de périodes à l'intérieur des nombres et les abréviations , et arrière marques de ponctuation telles que les marques et les parenthèses de cotation .
analyse des limites de mot est utilisé par recherche et remplacer les fonctions, ainsi que dans applications d'édition de texte qui permettent à l'utilisateur de sélectionner des mots avec un double-clic. La sélection de mots fournit une interprétation correcte des signes de ponctuation à l'intérieur et à mots. Les caractères qui ne font pas partie de un mot, tels que des symboles ou des signes de ponctuation , ont des sauts de mot des deux côtés.
analyse des limites de caractères permet aux utilisateurs d'interagir avec des personnages comme qu'ils attendent, par exemple, lorsque déplaçant le curseur à travers une chaîne de texte . L'analyse des limites de caractères fournit une navigation correcte des chaînes de caractères , quel que soit le mode de stockage du caractère . Par exemple, un caractère accentué peut être stocké comme caractère de base et un signe diacritique . Ce que les utilisateurs considèrent comme un caractère peut différer entre langues. Le BreakIterator est destiné à être utilisé avec langues naturelles seulement. N'utilisez pas cette classe pour marquer un langage de programmation .
Voir également [ 'StreamTokenizer'] (http://docs.oracle.com/javase/7/docs/api/java/io/StreamTokenizer.html); c'est [rapide] (http://stackoverflow.com/a/2082174/230513) et s'adapte aux espaces de manière flexible. – trashgod