J'utilise stanford pos tagger pour marquer le contenu du tweet. j'ai besoin d'extraire des endroits comme « le pont de porte d'or » ou « Tiburon blvd », etc. J'ai quelques règles pour détecter l'emplacement, qui sont:regex pour le texte tag tag pour l'emplacement de l'extrait
1.<NN>+
2.<DT>?<JJ>?<1> ----> <1>:it means the rule number 1
3.<CD>?<2>
4.<2> <CD>?
5.(3|4) <CC | PE> (3|4)
Le signe « + » indique la présence d'une étiquette à au moins un ou plusieurs fois, le signe "?" indique la présence d'une étiquette zéro ou une fois, et le signe "|" indique la présence de l'une des deux étiquettes . et nous avons des noms (NN), des déterminants (DT), des adjectifs (JJ), des nombres cardinaux (CD), des conjonctions (CC), et des fins possessives (PE) de pos tagger.
Un exemple de phrase étiquetée pos: «this/DT renversé/VBN tanker/NN dans/IN marin/NN a/VBZ créé/VBN a/DT énorme/JJ confiture/NN sur/IN wb/NN 580/CD clear/JJ à travers/dans le/DT Richmond/JJ san/NN rafael/NN pont/NN &/CC Four/CD "
peut-on m'aider à créer regex pour chaque règle en java?