Selon opennlp.tools.namefind.NameFinderME apidocs:
public Span[] find(String[] tokens, String[][] additionalContext)
Génère balises nom pour la séquence donnée, généralement une phrase, travées jeton retour pour les noms identifiés.
Paramètres:
tokens
- un tableau des jetons ou des mots de la séquence, généralement une phrase.
additionalContext
- caractéristiques qui sont basées sur le contexte à l'extérieur de la phrase mais qui devraient également être utilisées.
Renvoie: un tableau de plages pour chacun des noms identifiés.
Cela dit, considérez vos jetons sont:
String[] tokens = { "lorem", "ipsum", "dolor", "sit", "amet", "adipiscing", "elit" };
Mais vous voulez aussi prendre en compte les caractéristiques suivantes, "qui sont basés sur le contexte extérieur de la phrase, mais qui devrait également être utilisé « :
String[][] additionalContext = {
{ "nullam", "fermentum", "justo", "non", "leo", "rhoncus", "blandit" },
{ "phasellus", "at", "diam", "mattis", "arcu", "congue", "consequat" },
{ "integer", "at", "tincidunt", "turpis", "eget", "pulvinar", "nisl" } };
De cette façon, vous pouvez appeler find(tokens, additionalContext)
.
Notez que, selon le code on GitHub, find(String[] tokens)
est réellement find(tokens, EMPTY)
(et String[][] EMPTY = new String[0][0]
).