2017-10-13 10 views
1

Pour le moment, j'essaie de trouver des noms dans un document. Im en utilisant la méthode suivante pour trouver les noms:Méthode findNLP d'OpenNLP

find(String[] tokens)

Je trouve aussi cette méthode ci-dessous:

find(String[] tokens,String[][] additionalContext) 

Que puis-je faire avec cette méthode et comment puis-je utiliser?

Répondre

2

Selon opennlp.tools.namefind.NameFinderME apidocs:

public Span[] find(String[] tokens, String[][] additionalContext) 

Génère balises nom pour la séquence donnée, généralement une phrase, travées jeton retour pour les noms identifiés.

Paramètres:

  • tokens - un tableau des jetons ou des mots de la séquence, généralement une phrase.
  • additionalContext - caractéristiques qui sont basées sur le contexte à l'extérieur de la phrase mais qui devraient également être utilisées.

Renvoie: un tableau de plages pour chacun des noms identifiés.

Cela dit, considérez vos jetons sont:

String[] tokens = { "lorem", "ipsum", "dolor", "sit", "amet", "adipiscing", "elit" }; 

Mais vous voulez aussi prendre en compte les caractéristiques suivantes, "qui sont basés sur le contexte extérieur de la phrase, mais qui devrait également être utilisé « :

String[][] additionalContext = { 
    { "nullam", "fermentum", "justo", "non", "leo", "rhoncus", "blandit" }, 
    { "phasellus", "at", "diam", "mattis", "arcu", "congue", "consequat" }, 
    { "integer", "at", "tincidunt", "turpis", "eget", "pulvinar", "nisl" } }; 

De cette façon, vous pouvez appeler find(tokens, additionalContext).

Notez que, selon le code on GitHub, find(String[] tokens) est réellement find(tokens, EMPTY) (et String[][] EMPTY = new String[0][0]).