ElasticSearch ne fait pas la reconnaissance d'entités nommées. Cependant, vous pouvez utiliser un processeur ingest similaire à celui-ci: https://github.com/spinscale/elasticsearch-ingest-opennlp (bien que vous deviez probablement le modifier pour votre cas d'utilisation exact). Cependant, vous feriez mieux de faire de la reconnaissance d'entité nommée avant d'indexer vos documents. Vous pouvez essayer openNLP ou NLTK, ou s'il s'agit d'un projet non commercial, le NER de Stanford. Je pense que vous voulez ajouter les balises "highlight" vous-même, également avant l'indexation. Je pense à quelque chose comme ceci:
<ne type="person">Johnny</ne> is from <ne type="place">New York</ne>
Vous pouvez utiliser un analyseur personnalisé pour jeter les balises pour l'analyse, ou simplement index deux champs, l'un sans les balises.
Oui, j'ai pensé à cela. Merci pour la suggestion de l'analyseur de jeter les étiquettes. Mon alternative était de créer des tags qui sont peu susceptibles d'être recherchés. – aclokay