J'ai les noms de tous les employés de mon entreprise (5000+). Je veux écrire un moteur qui peut trouver à la volée des noms dans des articles en ligne (blogs/wikis/documents d'aide) et les taguer avec le tag "mailto" avec l'email de l'utilisateur.Marquage des noms en utilisant lucene/java
A partir de maintenant, je prévois de supprimer tous les mots d'arrêt de l'article, puis de rechercher chaque mot dans un index lucene. Mais même dans ce cas, je vois beaucoup de requêtes qui touchent les index, par exemple s'il y a un article avec 2000 mots et seulement deux références aux noms de personnes, alors probablement il y aura 1000 requêtes lucene.
Existe-t-il un moyen de réduire ces requêtes? Ou un tout autre moyen de parvenir à la même chose? Merci d'avance
Je ne suis pas certaine de suivre, la liste des employés n'est-elle pas prédéfinie? ces noms ne sont-ils pas vos requêtes? – amit
@amit liste des employés est 5000, demandez-vous si je devrais rechercher chaque nom dans l'article? 5000 requêtes dans un document de 2000 mots? Je me demandais autre chose. – Sap
vous avez un seul document? si vous le faites, lucene ne vous aidera pas beaucoup .. – amit