Nous utilisons une application de recherche de livre. Il est implémenté par la recherche hibernate.quel analyseur est bon pour ma situation? hibernate search case
entité du livre est défini comme suit:
@Entity
@Indexed
public class Book{
@DocumentId
private Integer UID;
@Field
private String title;
@Field
private String description;
...}
Si un nom de livre de recherche de l'utilisateur, par exemple, des livres avec le titre ou la description contient Microsoft, l'accès ou Microsoft Access 2007, ils entrée 2007 est revenu. C'est ce que nous attendions. Certains des livres sont totalement indépendants en raison du mot-clé 2007. Je cherche une solution pour comprendre l'importance de chaque mot-clé. Dans ce cas, 2007 est moins important dans la recherche. Mais pour cette recherche, il n'y a pas de différence pour Microsoft, l'accès ou 2007.
Le deuxième cas d'utilisateur: Y at-il un bon analyseur qui peut utiliser dans l'indexation et l'interrogation pour prendre en charge plusieurs phrases? Je pensais que l'analyseur par défaut de la recherche d'hibernation ne faisait que scinder les mots de recherche en un seul mot?
Si la recherche des mots est Microsoft Access 2007, les résultats ont meilleur score si elles contiennent « Microsoft Access »,
l'autre exemple de recherche: « ville lac salé », « Etats-Unis », les résultats ne sont pas attendus si seulement assortir le sel, la ville ou le lac ou au moins, ils devraient être derrière les résultats avec "Salt Lake City".
Quelqu'un peut-il me donner quelques indices?
merci!
Emmanuel, ce n'est pas une question de nombre. Je l'ai juste fait comme exemple. Ce que je veux dire, c'est que lorsque certains mots sont moins importants, certains mots sont vraiment importants. Dites "compétences en leadership". Le leadership est plus important que les compétences. Nous pouvons supposer que l'utilisateur recherche quelque chose à propos du leadership, et ensuite des compétences. avec moi? Le livre de compétences en programmation n'apparaîtra donc pas en haut. –
Vous voulez une recherche sémantique. Peut-être qu'un autre produit conviendra mieux à votre facture. Pour moi, l'algorithme de similitude est assez bon dans la plupart des cas pour m'apporter des livres de compétences en leadership au sommet en utilisant l'approche tokenisée habituelle. Au moins assez bon que je n'ai jamais eu à explorer les moteurs de recherche sémantiques. –