2016-01-13 1 views
-1

En ce moment nous avons une application ASP.Net avec la recherche basée sur Lucene.Net 3.0.3. Et nous allons mettre en œuvre un service de recherche pour travailler avec des articles> 2,5 mln et avoir des questions similaires, quel moteur de recherche sera le plus rapide dans cette situation. Comme nous le savons Lucene.Net est basé sur les principes classiques de Java Lucene et idéalement, il devrait avoir presque la même vitesse. Mais nous avons constaté que Lucene.Net 3.0.3 moteur a des problèmes avec la vitesse de la recherche floue. Nous avons trouvé une explication pourquoi la performance est mauvaise avec la recherche floue dans Lucene (sur nos données chaque demande prend 6-8 secondes): Solr/Lucene fuzzy search too slowChoisissez le moteur de recherche le plus rapide avec l'option floue

également nos problèmes de vitesse à l'aide Lucene.Net 3.0.3 sont décrits here

nous avons donc une liste de questions pour la communauté Lucene et tous fait l'expérience pro:

  • -t-il est logique de passer de .Net à Java?
  • Voyez-vous d'autres alternatives pour travailler avec une telle quantité de données?
  • Avez-vous une telle expérience et pouvez-vous partager quelques chiffres selon la recherche floue Lucene? (nous avons eu 4-8 sec par demande de recherche à 2.5 mln index, voir le lien ci-dessus pour plus de détails)
  • Avez-vous de l'expérience avec FlexLucene? Est-ce mieux que Lucene.Net?

Merci.

Répondre

0

Je vous suggère de passer à une version plus récente de Lucene, car les performances de Fuzzy Search ont été considérablement améliorées (en utilisant des machines à états finis).

+0

Votre conseil a beaucoup de sens, par où se déplacer? Lucene.Net 4.8 n'est pas encore publié, FlexLucene est nouveau et faiblement documenté ( – SSoro

+0

Si Lucene (Java) est une option, il est probablement préférable de migrer vers celui-ci car vous ne voulez pas créer une nouvelle dépendance de la migration –

+0

Merci , J'ai fait un test avec des éléments 1mln et 30 champs: Custom outil .Net basé sur Lucene 5.4 est plus rapide que Lucene 3.0.1 de 2-5 fois pour le texte intégral et la recherche de carte générique à 10-100 fois pour la recherche floue en fonction sur la complexité des demandes. – SSoro