2010-02-21 6 views
6

Je suis en train de créer un site Web corporatif. Nous recherchons tout moteur de recherche open source ou payant basé sur ASP.NET. Il devrait pouvoirASP.NET Moteur de recherche

  1. Rechercher le contenu Web de toutes les pages du site.
  2. Tous les documents de bureau.
  3. Si nous avons un certain filtrage des résultats de recherche basé sur le type d'utilisateur et styff.

Faites-moi savoir quel type d'outils ou de logiciels nous devrons prendre en compte.

Répondre

7

Essayez Lucene.NET

Apache Lucene est une haute performance, recherche texte complet moteur bibliothèque entièrement écrit en Java. Il est une technologie appropriée pour presque toute application qui nécessite recherche de texte intégral, en particulier multiplateforme.

Lucene.Net est un code source, classe par classe, API-per-API et le port algorithmatic du moteur de recherche Lucene Java à C# et plate-forme .NET utilisant Microsoft .NET Framework .

Voici quelques liens de tutoriels pour vous aider à démarrer:

2

Solr est une autre option, il est effectivement une façade au-dessus de lucene qui vous fournit une belle API basée sur REST/url. Il y a aussi une bibliothèque .Net disponible pour travailler avec.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

De votre question cependant, vous recherchez le moteur réel sous-jacent ou recherchez-vous quelque chose à ramper aussi/traverse votre contenu construire les index de votre moteur de recherche choisi?

-

Modification de répondre à des commentaires de l'affiche originale.

Vous avez deux moitiés d'une équation à résoudre alors. Le premier est de choisir un moteur de recherche qui répond à l'entrée (mots-clés), puis interroge ses index et redonne ce qu'il croit être des correspondances pertinentes. La seconde moitié de l'équation consiste à trouver un mécanisme pour remplir l'index de recherche du moteur choisi.

En ce qui concerne le moteur, Lucene a été suggéré, et j'ai suggéré une variante de Lucene qui fournit (sans doute) une interface de développeur améliorée.En termes de construction de votre corpus de recherche, c'est un peu différent. Ici, vous pouvez soit choisir d'écrire votre propre logiciel qui prend un morceau de contenu et l'ajoute à l'index. Avantage ici est que vous avez un bon contrôle du grain de ce qui se passe dans le moteur de recherche et quand. L'inconvénient est que vous écrivez un nouveau code - heureusement les moteurs de recherche modernes comme Lucene/Solr le rendent très facile.

Votre deuxième option consiste à utiliser quelque chose pour explorer automatiquement votre contenu et l'ajouter à l'index. Les problèmes ici sont d'identifier et d'apprendre à configurer une option appropriée. Selon votre choix de robots d'exploration, il peut ou non faire un bon travail d'indexation de documents assis sur un système de fichiers (comme dans un site Sharepoint d'entreprise). Nutch est une chenille de l'Apache (les fabricants de Lucene et Solr) qui pourrait potentiellement être utilisée si vous choisissez de ne pas écrire votre propre code. http://wiki.apache.org/nutch/

+0

Nous construisons un site corporatif. Où tout visiteur du site devrait être en mesure de rechercher tout le contenu Web. – user171523