Solr est une autre option, il est effectivement une façade au-dessus de lucene qui vous fournit une belle API basée sur REST/url. Il y a aussi une bibliothèque .Net disponible pour travailler avec.
http://lucene.apache.org/solr/
http://code.google.com/p/solrnet/
De votre question cependant, vous recherchez le moteur réel sous-jacent ou recherchez-vous quelque chose à ramper aussi/traverse votre contenu construire les index de votre moteur de recherche choisi?
-
Modification de répondre à des commentaires de l'affiche originale.
Vous avez deux moitiés d'une équation à résoudre alors. Le premier est de choisir un moteur de recherche qui répond à l'entrée (mots-clés), puis interroge ses index et redonne ce qu'il croit être des correspondances pertinentes. La seconde moitié de l'équation consiste à trouver un mécanisme pour remplir l'index de recherche du moteur choisi.
En ce qui concerne le moteur, Lucene a été suggéré, et j'ai suggéré une variante de Lucene qui fournit (sans doute) une interface de développeur améliorée.En termes de construction de votre corpus de recherche, c'est un peu différent. Ici, vous pouvez soit choisir d'écrire votre propre logiciel qui prend un morceau de contenu et l'ajoute à l'index. Avantage ici est que vous avez un bon contrôle du grain de ce qui se passe dans le moteur de recherche et quand. L'inconvénient est que vous écrivez un nouveau code - heureusement les moteurs de recherche modernes comme Lucene/Solr le rendent très facile.
Votre deuxième option consiste à utiliser quelque chose pour explorer automatiquement votre contenu et l'ajouter à l'index. Les problèmes ici sont d'identifier et d'apprendre à configurer une option appropriée. Selon votre choix de robots d'exploration, il peut ou non faire un bon travail d'indexation de documents assis sur un système de fichiers (comme dans un site Sharepoint d'entreprise). Nutch est une chenille de l'Apache (les fabricants de Lucene et Solr) qui pourrait potentiellement être utilisée si vous choisissez de ne pas écrire votre propre code. http://wiki.apache.org/nutch/
Nous construisons un site corporatif. Où tout visiteur du site devrait être en mesure de rechercher tout le contenu Web. – user171523