1

Je dois mettre en place un service pour rechercher des fichiers PDF. Au début, j'ai commencé à utiliser SQL Server 2008 FTS, mais je me suis vite rendu compte que mes fichiers PDF devaient être stockés dans la base de données elle-même. J'ai ensuite été dirigé vers les services d'indexation ainsi que vers le type de données SQL 2008 FILESTREAM afin que je puisse stocker des fichiers PDF dans le système de fichiers. Alors, comment ces trois (services d'indexation, FTS, et l'option FILESTREAM) se rapportent les uns aux autres? Dois-je utiliser tous les trois ensemble pour mettre en œuvre ma recherche?SQl Server 2008 FILESTREAM, Services d'indexation et FTS

De même, les services d'hébergement tels que DiscountASP ont-ils généralement activé ces services? Ou devrais-je envisager de passer à Lucene.NET?

Répondre

0

Si vous savez à l'avance ce que vous voulez trouver (par exemple, vous obtenez des centaines de fichiers PDF par jour et devrez trouver ceux avec certaines chaînes connues avant que vous puissiez faire une version texte à la réception, créer des entrées d'index pour le fichier PDF, puis jeter le texte

Si vous ne connaissez pas les termes de recherche à l'avance, la vie devient beaucoup plus lente :(Il existe un programme appelé PDF Search qui prétend faire du texte intégral . recherche dans les fichiers PDF Je n'ai pas besoin de l'utiliser, donc je ne peux pas dire comment il est, mais il est ici. http://www.getpdf.com/

Hope this helps

1

Nous avions l'habitude d'utiliser un PDF iFilter qui vous permet de stocker le PDF dans la base de données, puis d'effectuer un FTS contre celui-ci. Cependant, nous convertissons maintenant nos PDF en texte et stockons le texte dans l'index de texte intégral. Cela nous permet de stocker tous nos documents maintenant (nous stockons .doc, .pdf etc) dans le même index.

DiscountASP autorise FTS/iFTS sur la base de données hébergée.

Questions connexes