2011-03-09 4 views

Répondre

2

Nous utilisons Swish-e pour indexer notre site Web qui comprend des milliers de fichiers PDF, Word et même des fichiers WordPerfect. Cela fonctionne très bien. C'est gratuit, open source et s'intègre bien avec PHP.

http://swish-e.org/index.html

De leur page d'accueil:

Swish-e est un rapide, flexible et sans système open source pour l'indexation collections de pages Web ou d'autres fichiers . Swish-e est idéalement adapté pour collections d'un million de documents ou plus petit. En utilisant l'analyseur GNOME ™ libxml2 et un ensemble de filtres, Swish-e peut indexer du texte brut, du courrier électronique, PDF, HTML, XML, Microsoft® Word/PowerPoint/Excel et à peu près tout fichier pouvant être converti en XML ou texte HTML. Swish-e est aussi souvent utilisé pour compléter les bases de données comme le SGBD MySQL® pour la recherche rapide en texte intégral .

Questions connexes