2009-09-24 8 views
0

Je cherche à créer un moteur de recherche de texte intégral pour un de mes projets. Nous avons un Mysql, un Tokyo Tyrant et des fichiers qui doivent être indexés.Sphinx + tokyo Tyrant + mysql

Je regarde Sphinx en ce moment mais je ne peux pas savoir si je peux l'utiliser pour indexer tous les documents.

Je sais qu'il est possible de laisser Sphinx utiliser Mysql mais je cherche un moyen de laisser Sphinx indexer et interroger Tokyo Tyrant ainsi que des documents de fichiers d'index.

Il pourrait être Sphinx ou Xapian ou un autre mais pas JAVA (Lucene est sorti) mais quelque chose qui peut être utilisé avec PHP et fonctionner sur Linux.

Une idée d'un moteur de recherche qui peut accepter plus que Mysql comme source?

Merci

+0

Lucene peut fonctionner sur PHP, Zend ont fait une mise en œuvre. – RageZ

+0

Pour autant que je sache, Zend_Lucene est vraiment lent à indexer. – stunti

+0

Oui, c'est, en indexant le même ensemble de données: Zend_Lucene: 90 secondes, sphinx: 0,8 secondes - oui, son _that_ mauvais. – smoove

Répondre

3

Vous pouvez envoyer des données à partir d'une source à l'aide du sphinx xmlpipe2

il suffira d'avoir à écrire du code (probablement en PHP) pour lire de Tokyo Tyrant (pas sûr de ce qui est vous êtes ainsi de suite votre propre là-bas) et le système de fichiers et le paquet tout comme XML. Ensuite, vous venez de configurer votre source sphinx pour exécuter une commande qui exécute votre code personnalisé et sphinx prend soin du reste.

+0

Exactement ce que je cherchais. Merci – stunti

0

Si vous n'avez pas trop de documents, et que vous voulez utiliser uniquement PHP, vous devriez jeter un oeil à Zend_Search_Lucene:

Zend_Search_Lucene est un moteur de recherche de texte général usage écrit entièrement en PHP 5. Comme il stocke son index sur le système de fichiers et ne nécessite pas un serveur de base de données, il peut ajouter des capacités de recherche à presque n'importe quel site Web PHP-piloté par .

encore, si vous utilisez votre propre serveur, vous pouvez probablement installer le logiciel, ce qui signifie que vous pouvez déployer Lucence/SolR du Sphinx, même si elles ne sont pas écrits en PHP ne-- cela pourrait effectivement être solution plus sûre si vous avez besoin d'indexer beaucoup de contenu.

Questions connexes