2009-06-23 5 views
5

J'ai utilisé nutch pendant un certain temps, untile récemment que je connais cet endroit.Performance et le col de la bouteille de Zend_Search_Lucene?

Comment sont ses performances, et quelle est la limite de taille de fichier qu'il peut supporter?

En outre, comment supprimer ou mettre à jour un index au lieu de ré-indexer chaque fois qu'il y a une modification?

Répondre

8

Zend_Search_Lucene est une implémentation PHP pur du format Apache Lucene. Les versions de format d'index Lucene actuellement prises en charge (à partir de ZF 1.6) sont 1.4 - 2.3. Pour plus d'informations sur Lucene, visitez http://lucene.apache.org/java/docs/.

En ce qui concerne les limites de taille d'index, la taille de l'index est limitée à 2 Go pour les plates-formes 32 bits et, autant que je sache, non limitée aux plates-formes 64 bits.

Les performances sont en grande partie basées sur la façon dont vous construisez vos index. Assurez-vous de vérifier la section du manual that deals with performance.

En outre, Luke (un outil de diagnostic pour les index Lucene) est très utile dans l'optimisation des performances et le dépannage.

P.S. En ce qui concerne la mise à jour, le format de fichier d'index Lucene ne prend pas en charge la mise à jour des documents. Les documents doivent être supprimés et ajoutés à nouveau à l'index pour les mettre à jour efficacement. Cela est également vrai pour l'implémentation Java.

+0

Merci pour votre commentaire. Mais nutch peut fusionner des index nouveaux et anciens en un autre, pourquoi Lucene? Nutch ne peut-il pas s'appuyer sur Lucene. BTW, sont les fichiers d'index générés par nutch directement utilisable par Zend_Search_Lucene? – omg

+2

Vous pouvez fusionner des index avec Lucene et Zend_Search_Lucene. Vous pouvez également mettre à jour _indexes_, par exemple, en ajoutant un champ par exemple. MAIS, vous ne pouvez pas mettre à jour un document dans un index. Je pense que vous ne comprenez pas ce qu'est Nutch. Nutch est un moteur de recherche qui utilise Lucene pour ses index et ses recherches. Alors oui, ses index devraient être compatibles. – jason

+0

Wow, alors je pense que je peux faire indexation incrémentale pour Zend_Search_Lucene maintenant.Merci. – omg

Questions connexes