2013-03-11 2 views
3

Je souhaite utiliser Solr comme moteur de recherche côté client pour le contenu Tridion publié. Cela sera probablement fait en tant que service RESTful déconnecté de l'application principale. Comme nous utiliserons presque certainement la norme DD4T, où tout est publié sur le Broker, je suis particulièrement préoccupé par l'indexation de fichiers binaires tels que des fichiers PDF ou Word - il semble que la base de données puisse être très sollicitée. ?Utilisation de Solr avec 'boilerplate' DD4T

Quelle stratégie est recommandée pour récupérer des binaires et les indexer de cette manière? Il semble que ça va être plus difficile que si nous avions des éléments binaires externes à la DB?

+1

Salut avez-vous rejoint la version bêta privée du site Tridion Stack Exchange? http://tridion.stackexchange.com On dirait que vous avez un compte area51 –

+1

Bonne idée. Je pense que ceci est un autre domaine dans lequel DD4T est utile - vous pouvez facilement mapper vos champs de contenu DD4T au champ Solr XML, et votre Deployer personnalisé, extension de stockage, ou même Event System pourrait pousser le XML vers Solr. – robrtc

Répondre

4

Nous avons pris la décision de publier les binaires au système de fichiers - vous configurez tout cela en cd_storage_conf.xml avec quelque chose comme ceci:

<Publication Id="9" defaultStorageId="defaultdb" cached="true"> 
    <Item typeMapping="Binary" storageId="defaultFile" cached="true"/> 
</Publication> 

Cependant, même si vous choisissez de publier les binaires à la base de données, Cela ne devrait pas avoir d'impact sur votre index Solr qui sera complètement séparé de la base de données du courtier. Vous aurez besoin d'écrire quelque chose de personnalisé (Custom Deployer?) Qui pousse vos données dans votre index Solr, et vous pouvez choisir d'ignorer les binaires pour cela.

+0

Merci Rob, juste pour être clair indexez-vous vos binaires avec un processus séparé? Par exemple, le client dispose d'un grand nombre de fichiers PDF dont il aurait besoin d'indexer. Je suppose que vous pourriez mettre en place une sorte d'observateur de système de fichiers qui peut rechercher des binaires d'un type spécifié et déclencher l'indexeur? – mpaton

+1

@mpaton Oui c'est ce que je dis que vous pourriez faire - je n'ai pas encore fait ça avec DD4T (pour l'instant). Juste baser ma réponse sur ce qui peut être réalisé sans Tridion de toute façon. Il y a quelques articles sur l'indexation des fichiers PDF sur StackOverflow et sur le Web: http://stackoverflow.com/questions/6694327/indexing-pdf-with-solr –