2008-10-03 9 views
5

Je suis actuellement en train d'examiner l'indexation d'un site Web ASP à partir de Sharepoint et j'ai besoin de répliquer l'ancien schéma de "recherche avancée" que les utilisateurs connaissent. Pour ce faire, j'ai besoin d'indexer quelques balises META à partir des pages Web. C'est facile à faire et pour les champs de texte je peux aussi les utiliser dans la recherche. Cependant, pour les méta-tags de date, comme "expiré" ou "publié", j'ai quelques problèmes. Le problème est essentiellement que les balises meta sont explorées en tant que "texte", mais j'ai besoin de Sharepoint pour les analyser en tant que datetime. J'ai vu quelques messages sur TechNet demandant la même chose, mais sans réponse.Date de recherche meta tags dans Sharepoint

1: https://forums.microsoft.com/TechNet/ShowPost.aspx?PostID=2614064&SiteID=17 TechNet

Répondre

3

Vous ne faites rien de mal, c'est ainsi que le produit fonctionne. Pour ajouter à ce qui a été dit plus tôt, ce n'est pas facile à personnaliser.

La méthode appropriée consiste à créer un gestionnaire de protocole personnalisé pour HTML. C'est un objet COM personnalisé qui implémente quelques interfaces. Le SDK MOSS 2007 possède une référence de gestionnaire de protocole. Lorsque nous l'avons fait, nous avons créé un fichier ini afin que nous puissions définir le type de champs META que nous voulions explorer (String, Int, DateTime). Puis, lorsque vous avez ajouté les propriétés personnalisées, tout a été correctement analysé. Ensuite, vous pouvez utiliser les propriétés personnalisées comme vous le feriez normalement.

+0

Vous pouvez également utiliser le filtre HTML IFilter, qui est chargé d'extraire les propriétés et de les envoyer en aval. –

1

Le robot d'exploration Web intégré à la recherche est rudimentaire et vous ne serez pas en mesure de facilement l'étendre pour inclure les balises meta. Apparemment, vous pouvez écrire votre propre gestionnaire de protocole et explorer les pages ASP dans leur propre source de contenu; prétendument cela fonctionne. Je ne pense pas que quiconque écrit réellement leurs propres gestionnaires de protocole bien. Vous allez être déçu de ce que propose le crawler SharePoint, ce qui explique pourquoi il n'y a pas de réponses sur le forum officiel non plus - parce que la vraie réponse est "Ne peut pas le faire facilement, désolé."

Vous pouvez peut-être pirater quelque chose en écrivant un service Web personnalisé (basé sur ASMX ou WCF) qui explore lui-même les balises META des pages ASP. À partir de là, vous pouvez extraire les résultats du service Web dans le contrôleur secondaire de domaine qui est consultable, puis dans les résultats de recherche/données BDC, vous pouvez avoir un lien vers la page d'origine. C'est comme un appareil Rube Goldberg, je sais, mais croyez-moi quand je dis que ce sera plus facile que de trouver comment écrire un gestionnaire de protocole.

+0

En fait, le robot trouve les balises META, comme je l'ai dit dans ma question. Le problème est qu'il supporte la cartographie/conversion des types de valeur. – noocyte