2009-06-08 4 views
2

Je souhaite que mon site SharePoint permette à un utilisateur de rechercher du contenu dans une collection connue de flux RSS. Je figure sur le plan conceptuel quelques façons de le faireRecherche par points d'accès de flux RSS externes

  • rampent les aliments à leur source (Aïe!)
  • Tirez les articles complets dans mon site sharepoint, puis laisser mon crawl crawler il
  • Marque utilisation d'un index existant (comme Google)
  • recherche les articles complets, sur demande, en utilisant quelque chose comme un utilitaire Google (ma préférence)

Alors puis-je en quelque sorte, à partir de mon site sharepoint, permettre à un utilisateur de rechercher la pleine articles d'un deux douzaines, nommé, flux RSS

grâce

Cary

Répondre

1

Je ne vois pas pourquoi il y a un problème avec l'exploration des flux à la source? Cela semblerait raisonnable.

Il est assez facile de créer une source de contenu pour pointer sur le flux et sélectionner le calendrier d'indexation correct. Si cela ne fonctionne pas, vous pouvez essayer une approche plus compliquée. Sachez que copier le contenu d'un autre site Web pour héberger vous-même pourrait avoir des implications sur le droit d'auteur (ne pas mentionner le risque que tout contenu inflammatoire semble être publié sur votre propre site).

--update--

Essayez de lire les sites cibles robots.txt pour voir si (elle a même un) il a une fréquence souhaitée. Sinon, cela dépend de la profondeur du site que vous explorerez.

Si vous explorez uniquement le flux RSS xml, je suppose que vous pouvez le faire toutes les heures sans ennuyer personne. Sinon, si vous atteignez chaque article, vous voudrez peut-être limiter cela. Cela dépend beaucoup de toute relation que vous avez avec le site cible et le type de site que vous frappez.

Commander this article pour un peu plus d'informations sur la façon dont SharePoint traite avec robots.txt

(ps le site cible n'a pas mis les articles sur le web afin que personne ne les lirait)

+0

Merci Nat, en ce qui concerne l'analyse des flux - Je pensais à l'impact sur les performances du site cible. De toute évidence, les principaux moteurs de recherche le font, mais mon site n'est pas un moteur de recherche majeur. Ce type de comportement est-il mal vu? Je ne pensais pas sérieusement à télécharger du contenu, même si mon client l'avait suggéré. mais vous soulevez d'autres bonnes raisons de ne pas - alors merci. –

+0

À quelle fréquence pensiez-vous à ramper? – Nat

+0

Merci encore Nat. J'ai vu votre montage la semaine dernière, mais je n'ai pas vu cette question jusqu'à maintenant. explorer des sites externes une fois par jour serait plus que suffisant. –

0

sur la le robot d'exploration respectera robots.txt et il existe des dispositions pour les règles d'impact sur le robot qui réduiront les chances que SharePoint effectue un ralentissement sur le site externe.