2010-02-21 4 views
4

salut Je termine un petit projet de passe-temps pour créer un moteur de recherche à petite échelle. Je me demandais si quelqu'un sait d'un crawler web robuste opensource robuste qu'ils ont utilisé? il devrait être facile pour un noob de configurer et d'utiliser.Aide pour le robot d'indexation Web requise

merci de ne pas googler les robots d'indexation et de coller une liste.

Répondre

2

crawler4j est un crawler assez décent, multithread et facile à configurer et utiliser. C'est écrit en Java.

Vous pouvez trouver une liste de crawlers open-source dans ce wikipedia page.