Bonne communauté chère après-midi,informations en utilisant XPath
J'ai finalement compilé une liste de XPath de travail requis pour gratter toutes les informations à partir des URL que j'ai besoin.
Je voudrais vous demander votre suggestion, pour un débutant dans le codage quelle est la meilleure façon de gratter autour de 50k liens en utilisant seulement XPaths (environ 100 xpaths pour chaque lien)? Importer.io est mon meilleur outil en ce moment, ou même des outils de référencement pour Excel, mais ils ont tous deux leurs propres limites. Importer io est cher, les outils de référencement pour Excel n'est pas adapté pour extraire plus de 1000 liens. Je suis prêt à apprendre le système suggéré, mais s'il vous plaît suggérer un bon moyen de racler pour mon projet!
#RÉSOLU! SEO Tools crawler est vraiment super utile et je crois que j'ai trouvé ce dont j'ai besoin. Je suppose que je vais suspendre Python ou Java jusqu'à ce que je rencontre un autre obstacle difficile. Merci à tous!
Possible copie de [Comment utiliser Xpath en Python?] (Http://stackoverflow.com/questions/8692/how-to-use-xpath-in-python) – n1c9