2017-01-01 1 views
0

J'ai un projet lié au cours PNL, qui est sur le point de classer les dialectes familiers en arabe. J'ai besoin de jeter beaucoup de données de différents domaines pour former le train correctement. J'utilise Python 2.7 sur Windows 10 64 bits avec Eclipse IDE (en utilisant PyDev32), le cadre haut populaire et efficace que j'ai trouvé est Scrapyne peut pas utiliser scrapy bien que toutes les étapes d'installation effectuées correctement

I have followed all installation steps carefully:

when installing with pip install scrapy , it outputs NO error

BUT when I start a project or executing scrapy shell "google.com" , I got the error (the last four lines):

from OpenSSL._util import (
    File "c:\python27\lib\site-packages\OpenSSL\_util.py", line 6, in <module> 
    from cryptography.hazmat.bindings.openssl.binding import Binding 
    File "c:\python27\lib\site-packages\cryptography\hazmat\bindings\openssl\binding.py", line 14, in <module> 
    from cryptography.hazmat.bindings._openssl import ffi, lib 
ImportError: DLL load failed: %1 is not a valid Win32 application. 

une autre erreur:

Could not find function xmlCheckVersion in library libxml2. Is libxml2 installed? 

notes:

  • J'utilise Python de 32 bits parce que je remarqué (après googler) Scrapy ne fonctionne pas sur 64 bits

  • J'ai trouvé de nombreuses solutions sur Stack Overflow, mais en vain, donc je don « t ma question est double

  • J'ai essayé d'activer/désactiver le pare-feu avec aucun avantage

  • J'ai installé les deux versions de OpenSSL (32bit/64bit) et rien fixe

  • Je pensais que le problème est avec lxml mais ce n'est pas lié à cela.

  • Je suis tout à fait débutant, et mon projet devrait être terminé en moins d'une semaine

  • je test en cours d'exécution sur scrapy Anaconda (comme ils ont recommandé), je suis arrivé les mêmes erreurs

Je suis tellement désolé pour ma modeste question, je suis si optimiste obtenu l'aide de personne :)

+0

J'ai aussi eu des problèmes avec l'installation scrapy sous Windows. Je l'ai résolu en utilisant la roue de [Packages binaires Windows non officiels] (http://www.lfd.uci.edu/~gohlke/pythonlibs/). Je ne sais pas si c'est lié à cette erreur spécifique, mais si vous voulez essayer, je recommande d'abord d'installer la molette lxml puis de la scrapy. – MrLeeh

+0

Malheureusement, il ne résout pas mon problème –

+0

Après de nombreuses tentatives d'installation (hors ligne par un site non officiel), j'ai eu la même erreur "Impossible de trouver la fonction xmlCheckVersion dans la bibliothèque libxml2.Libxml2 est-il installé?" –

Répondre

0

Vous êtes probablement des problèmes avec lxml qui est notoirement dépendance difficile à compiler sur les fenêtres systèmes.
La meilleure chose que vous pouvez faire est d'installer un binaire comme mentioned in the official docummentation Vous pouvez télécharger les fichiers binaires non officiels directement from here

+0

J'ai essayé tous les paquets de ce que vous avez mis en avant ... toujours pas résoudre mon problème –

+0

pourquoi ne pas supposer que le problème avec OpenSSL, bien que j'ai installé la configuration binaire terminée (Win32OpenSSL-1_1_0c.exe) –

+0

Une autre suggestion, mr. @ Granitosaurus >> Connaissez-vous un autre outil qui peut scrapper des éléments Web et l'exporter en python? –