Je suis en train de gratter le fichier IEEEXplore pour certaines données PDF, une vignette et des liens.Code HTML étrange lors du grattage IEEEXPLORE
donc récemment quand je racler ce site (avec Python module sergé) Je reçois ce contenu similaire:
��7���j��/�5�,X��]����O�s˟�����U|]�l
��c��qLE�[����:yg�u%��_�9e�;�4��^�kt)j�Te���:OX���[��u����B���-]?t�C���m/��ά��Ҋ��n�'��}'�Ù�ف{�S;�ƣ������3�dS��M[m
Alors, pourquoi cela se passe! Je doute de l'encodage de la page.!
le code est grand, mais j'inséré une partie de ceux qui sont ici:
vous pouvez voir le code ici:
https://github.com/power-electro/test-ieeexplore-scraper/blob/master/ieeexplore_ieee_org.py
Ainsi, le PDF gratuit des fichiers de la version ELSEVIER de ce site, est accessible via ce lien:
Quel est le lien et où est votre code? –