J'essaye de gratter une page qui est modifiée par javascript après le chargement initial en utilisant Scrapy sur Raspberri Pi.sites Scrapy et Javascript sur Rasbperry Pi
J'ai essayé d'installer docker et scrapinghub/splash pour rendre la page avant de la transformer en scrapy, mais Splash réalisé ne supporte pas encore ARM. Y at-il d'autres options pour gratter les pages en utilisant javascript avec Scrapy sur un Raspberry Pi?
Actuellement, en utilisant la demande normale de scrapy sur le site, je reçois uniquement ce code HTML, car le site se charge d'abord, puis le javascript rend tout le contenu. Donc, avant le javascript la source de la page semble vide:
<body class="notie8 notie9 lang-{{html.lang}}">
<!--<![endif]-->
<div loading-line></div>
<div page-layout>
<div ng-view></div>
</div>
</body>
</html>
Pour référence, le site que je me réfère est: https://www.sreality.cz/hledani/prodej/byty?region=brno
Vous pouvez essayer d'utiliser l'approche abordée ici https://github.com/voliveirajr/seleniumcrawler/blob/master/seleniumcrawler/spiders/seleniumcrawler_spider.py. Utilisez le navigateur PhantomJS sur votre rasbperry pi. –