Afin d'obtenir tous les liens d'une page Web avec nœud JS à l'aide cheerio, j'utilise ces lignes qui fonctionnent 90% du temps:Obtenir des liens avec le numéro de cheerio - NodeJS
const request = require('request');
const cheerio = require('cheerio');
var url = 'an URL';
request(url, function(err, resp, body){
$ = cheerio.load(body);
links = $('a');
$(links).each(function(i, link){
console.log($(link).text());
});
});
Mais pour certains sites, il ne fonctionne pas correctement, par exemple: http://www.sylire.com/ http://www.bernieshoot.fr/
Et je ne peux pas le comprendre. Est-ce que quelqu'un pouvait me donner des conseils pour résoudre ce problème?
Notez que je peux normaly obtenir tous les liens pour ces sites Web dans la console de navigateur en utilisant:
var link = document.querySelectorAll("a");
for (var i of link){
console.log(i.text);
}
Cordialement,
Merci beaucoup pour vous répondre, il fonctionne parfaitement maintenant :-) – Blq56