J'essaie de renvoyer toutes les URL fournies dans un sitemap de sites Web, par exemple Argos. Une fois que j'ai ces URL, j'ai besoin de répéter ce processus pour renvoyer toutes les URL que les URL résultantes peuvent contenir. Par exemple:Renvoyer une URL de sitemap
http://www.argos.co.uk/sitemap.xml retours:
http://www.argos. co.uk/product.xml
http://www.argos. co.uk/product2.xml
http://www.argos. co.uk/catalogue.xml
http://www.argos. co.uk/buyers_guides.xml
http://www.argos. co.uk/features_and_articles.xml
http://www.argos. co.uk/static_pages.xml
http://www.argos. co.uk/store_pages.xml
http://www.argos.co.uk/product.xml contient alors ses propres liens que je require (ce processus est répété jusqu'à ce qu'une page est atteinte ne contenant pas plus d'URL xml disponibles)
Jusqu'à présent:
var urls = require('sitemap-urls'); //package to return xml links from sitemap
var cheerio = require('cheerio');
var request = require('request')
// Returns all xml urls located within page source
request('http://www.argos.co.uk/sitemap.xml', function (error, response, html) {
var sitemap = html;
var results = urls.extractUrls(sitemap);
// If results returned, loop to make sitemap equal each url until array end
if(results) {
for(i = 0; i < results.length; i++) {
sitemap = results[i]
console.log(sitemap)
// Need to repeat url return process for each url returned
}
}
});
Il pourrait y avoir une solution simple que je néglige, toute aide serait très appréciée, merci.
Merci, mais il doit être en JavaScript. Désolé de ne pas être clair – Jordan