Vous ne pouvez pas obtenir une liste de répertoires sur un site Web. Pédantiquement, HTTP n'a aucune notion de répertoire. Pratiquement, WebDAV fournit un verbe de liste de répertoires. Vous pouvez donc l'utiliser si WebDAV est activé. Sinon, la chose la plus proche que vous pouvez faire est similaire à ce que fait wget récursif: obtenir une page, analyser le HTML, rechercher des liens hypertexte (a/@href
dans xpath), filtrer les liens hypertexte qui ne pointent pas vers URL sous la page courante , recurse dans les urls restants.
Vous pouvez effectuer un filtrage supplémentaire, en fonction de votre cas d'utilisation, tel que la suppression de la partie requête de l'URL (tout ce qui suit le premier ?
). Lorsque le serveur dispose d'une fonctionnalité de liste de répertoires activée, cela vous permet d'utiliser quelque chose d'utile. Cela vous donne également quelque chose d'utilisable si le site n'a pas de liste de répertoires mais est organisé de manière sensée.
Pas correct, si vous avez des autorisations de liste, vous pouvez certainement obtenir une liste de répertoires avec IIS ou Apache. Ça sert tout de suite. –