actuellement j'ai une araignée écrite en Java qui se connecte dans un site Web de fournisseur et des araignées le site Web. (En utilisant HtmlUnit)Comment faire pour spider un site protégé par mot de passe en python?
Il maintient la session (cookies) et permet même me activer/désactiver javascript etc.
J'utilise aussi HTMLParser (java) pour aider à analyser le code html et d'extraire les informations pertinentes.
Est-ce que python a quelque chose de similaire à faire?
très cool, je suis vraiment excité par toutes les choses python! – Blankman
Ce qui est _really_ cool, c'est que ce sera environ un millionième de la quantité de code Java que vous deviez écrire;) – Stephen
en effet, c'est exactement ce que je voulais dire. – Blankman