2008-11-07 10 views
2

Je construis une application web où j'ai besoin d'obtenir toutes les images et toutes les vidéos flash qui sont intégrées (par exemple youtube) sur une URL donnée. J'utilise Python. J'ai googlé, mais je n'ai pas trouvé de bonnes informations à ce sujet (probablement parce que je ne sais pas à quoi cela s'appelle chercher), est-ce que quelqu'un a une expérience avec ça et sait comment cela peut être fait?Comment numériser une page Web et obtenir des images et des images YouTube?

J'aimerais voir des exemples de code s'il y en a.

Merci!

Répondre

7

BeautifulSoup est une excellente librairie de retouche d'écran. Utilisez urllib2 pour récupérer la page, et BeautifulSoup pour l'analyser séparément. Voici un exemple de code à partir de leurs documents:

import urllib2 
from BeautifulSoup import BeautifulSoup 

page = urllib2.urlopen("http://www.icc-ccs.org/prc/piracyreport.php") 
soup = BeautifulSoup(page) 
for incident in soup('td', width="90%"): 
    where, linebreak, what = incident.contents[:3] 
    print where.strip() 
    print what.strip() 
    print 
+0

Im juste nouveau dans ce, comment exactement l'écran va gratter la page et obtenir l'URL de la vidéo? – Vincent

Questions connexes