2009-12-16 6 views

Répondre

2

Ceci est un peu simplifié:

>>> import urllib 
>>> import re 
>>> page = urllib.urlopen("http://google.com").read() 

# => via regular expression 

>>> re.findall("Shopping", page) 
['Shopping'] 

# => via string.find, returns the position ... 
>>> page.find("Shopping") 
2716 

Tout d'abord, obtenir la page (par exemple via urllib.urlopen). Deuxièmement, utilisez un regular expression pour trouver des parties du texte qui vous intéressent. Ou utilisez string.find.

+1

Pas grand-chose en utilisant 're.compile' points si vous n'êtes pas sauver le regexp compilé une variable. 're.findall (" Shopping ", page)' est plus simple. –

0

vous pouvez utiliser urllib2

import urllib2 

webp=urllib2.urlopen("the_page").read() 

webp.find("the_word") 

espoir qui aide: D

0

Comment ouvrir une page Web?

Je pense que le plus simple est convinient:

from urllib2 import urlopen 

page = urlopen('http://www.example.com').read() 

Comment rechercher un mot?

Je suppose que vous allez chercher quelque motif dans la page suivante, donc on y va:

import re 
pattern = re.compile('^some regex$') 
match = pattern.search(page) 
+0

comment copier une réponse? – SilentGhost

+0

@SilentGhost que voulez-vous dire en copiant une réponse? – satoru

Questions connexes