Ce code fait presque ce que je dois à ..Python split() sans enlever le séparateur
for line in all_lines:
s = line.split('>')
Sauf qu'il supprime tous les « > » délimiteurs.
Ainsi,
<html><head>
Se transforme en
['<html','<head']
Y at-il un moyen d'utiliser la méthode split() mais garder le séparateur, au lieu de l'enlever?
Avec ces résultats ..
['<html>','<head>']
Cela ne répond pas vraiment à votre question, mais si vous essayez d'analyser HTML en Python, je recommande fortement [Beautiful Soup] (http://www.crummy.com/software/BeautifulSoup/). –
Voir aussi [En Python, comment séparer une chaîne et conserver les séparateurs?] (Http://stackoverflow.com/questions/2136556/in-python-how-do-i-split-a-string-and- garder les séparateurs). – outis