J'ai le fichier html. Je dois remplacer tout le texte entre ceci: [% anytext%]. Si je comprends bien, c'est très facile à faire avec BeautifulSoup pour analyser hmtl. Mais quelle est l'expression régulière et comment supprimer & écrire des données de texte?Analyse du fichier texte en python
Ok, voici le fichier exemple:
<html>
[t1] [t2] ... [tood] ... [sadsada]
Sample text [i8]
[d9]
</html>
script Python doit travailler avec toutes les chaînes et remplacer [%] -> une autre chaîne, par exemple:
<html>
* * ... * ... *
Sample text *
*
</html>
Ce que je l'ai fait:
import re
import codecs
fullData = ''
for line in codecs.open(u'test.txt', encoding='utf-8'):
line = re.sub("\[.*?\]", '*', line)
fullData += line
print fullData
Ce code fait exactement ce que j'ai décrit dans l'échantillon. Merci a tous.
Il serait plus facile si vous nous montriez un exemple avec une entrée et une sortie attendue, du code Python simple que vous avez essayé. –