0
J'ai un fichier txt qui contient de certains url:url transformation de, python
[http://igu.org.ru/ International Geographical Union - Russian National Committee]
[http://www.geografos.org Colegio de Geógrafos - España]
[http://www.geografs.org Col.legi de Geògrafs - Catalunya]
[http://www.geografs.org]
maintenant, je veux transformer ce liens externes de la façon suivante (dans l'ordre fixe):
remplacer "[url any text]
"avec" any text
", où" url
"est une URL (par exemple, commence par" http: // ").
remplacer "[url]
" avec "url
"
import re
def openfile(filename):
with codecs.open(filename, encoding="utf-8") as F:
replace = F.read()
replace = re.sub(r'\[http://.+ ...) # should replace "[url any text]" with "any text"
replace = re.sub(...) # should replace "[url]" with "url"
des suggestions?
comment expliquez-vous \ g <2> et \ g <1>? Et comment l'utiliser dans la fonction re.sub() au niveau du module? – Gusto
Dans la première regex, vous voyez que le premier groupe est dans le hook '()', c'est le '(http [^ \ s] *)' et le second groupe est le texte '(. *)', Donc ce que l'instruction re.sub fait est de remplacer le texte entier ou chaque élément correspondant par le second groupe. – tuantub
utiliser pre_filter = re.sub (r '\ [(http [^ \ s] *) \ s (. *) \]', '\ G <2>', texte) et résultat = re.sub (r '\ [(http [^ \ s] *) \] ',' \ g <1> ', pre_filter) au lieu de re1 et re2 si vous voulez :) – tuantub