J'essaie d'apprendre Regex et je teste mes modèles dans la coque.Regex correspondant dans IDLE, mais pas dans mon programme pour Python?
re.findall(r'\n\t\t\t\t\t(.*)\n\t\t\t\t\t\n\t\t\t\t\t</a>', str(x), re.MULTILINE)
Le code est couru contre: http://pastebin.com/yaCXPG3W
imprimer le motif dans la coquille et la sortie est correcte. Cependant, dans mon programme, la liste est vide.
J'ai essayé d'ajouter deux barres obliques sur les onglets et les retours à la ligne .. \\ t mais je n'ai toujours rien.
Vous pouvez modifier l'expression régulière pour éviter des informations en double. 'Re.findall (r \ n \ t \ t \ t \ t \ t (*) \ n \ t \ t \ t \ t \ t \ t \ t \ t \ t \ t \ t \ t ', str (x), re.MULTILINE) 'est la même chose que' re.findall (r' \ n \ t {5} (. *) \ n \ t {5} n \ t {5} ', str (x), re.MULTILINE) ' –
N'apprends pas regex avec HTML! Et n'essayez pas d'analyser HTML avec regex, vous allez tuer beaucoup de minous. Vérifiez http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
super, merci pour le conseil. Malheureusement toujours pas de correspondance. –