2
J'ai une virgule liste séparée dans une cellule de tableau dans un document HTML, mais certains des éléments dans la liste sont liés:diviser une liste séparée par des virgules avec des liens avec beautifulsoup
<table>
<tr>
<td>Names</td>
<td>Fred, John, Barry, <a href="http://www.example.com/">Roger</a>, James</td>
</tr>
</table>
J'ai utilise belle soupe pour analyser le code html, et je peux obtenir à la table, mais quelle est la meilleure façon de et revenir diviser une structure de données à peu près comme:
[
{'name':'Fred'},
{'name':'John'},
{'name':'Barry'},
{'name':'Roger', 'url':'http://www.example.com/'},
{'name':'James'},
]
+1 belle solution – vikingosegundo
+1 c'est vraiment cool – atv
Belle solution en effet! Une petite note: je remplacerais "type (balise) est BeautifulSoup.NavigableString" par "isinstance (balise, BeautifulSoup.NavigableString)". – taleinat