<p align="JUSTIFY"><a href="#abcd"> Mr A </a></p>
<p align="JUSTIFY">I </p>
<p align="JUSTIFY"> have a question </p>
<p align="JUSTIFY"> </p>
<p align="JUSTIFY"><a href="#mnop"> Mr B </a></p>
<p align="JUSTIFY">The </p>
<p align="JUSTIFY">answer is</p>
<p align="JUSTIFY">not there</p>
<p align="JUSTIFY"> </p>
<p align="JUSTIFY"><a href="wxyz"> Mr C </a></p>
<p align="JUSTIFY">Please</p>
<p align="JUSTIFY">Help</p>
Je veux itérer l'extraction des données à l'aide de
.comment extraire toutes les données entre
- La première itération doit afficher J'ai une question
- deuxième itération devrait afficher La réponse est pas là
- Les noms de personnes doivent également être extraits dans une autre liste ..pour exemple [ M. A ', « M. B », « Mr C »]
Si quelqu'un a une idée de le faire, il pourrait être utile parce que je suis en train d'apprendre python est resté coincé avec ce code problème.Le j'ai essayé est
for t in soup.findAll('p',text = re.compile(' '), attrs = {'align' : 'JUSTIFY'}):
print t
for item in t.parent.next_siblings:
if isinstance(item, Tag):
if 'p' in item.attrs and 'align' in item.attrs['p']:
break
print item
Il retourne [] qui est pas ce que veulent
Bienvenue dans Stack Overflow! On dirait que vous voulez que nous écrivions du code pour vous. Tandis que de nombreux utilisateurs sont prêts à produire du code pour un codeur en détresse, ils aident généralement seulement lorsque l'affiche a déjà essayé de résoudre le problème par eux-mêmes. Une bonne façon de démontrer cet effort est d'inclure le code que vous avez écrit jusqu'à présent, exemple d'entrée (s'il y en a), la sortie attendue, et la sortie que vous obtenez réellement (sortie de la console, traces de pile, erreurs du compilateur en vigueur). Plus vous fournissez de détails, plus vous aurez de chances de recevoir des réponses. –
Je ne considérerais pas l'analyse de HTML comme un choix particulièrement judicieux pour «apprendre Python» - quels concepts connaissez-vous déjà, quelles approches avez-vous déjà essayées, quelles idées avez-vous développées jusqu'à présent? –
@MartijnPieters Merci pour vos conseils. Le code que j'ai essayé est d'abord trouver tout '& nbsp' mais il retourne [] print soup.findAll ('p', text = re.compile (' '), attrs = {'align': 'JUSTIFIER'}) – user2657822