Je suis nouveau à Python et à la belle soupe également! J'ai entendu parler de BS. Il est dit d'être un excellent outil pour analyser et extraire le contenu. Donc ici je suis ...:Belle soupe [Python] et l'extraction de texte dans un tableau
Je veux prendre le contenu de la première td d'une table dans un document html . Par exemple, j'ai ce tableau
<table class="bp_ergebnis_tab_info">
<tr>
<td>
This is a sample text
</td>
<td>
This is the second sample text
</td>
</tr>
</table>
Comment puis-je utiliser beautifulsoup prendre le texte « Ceci est un exemple de texte »? J'utilise soup.findAll ('table', attrs = {'class': 'bp_ergebnis_tab_info'}) pour obtenir la table entière. Merci ... ou devrais-je essayer d'obtenir tout ça avec Perl ... que je ne connais pas si bien. Une autre solution serait une regex en PHP.
Voir la cible [1]: http://www.schulministerium.nrw.de/BP/SchuleSuchen?action=799.601437941842&SchulAdresseMapDO=142323
Remarque; puisque le html est un peu invalide - je pense que nous devons faire un peu de nettoyage. Cela peut causer beaucoup de code PHP - puisque nous voulons résoudre le problème en PHP. Perl serait une bonne solution aussi.
Un grand merci pour quelques conseils et idées pour un point de départ zéro
Eh bien, de toute évidence, vous n'avez pas réussi à tirer le meilleur parti de vos questions Perl, donc je ne sais même pas pourquoi cette question est taguée avec Perl. De même, ne créez pas de nouveaux comptes toutes les quelques semaines: créez-en un et respectez-le. @zero sait de quoi je parle. D'autres peuvent jeter un oeil à http: // stackoverflow.com/users/477580/thebutcher et http://stackoverflow.com/q/3991571/100754 et des questions liées à partir de là. –