<tr valign="middle" align="center">
<td><b>someNumbers</b></td>
<td width="22" height="22" background="..." class="SomeIntrestingClass">xxxxx</td>
<td width="22" height="22" background="..." class="SomeIntrestingClass">xgdsx</td>
<td width="22" height="22" background="..." class="SomeIntrestingClass">xyzzx</td>
<td width="22"> </td></tr>
Je fais une application qui nécessite des données du site Web. Je dois extraire les valeurs « someNumbers » et les valeurs du td ex: « xyzzx » ...
Le problème que j'ai est « someNumbers j'ai essayé de ne pas avoir une classe afin d'utiliser doc.getElementsByAttributeValue(key, value)
mais l'attribut est le même dans d'autres parties du document. Comment puis-je extraire ces valeurs en utilisant JSoup ou d'autres idées brillantes? Merci pour tout conseil.Raclage du code HTML avec des attributs
Pouvez-vous sélectionner tout le 'td' et obtenir uniquement le contenu du texte? – nhahtdh
Je peux simplement sélectionner l'étiquette td. Mais cela entraînera des résultats de 1k et j'utilise juste 30% de ce que 'someNumbers' sera très difficile à distinguer. Mais mal essayer ça. – wtsang02