Je veux extraire des données de la table HTML en utilisant le script Python et l'enregistrer en tant que variables (que je pourrai utiliser ultérieurement dans le même script après les avoir chargées) dans un fichier séparé. Aussi, je veux que le script ignore la première ligne de la table (Composant, Statut, Temps/Erreur). Je préférerais ne pas utiliser de bibliothèques externes.Extraire des données de la table HTML en utilisant Python
La sortie dans un nouveau fichier doit être comme ceci:
SAVE_DOCUMENT_STATUS = "OK"
SAVE_DOCUMENT_TIME = "0.408"
GET_DOCUMENT_STATUS = "OK"
GET_DOCUMENT_TIME = "0.361"
...
Et voici l'entrée au script:
<table border=1>
<tr>
<td><b>Component</b></td>
<td><b>Status</b></td>
<td><b>Time/Error</b></td>
</tr>
<tr><td>SAVE_DOCUMENT</td><td>OK</td><td>0.408 s</td></tr>
<tr><td>GET_DOCUMENT</td><td>OK</td><td>0.361 s</td></tr>
<tr><td>DVK_SEND</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>DVK_RECEIVE</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>GET_USER_INFO</td><td>OK</td><td>0.135 s</td></tr>
<tr><td>NOTIFICATIONS</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>ERROR_LOG</td><td>OK</td><td>0.001 s</td></tr>
<tr><td>SUMMARY_STATUS</td><td>OK</td><td>0.913 s</td></tr>
</table>
J'ai essayé de le faire en bash, mais étant donné que je dois comparez les variables * _TIME au temps maximum, puis elle échoue, car ce sont des nombres flottants.
"Encore une chose, je ne veux pas utiliser des bibliothèques externes". Epic Fail Vous devez vraiment utiliser Beautiful Soup. C'est le meilleur pour ce genre de chose. –
Ok, s'il n'y a pas d'autre moyen de sortir, je vais utiliser Beautiful Soup alors :) – Marko
"de HTML" est synonyme de Beautiful Soup. – SingleNegationElimination