J'ai deux listes de textes dont j'aimerais extraire certaines informations.rechercher et extraire une chaîne à partir d'une longue liste avec un motif répété
La première ligne (premiers termes) ressemble
line = "{"af":"16.63","al":"11.58",..."
Je voudrais extraire uniquement les lettres entre « » dans une liste, si possible. par exemple. ["af","al"...]
.
La deuxième ligne est très longue et contient une séquence qui ressemble à
line = "...,"name":"Papua New Guinea"},..."
Je veux juste la chaîne après "name":"<country>"
être dans une autre liste si possible. par exemple. [...,"Papua New Guinea",...]
. Le même modèle apparaît encore et encore "name":"<country>"}
, je voudrais juste les pays.
Ces deux peuvent être redirigés vers deux listes dans des fichiers différents en utilisant SED. Je dois juste me débarrasser de tous les "fluff" environnants.
J'ai essayé une combinaison de regex mais cela ne fonctionne pas. Je ne peux pas obtenir la syntaxe correcte. Merci d'avance.
Votre 'chaîne est invalide coût média; vous ne pouvez pas incorporer '" 'dans une chaîne délimitée par' "'; pas non cité, au moins. –
Je suspecte fortement que vous ayez des données JSON; utilisez le module 'json' pour le transformer en structures Python. –
Oui, ce sont des données JSON. Je vais y regarder Martijn. Merci. – Griff