J'essaie d'extraire JSON à partir d'une colonne TSV. La difficulté est que le JSON est imbriqué superficiellement et que les valeurs de clé peuvent ne pas être présentes dans chaque ligne.Extrait JSON imbriqué à partir de l'image R sans connaître les clés
J'ai un exemple minimal pour illustrer mon point.
df <- tibble(index = c(1, 2),
data = c('{"json_char":"alpha", "json_list1":["x","y"]}',
'{"json_char":"beta", "json_list1":["x","y","z"], "json_list2":["a","b","c"]}'))
Le résultat souhaité:
df <- tibble::tibble(index = list(1, 2),
json_char = list("alpha", "beta"),
json_list1 = list(list("x","y"), list("x","y","z")),
json_list2 = list(NA, list("a","b","c")))
Après une bonne quantité d'expérimentation, j'ai cette fonction:
extract_json_column <- function(df) {
df %>%
magrittr::use_series(data) %>%
purrr::map(jsonlite::fromJSON) %>%
purrr::map(purrr::simplify) %>%
tibble::enframe() %>%
tidyr::spread("name", "value") %>%
purrr::flatten_dfr()
}
Ce qui me donne l'erreur suivante: Error in bind_rows_(x, .id) : Argument 2 must be length 3, not 7
.
La première ligne définit le nombre de paramètres pour le reste de la trame de données. Y a-t-il un moyen d'éviter ce comportement?