J'essaye de charger un très grand fichier JSON en Python. J'ai essayé:Chargement d'un fichier JSON extrêmement volumineux sans connaître le schéma?
import json
data = open('file.json').read()
loaded = json.loads(data)
mais cela me donne une erreur SIGKILL.
J'ai essayé:
import pandas as pd
df = pd.read_json('file.json')
et je reçois un hors-mémoire erreur.
Je voudrais essayer d'utiliser ijson
pour diffuser mes données et seulement tirer un sous-ensemble à la fois. Cependant, vous devez connaître le schéma du fichier JSON afin de connaître les événements à rechercher. Je ne connais pas vraiment le schéma de mon fichier JSON. Donc, j'ai deux questions:
est-il un moyen de charger ou diffuser un grand fichier JSON en Python sans connaître le schéma? Ou un moyen de convertir un fichier JSON dans un autre format (ou dans un serveur postgresql, par exemple)?
Existe-t-il un outil pour cracher le schéma de mon fichier JSON?
MISE À JOUR:
occasion head file.json
pour avoir une idée de ce que mon fichier JSON ressemble. De là, c'est un peu plus facile.
pouvez-vous poster un échantillon de votre fichier json? –