J'ai beaucoup de dicts python avec un schéma connu. Par exemple, le schéma est défini comme pyspark StructType comme ceci:Comment sérialiser efficacement un dict python avec un schéma connu en binaire?
from pyspark.sql.types import *
dict_schema = StructType([
StructField("upload_time", TimestampType(), True),
StructField("name", StringType(), True),
StructField("value", StringType(), True),
])
Je veux sérialisation efficacement chaque objet dict dans un tableau d'octets. Quelle méthode de sérialisation me donnera la plus petite charge utile? Je ne veux pas utiliser pickle parce que la charge utile est très grande (son schéma incorporé dans chaque objet sérialisé).
Merci,