J'essaie de reproduire la configuration qui a été mentionnée dans la récente article sur le produit Vectorflow de Netflix.Comment enregistrer une matrice scipy sparse dans un fichier parquet
Ils utilisent des fichiers parquet dans Hive comme source de données. Je voudrais générer quelques fausses données avec la matrice éparse d'un Scipy. Comment sauvegarder une telle matrice dans un fichier parquet?