2015-10-02 1 views

Répondre

0

Spark montre l'état de mise en cache.
Il est disponible via l'interface utilisateur de l'application Spark sur l'onglet "Storage".
Il montrera le niveau de stockage (type de cache), le nombre de partitions en cache, la taille en mémoire & taille sur le disque.

Vous n'avez pas spécifié comment vous utilisez le mécanisme de mise en cache Spark.
La mise en cache Spark doit être explicitement activée.
Vous pouvez vérifier here comment activer/désactiver la mise en cache des tables Spark

Vous pouvez également activer le cache pour RDD/DataFrams utilisant:

rdd.cache()/df.cache() 
rdd.persist(StorageLevel newLevel)/df.persist(StorageLevel newLevel)