Je luttais la mémoire de fil (physique + virtuel) pour comprendre comment fonctionne la gestion de la mémoire avec Spark sur fil:Spark sur l'utilisation
Mon spark-submit
a
--executor-memory 48g
--num-executors 2
Quand je lance top -p <pids_of_2_yarn_containers/executors>
VIRT RES %MEM
51.059g 0.015t ~4 (container 1)
51.039g 0.012t ~3 (container 2)
La mémoire totale du système est de 380g.
Et enfin, sur le fil quand je clique sur chacun des conteneurs page je peux voir:
Resource: 54272 Memory (container 1)
Resource: 54272 Memory (container 2)
Pourquoi chacune des mesures ci-dessus ne correspond pas? Je demande 48g sur chaque exécuteur d'étincelle, cependant YARN montre 54g, OS rapporte 15gb de mémoire physique utilisée (colonne RES en haut) et 51g de mémoire virtuelle utilisée (colonne VIRT).