2017-07-20 2 views
1

Je courais Mesos sur Ubuntu et je tente d'exécuter:Impossible d'exécuter Mesos conteneurs avec des tâches GPU

mesos-execute \ 
--master=$(cat /etc/mesos/zk) \ 
--name=gpu-test \ 
--docker_image=nvidia/cuda \ 
--command="nvidia-smi" \ 
--framework_capabilities="GPU_RESOURCES" \ 
--resources="gpus:1" 

et il échoue parce que: sh: 1: nvidia-smi: not found

même si quand je le lance sans support de récipient

mesos-execute \ 
--master=$(cat /etc/mesos/zk) \ 
--name=gpu-test \ 
--command="nvidia-smi" \ 
--framework_capabilities="GPU_RESOURCES" \ 
--resources="gpus:1" 

il a accès au gpu

plus si je le lance sans support de récipient, mais mettre la commande comme

nvidia-docker run -it nvidia/cuda nvidia-smi

cela fonctionne, il semble donc que les mesos containerizer ne marche pas avoir accès aux processeurs graphiques. Mais dans le répertoire /etc/mesos-slave/ je lui ai donné des conteneurs mesos (et tous les autres drapeaux requis pour exécuter les commandes gpu). Plus les commandes non-gpu fonctionnent bien.

+0

Pouvez-vous exécuter les tests unitaires GPU Mesos ('bin sudo/mesos-tests.sh --gtest_filter = "* NVIDIA_GPU *" ') et signalez les résultats? –

Répondre

1

Cela ressemble à une régression en 1.3.0. J'ai rétrogradé à 1.2.1 sur Ubuntu et peut utiliser à nouveau avec succès les GPU avec les conteneurs Docker et le containeriseur Mesos.

sudo apt-get install mesos=1.2.1-2.0.1 

Il ressemble à quelqu'un a déposé un bug lié, mais il n'y a pas eu d'activité:

https://issues.apache.org/jira/browse/MESOS-7730

+0

merci, ouais j'ai oublié d'éditer ma question. Nous en avons informé l'équipe de Mesos. –