-1
Je suis en train de construire a distribute tensorflow framwork template, mais il y a des problèmes serval me confus.plusieurs modèles en cours d'exécution sur un pas de train tensorflow distribués messd
- quand je
--sync_replas=True
dans le script, ça veut dire que j'utiliseSynchronous training
comme dans doc? - pourquoi l'étape mondiale dans worker_0.log et worker_1.log n'est pas incrémenter successivement?
- pourquoi l'étape globale ne pas commencer par 0, mais comme celui-ci
1499169072.773628: Worker 0: training step 1 done (global step: 339)
quelle est la relation entre
training step
etglobal step
?Comme vous pouvez le voir sur le create cluster script, j'ai créé un cluster indépendant. Puis-je exécuter plusieurs modèles différents sur ce cluster en même temps?