2017-10-11 3 views
0

Je suis ce guide ml-engine. J'ai configuré mon gcloud et créé vm également. Pour tensorflow, j'utilise Anaconda 3 pour créer mon environnement python. J'ai créé un nouvel environnement avec python=3.6. Mais quand je tire cetteErreur lors de l'entraînement tensorflow sur gcloud ml engine

gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.data.csv --eval-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.test.csv --train-steps 1000 --job-dir c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\output --eval-steps 100 

J'obtiens l'erreur suivante

Traceback (most recent call last): 
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 174, in _run_module_as_main 
"__main__", fname, loader, pkg_name) 
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 72, in _run_code 
exec code in run_globals 
File "C:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\trainer\task.py", line 4, in <module> 
import model 
File "trainer\model.py", line 20, in <module> 
import tensorflow as tf 
ImportError: No module named tensorflow 

je pouvais en mesure d'installer tensorflow avec succès pip install -r ../requirements.txt commande selon le guide.

Quelqu'un peut-il souligner, ce que je fais mal?

Répondre

1

Mise à jour: ce problème devrait maintenant être corrigé avec la version la plus récente de gcloud. Pouvez-vous essayer et voir si cela fonctionne pour vous? Tout d'abord faire:
gcloud components update

Ce qui se passe est que gcloud est (en silence) nécessitant py2.7, ce qui est la cause de votre erreur d'importation. C'est un bug que nous allons corriger bientôt. (C'est particulièrement problématique pour Windows, puisque TF ne supporte pas une installation de 2.7 pour Windows). Nous allons mettre à jour ici quand il est réparé. En attendant, la meilleure option est probablement de tester localement en exécutant simplement votre script python directement (sauf si vous essayez de tester l'entraînement distribué localement).

Si vous essayez de tester une formation distribuée localement, alors votre meilleure option temporaire est probablement d'utiliser Docker et le TensorFlow docker container.

+0

Merci @Amy pour l'explication. –