J'ai écrit un script Python très simple pour tester mon idée de diffusion d'étincelles et j'ai l'intention de l'exécuter sur ma machine locale pour gâcher un peu. Voici la ligne de commande:Spark-submit ne parvient pas à localiser le fichier local
spark-submit spark_streaming.py localhost 9999
Mais le terminal m'a jeté une erreur:
Error executing Jupyter command '<the/spark_streaming.py/file/path>': [Errno 2] No such file or directory
Je ne sais pas pourquoi cela se passerait-il, et je suis sûr que le fichier .py existe .
EDIT: il n'y a pas de problème en cours d'exécution avec python
au lieu de spark-submit
Et aussi, les lignes ajoutées dans le fichier .bashrc:
export PATH="/usr/local/spark/bin:$PATH"
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'
export SPARK_LOCAL_IP=localhost
Malheureusement, peu importe comment je configure ces drapeaux et ces arguments, l'erreur reste la même. En parlant de 'Jupyter', je suppose que cela pourrait être dû à certaines variables d'environnement que j'ai définies dans le fichier .bashrc? Et en passant, je n'ai aucun problème à le lancer avec 'python' par opposition à' spark-submit', ce qui est bizarre. lol –
@JamesWong Jupyter ne devrait rien avoir à faire ici. Et d'où vient ce '/ spark_streaming.py/file/path'? Avez-vous configuré 'SPARK_HOME'? – desertnaut
Je n'ai pas défini SPARK_HOME explicitement comme vous pouvez le voir dans la publication mise à jour ci-dessus. Le fichier spark_streaming.py est simplement le fichier situé sur le disque local. –