Je tente de soumettre un dask
-DAG sur plusieurs appels du client distributed
, mais je suis incapable de conserver les résultats intermédiaires sur le cluster. Pourriez-vous préciser, comment pourrais-je m'y prendre?Comment est-ce que je persiste à dask-DAGs sur le cluster distribué à travers plusieurs appels et conserver des résultats intermédiaires?
from distributed import Client
c = Client()
dsk0 = {'a': 1, 'b': (lambda x: 2*x, 'a')}
keys0 = ['a', 'b']
futures0 = c._graph_to_futures(dsk0, keys0)
fb = futures0['b']
b = fb.result() # Yields correctly 2
dsk1 = {'c': (lambda x: 3*x, 'a')}
keys1 = ['c']
futures1 = c._graph_to_futures(dsk1, keys1)
fc = futures1['c']
c = fc.result() # Yields 'aaa', instead of 3
Merci d'avance!
Markus