J'ai un script Python qui fait quelque chose le long de la ligne de:façon simple de stocker des données à partir de plusieurs processus
def MyScript(input_filename1, input_filename2):
return val;
dire pour chaque paire d'entrée, je calcule une valeur flottante. Notez que val est un double/float simple.
Étant donné que ce calcul est très intensif, je vais les exécuter sur différents processus (peut-être sur le même ordinateur, peut-être sur plusieurs ordinateurs).
Ce que je faisais auparavant était de sortir cette valeur dans un fichier texte: input1_input2.txt. Ensuite, je vais avoir 1000000 fichiers que je dois réduire en un seul fichier. Ce processus n'est pas très rapide car OS n'aime pas les dossiers qui ont trop de fichiers.
Comment obtenir efficacement toutes ces données dans un seul ordinateur? Peut-être que MongoDB fonctionne sur un ordinateur et que tous les processus envoient les données?
Je veux quelque chose de facile. Je sais que je peux le faire dans MPI mais je pense que c'est trop pour une tâche aussi simple.