2017-10-20 15 views
0

Je suis nouveau à AWS. J'essaie d'utiliser batch pour analyser un tas de fichiers. Si j'ai une image docker qui installe mon programme d'analyse, quelle est la manière recommandée d'utiliser E/S avec un travail par lots?Amazon lot - fichier d'entrée à partir de s3

  1. Existe-t-il un moyen d'accéder aux fichiers S3 avec des programmes génériques?

    /bin/cd-hit -i <s3bucket/input> -o <s3bucket/output.txt>

  2. Ou gens utilisent amazon système de fichiers élastique, monter le volume dans la définition de l'emploi, puis accédez à des fichiers de cette façon?

Répondre

1
  1. Est-il possible d'accéder aux fichiers S3 avec des programmes génériques?

Oui il y a.

  1. Ou gens utilisent amazon système de fichiers élastique, monter le volume dans la définition de l'emploi, puis accédez à des fichiers de cette façon?

Cela aussi possible, même si elle est beaucoup mieux de penser à S3 comme un magasin de valeur clé et écrire un code multi-thread qui accède à S3 de cette façon.

+1

En outre, EFS est beaucoup plus cher. –

+0

Oui, mais en utilisant s3cmd, le fichier doit toujours être stocké quelque part pour l'entrée dans un programme. Donc vous devez le copier quelque part. Les gens utilisent-ils simplement un volume générique, copient-ils le fichier d'entrée, puis écrivent la sortie sur s3 avec s3cmd? – jwillis0720

+0

@ jwillis0720 yes copiez-le en général dans un lieu temporaire – Istvan