Je souhaite copier le fichier test.tar.gz de S3 vers HDFS. Cela peut être fait par distcp ou s3distcp. Mais mon exigence est quand je transfère des fichiers à HDFS, il devrait être extrait à la volée et dans HDFS je devrais avoir seulement les fichiers extraits pas tar.gz.Copier et extraire des fichiers de s3 vers HDFS
Toutes les suggestions s'il vous plaît.
C'est une bonne option. Mais je ne devrais utiliser aucun système de fichiers local pour placer le fichier tar.gz. C'est comme le fichier tar.gz dans S3 et la structure du répertoire extrait avec des fichiers seulement, dans HDFS. – Ilango
oui et n'est pas non plus modifiable – mtariq