2017-08-22 1 views
0

J'ai un dossier source qui a un grand nombre de petits fichiers. Je veux emballer tous les fichiers dans un seul fichier ou conteneur dans Hadoop Encryption Zone.Fichier archive Hadoop ne pas supprimer les fichiers source

hadoop archive -archiveName test.har -p /user/source /user/outputdir 

La commande ci-dessus crée un fichier .har dans outputdir. Mais les fichiers dans le dossier source sont toujours présents.

Y at-il un moyen de supprimer tous les petits fichiers présents dans le dossier source et de créer un fichier d'archive? Si oui, comment désarchiver et récupérer les fichiers source?

Répondre

0

Même si le fichier d'archive est créé, les fichiers sources existent toujours. La seule solution est de supprimer les fichiers de la zone de chiffrement hadoop.

hadoop fs -rm -r -skipTrash /user/source/*.* 

En ce qui concerne désarchivage:

hdfs dfs -cp /user/outputdir/test.har /user/new_destination