Comme par hadoop code source descriptions ci-dessous sont extraits des classes -quelle est la différence entre Hadoop -appendToFile par rapport Hadoop -Mettre lorsqu'il est utilisé pour la mise à jour des données de flux dans HDFS continously
appendToFile
"Appends the contents of all the given local files to the
given dst file. The dst file will be created if it does not exist."
mis
"Copy files from the local file system into fs. Copying fails if the file already exists, unless the -f flag is given.
Flags:
-p : Preserves access and modification times, ownership and the mode.
-f : Overwrites the destination if it already exists.
-l : Allow DataNode to lazily persist the file to disk. Forces
replication factor of 1. This flag will result in reduced
durability. Use with care.
-d : Skip creation of temporary file(<dst>._COPYING_)."
J'essaie de mettre à jour un fichier dans hdfs régulièrement car il est mis à jour dynamiquement à partir d'une source de diffusion en continu dans mon système de fichiers local.
Lequel dois-je utiliser de appendToFile et de mettre, et pourquoi?