J'utilise des fichiers Avro pour stocker des données dans HDFS. J'ai besoin de copier des données de colonnes sélectionnées d'un fichier avro et de l'envoyer à un autre emplacement dans le même cluster avec son propre fichier de schéma (qui contient les informations sur les colonnes sélectionnées). Comment puis je faire ça? Est-il possible de mettre en œuvre en utilisant Hive? ou y at-il un utilitaire dans HDFS qui peut m'aider à faire cela?Copie intracluster HDFS avec les colonnes sélectionnées
Ceci est nécessaire car un groupe doit pouvoir accéder à une table entière et un autre groupe ne doit pouvoir accéder qu'à quelques colonnes. Donc, j'ai besoin qu'ils soient dans un emplacement séparé dans HDFS avec seulement le schéma requis et le fichier avro.
s'il vous plaît partager votre mot détail – Raghavendra
_ "intercluster" _ implique que vous déplacez des données entre 2 clusters différents. Ce qui n'est pas le cas ici. Veuillez supprimer ce mot ou remplacer par "intracluster" (mais ce n'est pas utile). –