Les modèles de données Cassandra nécessitent fréquemment des mises à jour de plusieurs familles de colonnes pour prendre en charge une seule "écriture" (c'est-à-dire mettre à jour les deux côtés d'un index bidirectionnel). Comment est-ce que je peux faire ceci avec Hadoop, quand la configuration de travail permet seulement de spécifier une famille simple de colonne de sortie?Comment générer plusieurs familles de colonnes Cassandra dans un seul travail Hadoop?
1
A
Répondre
3
Ceci est possible par rapiéçage Cassandra 1.1 en utilisant le patch disponible à:
https://issues.apache.org/jira/browse/CASSANDRA-4208
Une fois que vous avez cela, au lieu de ConfigHelper.setOutputColumnFamily()
, vous appelez ConfigHelper.setKeyspace()
. Ensuite, vous pouvez utiliser l'API MultipleOutputs pour spécifier vos CFs de sortie dans la configuration de l'emploi comme suit:
MultipleOutputs.addNamedOutput(job, "ColumnFamily1", ColumnFamilyOutputFormat.class, ByteBuffer.class, List.class);
MultipleOutputs.addNamedOutput(job, "ColumnFamily2", ColumnFamilyOutputFormat.class, ByteBuffer.class, List.class);
Lorsque vous êtes prêt à la sortie, référence simplement le CF nommé comme nom de sortie:
output.write("ColumnFamily1", key, Collections.singletonList(mutation));
où output
est une référence à votre instance MultipleOutputs dans votre réducteur.
Questions connexes
- 1. Comment créer plusieurs familles de colonnes en utilisant un script?
- 2. Comment imprimer des familles de colonnes configurées dans cassandra
- 3. Comment définir des familles de colonnes dynamiques dans Cassandra
- 4. Hadoop Hbase: Répartition des familles de colonnes entre les tables
- 5. Insertion de plusieurs colonnes dans Cassandra
- 6. Etat de cluster incohérent lors de la création de familles de colonnes par programme dans Cassandra
- 7. plage sur plusieurs colonnes cassandra
- 8. Générer plusieurs builds dans un seul makefile
- 9. Comment générer un DropDownListFor avec plusieurs colonnes
- 10. Hadoop et Cassandra benchmarking
- 11. Apache cassandra - Conception d'une base de données pour une application - Comment sélectionner les familles de colonnes et les super familles de colonnes?
- 12. Cassandra Modèle de données - Plusieurs colonnes composites
- 13. Comment plusieurs réducteurs produisent-ils un seul fichier-pièce dans Hadoop?
- 14. Réduire plusieurs enregistrements dans un seul enregistrement avec plusieurs colonnes
- 15. Conception d'intégration Hadoop Cassandra
- 16. Connexion à des familles de colonnes de cassandra utilisant thiapi api java
- 17. Date de générer plusieurs colonnes
- 18. Comment interroger plusieurs colonnes contre un seul tableau de ids
- 19. lot insère un seul enregistrement dans cassandra
- 20. Comment dire à hadoop combien de mémoire allouer à un seul travail de mappeur?
- 21. Inclure plusieurs colonnes dans un seul index dans Postgres
- 22. Cassandra Hadoop Exemple d'intégration et de compte de mots
- 23. Spécifier plusieurs fichiers d'entrée pour un travail hadoop
- 24. Convertir plusieurs DataTables en colonnes dans un seul datagridview
- 25. Un seul workflow peut-il générer plusieurs éléments de liste?
- 26. Colonnes d'élagage à Cassandra
- 27. Comment mettre à jour plusieurs colonnes avec un seul statment
- 28. Comment accéder aux colonnes Cassandra avec PIG
- 29. Mettre plusieurs noms de colonnes d'une table HBase dans un seul SparkRDD
- 30. Plusieurs tables avec des colonnes similaires dans un seul DB
Si vous utilisez une version actuelle, vous n'avez plus besoin de patcher. –