La documentation Hbase indique que la création de plus de 2 à 3 familles de colonnes est impossible, car Hbase ne gère pas très bien plus de 2 ou 3 familles de colonnes. La raison de ceci est le compactage et le rinçage et donc l'IO. Cependant, si toutes mes colonnes sont toujours peuplées (pour chaque ligne) alors je pense que ce raisonnement n'est pas si important, donc, considérant que mon accès aux colonnes est complètement aléatoire (je veux accéder à n'importe quelle combinaison de colonnes) - puis-je en avoir un? Colonne family -une configuration de colonne (essayant effectivement de le rendre pur en colonne).Famille de la colonne Hbase
Il existe de nombreux blogs/wikis expliquant cela, mais ils semblent tous contredire et ajouter plus de confusion. Je ne semble pas être capable de digérer le fait que Hbase préfère une famille de colonnes, alors à quoi sert d'appeler un magasin de colonnes?
Merci pour l'explication! – PrakashT
Donc dans mon cas, autant que je comprends, j'ai deux options: a) J'ai toutes les colonnes dans une famille de colonnes. Cela aura un impact sur la performance car la plupart du temps je n'ai besoin d'accéder qu'à 1-2 colonnes mais avec cette conception je lirai la ligne complète. Bien que ces lectures seront distribuées sur de nombreux serveurs de la région. 2) Je divise mes colonnes en familles de telle sorte qu'elles soient de taille similaire. – PrakashT
Vous devriez probablement arrêter de vous soucier de lire toute la ligne. HBase est extrêmement bon de ne lire que ce dont il a vraiment besoin. Si la cellule que vous avez besoin de lire est en mémoire, HBase n'effectuera aucune opération d'E/S sur le disque. –