2012-02-01 5 views
2

Supposons que j'ai une relation 1 à N, par exempleNoSQL, Hbase, Cassandra Conceptualisation db

Student , College. 

étudiant Attributs:

Name,Surname,CollegeFKey, 

College attributs:

CollegeKey,Other,Other. 

Supposons que J'ai un programme qui lit les étudiants et les examens à partir d'un fichier texte. Et, sur ce fichier, j'ai dupliqué Colleges et Duplicated Studends.

Comme dans les tableaux dénormalisées:

CollegeId,Other,Other,Name,Surname,CollegeFkey. 

par exemple

1,x,y,Mike,M,1 
1,x,y,R,P,1 
... 
... 
... 

Vous voyez, je dois vérifier dans ce cas, toujours dans ma db normalisée, j'ai toujours pas inséré dans le tableau 2 College fois sur la touche 1.

Comment puis-je résoudre ce dans Hbase ou Cassandra? Je veux dire, si j'ai 10000 .. tables et lignes, je ne veux pas vérifier pour chaque clé primaire, puis pour chaque FK, si elle a été insérée OK?

Comment puis-je résoudre ce problème? Je peux utiliser no-sql db pour travailler directement dans des données dés-normalisées? Pouvez-vous me lier à un exemple qui résout ce problème?

+0

En parlant avec certains utilisateurs de hbase la réponse peut être trouvée dans le livre "hadoop: le guide définitif", pratiquement on devrait utiliser Pig Latin pour effectuer des requêtes sql-likes ou des requêtes Hive non slq pour ce genre de problème. J'espère que cela peut aider. Du côté de cassandra je pense que je ne suis pas encore expericend tellement tellement j'espère que les utilisateurs commenteront cela. - user448381 il y a 2 heures –

Répondre

Questions connexes