Quelque chose comme ça
create table t1 (group_id varchar2(20), value varchar2(20));
create table t2 (group_id varchar2(20), value varchar2(20));
insert into t1 values ('A','FOO');
insert into t1 values ('A','BAR');
insert into t1 values ('X','HHH');
insert into t1 values ('X','ZOO');
insert into t2 values ('C','FOO');
insert into t2 values ('C','BAR');
insert into t2 values ('B','ZOO');
select t1.group_id t1_group,t2.group_id t2_group,
--t1.all_val, t2.all_val,
case when t1.all_val = t2.all_val then 'match' else 'no match' end coll_match
from
(select 'T1' tab_id, group_id, collect(value) all_val,
min(value) min_val, max(value) max_val, count(distinct value) cnt_val
from t1 group by group_id) t1
full outer join
(select 'T2' tab_id, group_id, collect(value) all_val,
min(value) min_val, max(value) max_val, count(distinct value) cnt_val
from t2 group by group_id) t2
on t1.min_val = t2.min_val and t1.max_val = t2.max_val and t1.cnt_val = t2.cnt_val
/
Je l'ai fait une élimination préliminaire sur la base minmium, maximale et le nombre de valeurs distinctes dans chaque groupe, ce qui aiderait à grands ensembles de données. Si les jeux de données sont suffisamment petits, vous n'en aurez peut-être pas besoin.
Cela vous indique les correspondances. Vous avez juste besoin de pousser une étape supplémentaire pour trouver les groupes qui n'ont aucune correspondance
select t1_group
from
(
select t1.group_id t1_group,t2.group_id t2_group,
--t1.all_val, t2.all_val,
case when t1.all_val = t2.all_val then 'match' end coll_match
from
(select 'T1' tab_id, group_id, collect(value) all_val
from t1 group by group_id) t1
cross join
(select 'T2' tab_id, group_id, collect(value) all_val
from t2 group by group_id) t2
)
group by t1_group
having min(coll_match) is null
/
select t2_group
from
(
select t1.group_id t1_group,t2.group_id t2_group,
--t1.all_val, t2.all_val,
case when t1.all_val = t2.all_val then 'match' end coll_match
from
(select 'T1' tab_id, group_id, collect(value) all_val
from t1 group by group_id) t1
cross join
(select 'T2' tab_id, group_id, collect(value) all_val
from t2 group by group_id) t2
)
group by t2_group
having min(coll_match) is null
/
Quelle devrait être la sortie? Juste une liste de groupes qui sont différents? Ou les différences elles-mêmes? –
La sortie n'est pas vraiment importante, ce qui compte, c'est que la requête voit les groupes et les compare en tant que groupes. – paweloque
Lorsque vous publiez des questions, présentez-nous des exemples de données, des exemples de résultats clairement indiqués et balisés afin que nous puissions facilement vous aider. – JonH