Grande question: Je veux une liste des combinaisons uniques entre deux champs dans une trame de données.awk supprimer les doublons en miroir de 2 colonnes
données Exemple:
A B
C D
E F
B A
C F
E F
Je voudrais être en mesure d'obtenir le résultat de 4 combinaisons uniques: AB, CD, EF et FC Depuis BA et et BA contiennent les mêmes composants, mais dans un ordre différent, je ne veux qu'une copie (il est une relation mutuelle si BA est la même chose que AB)
Tentative:
Jusqu'à présent, je ont essayé de tri et de garder les lignes uniques:
sort file | uniq
mais bien sûr, qui produit 5 combinaisons:
A B
C D
E F
B A
C F
Je ne sais pas comment aborder AB/BA étant considéré comme le même. Des suggestions sur la façon de faire cela?
Est-ce que les données réelles ont seulement deux caractères ou peut être plus de deux? –
@George désolé je n'ai pas spécifié - les données réelles sont des caractères multiples par colonne, mais James et Ed ont fourni des réponses qui fonctionnent pour plusieurs caractères – user4670961
Je suggérerais d'inclure un exemple d'entrée multi-char/sortie attendue; est possible quelques solutions pour rompre avec plusieurs caractères ... –