2017-08-19 3 views
-1

Si vous avez deux fichiers de même format séparés par des tabulations, et que vous voulez connaître le nombre de valeurs dans cette colonne qui sont identiques entre les deux fichiers, quel serait le meilleur moyen de le faire?Comment obtenir un compte des mêmes valeurs dans la même colonne de deux fichiers dans shell Linux?

Exemple: j'ai cinq colonnes de données séparées par des onglets, colonne deux fichier_1 est la suivante:

234839 
349583 
444995 
694038 
785948 

et file2 colonne 2 est la suivante:

123943 
234839 
338273 
349583 
785948 

La production attendue serait de 3.

+0

Exemple d'entrée et de sortie s'il vous plaît. –

+0

Ajout d'un exemple d'entrée/sortie. Edit: John tu es trop rapide pour moi. – user1381852

+0

Eh bien, vous avez ajouté un exemple d'entrée mais pas de sortie. –

Répondre

0

Dépend, voulez-vous avoir un mappage entre les valeurs et les comptages, ou bien est-ce la valeur de l'une des entrées?

De toute façon, vous pouvez probablement le faire par la tuyauterie chat, coupe, grep, wc -l

+0

Pas besoin de correspondance entre eux, c'est purement le nombre entre les deux – user1381852

+0

Que se passe-t-il si la valeur A toujours deux fois dans le fichier 1 et la valeur B apparaît quatre fois dans le fichier 1? Vous voulez juste le compte de la valeur qui apparaît le plus souvent dans les deux fichiers? –

+0

Eh bien, ils n'apparaissent qu'une seule fois par fichier, c'est un fait. J'ai fini par utiliser 'cut -f 2 strain1.vcf strain2.vcf | grep -c -wFf strain1.vcf strain2.vcf' – user1381852