J'ai un ensemble de chaînes. Disons que, (list.txt) ils sont:restreindre le motif aux chaînes spécifiées
1abc_A
2pqr_X
4ghi_Z
J'ai également un fichier texte (test.txt), qui ressemble à ceci:
1abc_A 2pqr_X 0.55 0.87
2pqr_X 3def_Y 0.21 0.24
4ghi_Z 1abc_A 0.98 0.75
2pqr_X 4ghi_Z 0.99 0.76
2pqr_X 2pqr_X 1.00 1.00
Je dois obtenir que les lignes de test.txt, tels que les chaînes dans les colonnes 1 et 2, font partie des chaînes incluses dans list.txt
dans ce cas, ma sortie serait comme suit:
1abc_A 2pqr_X 0.55 0.87
4ghi_Z 1abc_A 0.98 0.75
2pqr_X 4ghi_Z 0.99 0.76
2pqr_X 2pqr_X 1.00 1.00
i.e toutes les lignes dans test.txt SAUF la 2ème ligne, puisque la colonne 2 dans la 2ème ligne, 3def_Y ne fait pas partie de la liste des chaînes spécifiées dans list.txt
Comment puis-je faire cela dans awk? Veuillez noter que test.txt est un gros fichier texte, de presque 7Go.
Quel est le moyen le plus rapide de résoudre ce problème? S'il vous plaît aider.
merci Éd. c'est ce qu'il a fait. – ana
+1 belle doublure – Kent