J'essaie de soustraire List_1 (50k lignes) de List_2 (100k lignes), quand un élément de List_1 correspond exactement à un élément de List_2. J'utilise grep
, plus précisément:Quel est le moyen le plus efficace de soustraire une liste à une autre?
grep -v -f List_1.csv List_2.csv > Magic_List.csv
Je sais que ce n'est pas la façon la plus efficace de le faire, mais ce qui est? sed
? awk
? comm
? SQL? Comment pourrais-je accomplir cela de la manière la plus efficace possible?
Dans votre csv, enlevez-vous des éléments d'une rangée? ou est comparé rangée par rangée? – aus
Dépend exactement de la façon dont vous définissez "soustraire" pour les listes. Traiter les listes comme des ensembles? Ou les listes peuvent-elles contenir des doublons et l'ordre est-il pertinent? –