Quels sont les doublons que vous recherchez? Les lignes entières ou juste le même numéro de téléphone?
Si elle est la ligne, essayez ceci:
sort phonelist.txt | uniq -c | sort -n
et vous verrez en bas toutes les lignes, qui se produisent plus d'une fois.
S'il est juste le numéro de téléphone dans une colonne, utilisez ceci:
awk -F ';' '{print $4}' phonelist.txt | uniq -c | sort -n
remplacer le « 4 » avec le numéro de la colonne avec le numéro de téléphone et le « ; » avec le vrai séparateur que vous utilisez dans votre fichier.
Ou donnez-nous quelques exemples de lignes de ce fichier.
EDIT:
Si le format de données est: name,mobile,phone,uniqueid,group
, puis utilisez les éléments suivants:
awk -F ',' '{print $3}' phonelist.txt | uniq -c | sort -n
dans la ligne de commande.
Pouvez-vous utiliser regex? Probablement. Devriez-vous utiliser regex? Sûrement pas. – NullUserException