J'ai une base de données de fichier plat de ids twitter qui suivent des comptes daesh avec un peu moins d'un demi-million de lignes qui ressemble à ceci:Pull et liste identifiant le plus courant dans une base de données fichier plat
722030494578122752 | User Followes/followed pxayrxxcz
Quand je veux Pour rechercher un identifiant, je fais juste un simple script bash qui ressemble à ceci.
grep -R $id | sort
et cela va remonter chaque compte daesh j'ai gratté que cet id suit. Je voudrais créer un autre script, dont le début ressemblerait à ceci.
cat * | sort | uniq | othercodehere > mostcommonids.txt
Ce que je veux faire est de lancer ce script sur mes fichiers de base de données et ont cracher les, disons dix ids, les plus courants qu'il traverse. Je voudrais l'énumérer combien de fois l'identifiant est rencontré mais je ne sais pas si c'est possible.
Voici 8 ligne exemple de la base de données:
701719369605222400 | User Follows/followed 2ccdcccdcc
701719369605222400 | User Follows/followed omans_228
701719369605222400 | User Follows/followed Qs_7ii
721205276146343936 | User Follows/followed DDSSW890
712955245035331584 | User Follows/followed dxbdbd54
725779221335912452 | User Follows/followed GAREBSHAMI
713079851499040768 | User Follows/followed oobaida_793
713079851499040768 | User Follows/followed AbuH3
Donc dans ce cas 701719369605222400 (les trois premiers ids) est l'identifiant le plus courant dans la liste, et 713079851499040768 (les deux derniers ids) est le deuxième identifiant le plus commun dans la liste. Id comme le fichier de sortie pour ressembler à ceci:
701719369605222400 3
713079851499040768 2
Tout est sur la même ligne donc cela ne fonctionnerait pas, il dit que tous les identifiants sont répertoriés une seule fois parce que l'utilisateur qu'ils suivent est sur la même ligne que l'ID de l'utilisateur. – Matt
@Matt S'il vous plaît modifier votre question pour ajouter un exemple d'entrée et votre sortie attendue à partir de that..its mieux de comprendre de cette façon .. – heemayl
Fait! Désolé pour ça. – Matt