J'ai un répertoire plein de très gros fichiers csv qui ont été convertis en csv à partir de pcap. J'essaie de parcourir chaque fichier csv dans ce répertoire et d'obtenir les adresses IP source les plus courantes (colonne 2).Obtenir les ip les plus courants du répertoire complet de pcap en fichiers csv
Actuellement, ma sortie est incorrecte, car il semble que j'ai réussi à avoir chaque fichier vider ses valeurs dans le fichier suivant avant de commencer. Chaque fichier semble avoir le même ip, et je sais que ce n'est pas le cas.
ipCounter = collections.Counter()
#iterate through all of the files in the directory, using glob
for filename in glob.glob('/path/to/directory/*'):
with open(filename) as input_file:
#skip column titles
input_file.next()
for row in csv.reader(input_file, delimiter=','):
ipCounter[row[2]] += 1
print 'Source IPs most common in: %s' % filename
print ipCounter.most_common()
Je ne suis pas un pro avec Python, donc il peut y avoir une meilleure façon de faire, mais c'est ce que j'ai obtenu jusqu'à présent.