J'ai 2 To de données, et je dois décompresser les fichiers pour faire une analyse. Cependant, en raison d'un problème d'espace disque, je ne peux pas décompresser tous les fichiers à la fois. Ce que je pensais, c'est décomposer d'abord deux mille d'entre eux, puis faire mon analyse et la répéter pour le prochain 2000. Comment je pourrais le faire?Dézipper le nombre de fichiers itérativement en utilisant Python
import os, glob
import zipfile
root = 'C:\\Users\\X\\*'
directory = 'C:\\Users\\X'
extension = ".zip"
to_save = 'C:\\Users\\X\\to_save'
#x = os.listdir(path)[:2000]
for folder in glob.glob(root):
if folder.endswith(extension): # check for ".zip" extension
try:
print(folder)
os.chdir(to_save)
zipfile.ZipFile(os.path.join(directory, folder)).extractall(os.path.join(directory, os.path.splitext(folder)[0]))
except:
pass
Pensez-vous vraiment que c'est un doublon? – edyvedy13
Ce que je dois faire est d'obtenir le premier 2000, donc les fichiers listés entre 1-2000; puis 2001- 4000 – edyvedy13