Comment décompressez-vous les fichiers très volumineux en python?

En utilisant python 2.4 et la bibliothèque intégrée ZipFile, je ne peux pas lire de très gros fichiers zip (plus de 1 ou 2 Go) car il veut stocker tout le contenu du fichier non compressé en mémoire. Existe-t-il un autre moyen de le faire (soit avec une bibliothèque tierce, soit avec un autre hack), ou dois-je le "déballer" et le décompresser de cette façon (ce qui n'est pas forcément multi-plateforme).Comment décompressez-vous les fichiers très volumineux en python?

Source

2008-12-03 Marc Novakowski

Voici un aperçu de la décompression de fichiers volumineux.

import zipfile 
import zlib 
import os 

src = open(doc, "rb") 
zf = zipfile.ZipFile(src) 
for m in zf.infolist(): 

    # Examine the header 
    print m.filename, m.header_offset, m.compress_size, repr(m.extra), repr(m.comment) 
    src.seek(m.header_offset) 
    src.read(30) # Good to use struct to unpack this. 
    nm= src.read(len(m.filename)) 
    if len(m.extra) > 0: ex= src.read(len(m.extra)) 
    if len(m.comment) > 0: cm= src.read(len(m.comment)) 

    # Build a decompression object 
    decomp= zlib.decompressobj(-15) 

    # This can be done with a loop reading blocks 
    out= open(m.filename, "wb") 
    result= decomp.decompress(src.read(m.compress_size)) 
    out.write(result) 
    result = decomp.flush() 
    out.write(result) 
    # end of the loop 
    out.close() 

zf.close() 
src.close()

Source

2008-12-04 03:08:28

C'est exactement ce que je cherchais - merci! –

@ s-lott Que fait 'ex = src.read (len (m.extra))' et 'cm = src.read (len (m.comment))' quoi utilisez-vous les variables 'ex' et' cm Pour? Que voulez-vous dire qu'il est bon d'utiliser une struct pour déballer cela? Et à quoi sert le numéro magique '30'? – Jonathan

Au Python 2.6, vous pouvez utiliser ZipFile.open() pour ouvrir un descripteur de fichier sur un fichier et copier le contenu de manière efficace dans un fichier cible de votre choix:

import errno 
import os 
import shutil 
import zipfile 

TARGETDIR = '/foo/bar/baz' 

with open(doc, "rb") as zipsrc: 
    zfile = zipfile.ZipFile(zipsrc) 
    for member in zfile.infolist(): 
     target_path = os.path.join(TARGETDIR, member.filename) 
     if target_path.endswith('/'): # folder entry, create 
      try: 
       os.makedirs(target_path) 
      except (OSError, IOError) as err: 
       # Windows may complain if the folders already exist 
       if err.errno != errno.EEXIST: 
        raise 
      continue 
     with open(target_path, 'wb') as outfile, zfile.open(member) as infile: 
      shutil.copyfileobj(infile, outfile)

Il utilise shutil.copyfileobj() pour lire efficacement données de l'objet zipfile ouvert, en le copiant dans le fichier de sortie.

Source

2015-02-27 13:41:54

Comment décompressez-vous les fichiers très volumineux en python?

Répondre

Questions connexes