2009-02-04 7 views
1

J'ai un très grand fichier CSV et j'ai besoin d'écrire une application qui l'analysera, mais en utilisant le fichier> 6 Go à tester est douloureux, existe-t-il un moyen simple d'extraire les cent premières lignes sans avoir à charger le fichier entier en mémoire?Raccourcir grand CSV sur debian

Le fichier réside sur un serveur Debian.

Répondre

5

Avez-vous essayé la commande head?

head -200 inputfile > outputfile 
+0

Belle réponse Je n'ai jamais entendu parler de la tête ... merci. – UnkwnTech

+0

Utilisez "-n 200" au lieu de "-200". Ce dernier est une syntaxe obsolète. –

+0

La documentation GNU dit qu'elle est "obsolète" mais je n'ai vu personne d'autre la déclarer obsolète. Les documents Solaris, par exemple, répertorient les deux méthodes mais n'offrent aucune préférence. –

0
  • tête -10 file.csv> truncated.csv

    prendra les 10 premières lignes de file.csv et le stocker dans un fichier nommé truncated.csv

0

"Le fichier se trouve sur un serveur Debian." - C'est intéressant. Cela signifie essentiellement que même si vous utilisez 'head', d'où la tête récupère-t-elle les données? La mémoire locale (après que le fichier a été copié) qui va à l'encontre du but.

+0

A en juger par la réponse acceptée, je pense qu'il est juste de supposer que le PO a mentionné Debian pour s'assurer que les affiches connaissaient l'OS cible. –

+0

Bizarre. Pourquoi alors était-il même mentionné? –

+0

Donne l'impression qu'il essayait de le retirer partiellement du serveur .. –

Questions connexes