Quels sont les bons modules Perl pour traiter les fichiers en fonction des configurations? Fondamentalement, je travaille sur la prise de fichiers de données, les diviser en colonnes, supprimer certaines lignes en fonction de certaines colonnes, supprimer les colonnes inutiles, les comparer à la ligne de base (écrit où les changements ont eu lieu) et enregistrer un csv des données commentaires en tant que métadonnées.Quels sont les bons modules Perl pour la programmation basée sur les flux sur les fichiers?
Exemple de fichier est:
001SMSL24936
002XXXXX20090320102436 010000337 00051
002XXXXX20090320103525 010000333 00090
002XXXXX20090320103525 010000333 00090
002XXXXX20090320103525 010000333 00090
002XXXXX20090320103525 010000333 00090
002XXXXX20090320103525 020000333 00090
009000000009000000000271422122
il comparera ligne par ligne avec un autre fichier (ligne de base) et quelques lignes différentes seront mises en évidence (je l'utilise Tk::DiffText
).
Voici le pipeline où [is a pipe]
-> [SPLIT] -> [supprimer la production] -> [trier] -> [comparer] -> {utilisateur saute et écrit des commentaires, fichier les modifications au besoin } -> [save csv] -> [enregistrer les commentaires]
La vraie question est de savoir quel module Perl aide à modéliser et à faire circuler un pipeline comme ça? Après plus de recherche, j'ai trouvé ce http://en.wikipedia.org/wiki/Flow-based_programming.
Quel type de fichiers de données? –
Vous devez ajuster votre question pour montrer un exemple complet du fichier de données, l'entrée que vous attendez et la sortie que vous désirez. Ne pas ajouter à la question à travers les commentaires: faites mieux la question :) –
oups je veux dire est ce meilleur cerveau de foy. – kthakore