Je construis la logique de transformation d'un fichier qui applique certaines règles de transformation aux champs du fichier. Exemple de ces règles de transformation sont:Logique de transformation Perl - traitement de fichier ou DB
- valeurs par défaut de réglage pour certains champs si elles sont vides (si la colonne 5 est vide, il est réglé sur « vide »)
- Résumant le fichier en fonction de certaines colonnes (si le fichier a col1, col2 et col3, résumer fichier à agréger col3 pour tous col1)
- cordes Substituer dans certains domaines (remplacer tous les "hache" dans col1 avec "ay")
- Etc.
d'un perspective de performance, quand d en effectuant ces transformations sur un gros fichier, vaut-il mieux le faire en utilisant un traitement de fichier simple (lire le fichier ligne par ligne, utiliser des hachages pour résumer, regexes pour d'autres transformations etc.) ou charger les données dans une table de base de données. appliquer toute la logique de transformation et le télécharger dans un fichier?
Eg summarization:
fichier original a:
A | B | C | 100 | 200 | 300
A | B | C | 200 | 100 | 0
A | X | C | 100 | 100 | 100
fichier Transformé a:
A | B | 300 | 300 | 300
A | X | 100 | 100 | 100
Pouvez-vous clarifier le contenu de col3? Est-ce que col3 est le même dans chaque rangée? Si vous changiez une ligne, cela changerait-il la col3 d'une autre rangée? – Tim
Oui, les règles s'appliquent donc à toutes les valeurs col3 de chaque ligne. – Chris
Quelle est la taille des fichiers? Combien de lignes? Quelle est la quantité de RAM de l'ordinateur? –