j'ai un dossier avec plusieurs fichiers texte à l'intérieur que je dois traiter et le format en utilisant plusieurs listes de remplacement qui ressemble à ceci:remplacements regex multiples basés sur des listes dans plusieurs fichiers
old string1~new string1
old string2~new string2
etc~blah
Je cours chaque paire de remplacement de remplacement listes sur chaque ligne de ces fichiers de texte multiples. Maintenant, j'ai un ensemble de scripts python pour effectuer cette opération. Ce que je m'interroge, c'est de rendre le code plus simple et mieux maintenable si je passe à sed ou awk? Est-ce que ce sera une meilleure solution ou devrais-je améliorer mon code Python? Je demande parce que les fichiers texte entrants viennent sur une base régulière et ont souvent une structure différente de ce qu'elle était avant, comme les erreurs, les fautes d'orthographe, les espaces multiples, car ces fichiers sont créés par des humains. Donc, je dois constamment modifier mon code et les listes de remplacement pour le faire fonctionner correctement. Merci.
Difficile à dire sans voir votre code Python donc on a une meilleure idée si c'est un goulot de bouteille là ... –
Vous avez utilisé le mot "string" dans votre question mais la solution que vous avez acceptée utilise des expressions régulières à la place donc qui est-ce sur côté gauche des "~" s ci-dessus - les chaînes ou les expressions régulières? –
Oui, je suis désolé pour la confusion, j'utilise des expressions régulières et ces chaînes avec ~ sont en fait des expressions régulières. –