Je suis en train de nettoyer des blocs de texte relativement grands (30 lignes). Voici un extrait:Manière optimale de remplacer les caractères dans une grande chaîne avec Python?
PID | 1 || 06225401 ^^^ PA0^MR || PATIENT^FAKE R ||| F
PV1 | 1 | Je ||||| 025631^DoctorZ ^^^^^^^ PA0 ^^^^ DRH | |||| ... DRH
ORC | RE || CYT-09-06645^AP |||||| 200912110333 | INTERFACE07
OBR | 1 || CYT09-06645 | 8104 ^^ L ||| 20090602 ||||||| 200906030000 [conditio ...
OBX | 1 | TX | 8104 | 1 | SOURCE DE S PECIMEN: [source] |||||| F ||| 200912110333 | CYT ...
J'ai actuellement un script qui prend des caractères illégaux ou des termes. Voici un exemple. Mon but est de modifier ce script afin que je puisse ajouter 4 chiffres à la fin de l'un des champs. En particulier, le champ de date ("20090602") dans la ligne OBR. Le script terminé sera capable de fonctionner avec n'importe quel fichier qui suit ce même format. Est-ce possible avec la façon dont je gère actuellement l'entrée de fichier ou dois-je utiliser une logique différente?
La question n'est pas complètement claire. Pouvez-vous fournir des exemples d'entrée et de sortie? –
Ces en-têtes indésirables peuvent être mieux exprimés par exemple. "4 \ xfePATH \ xfe" pour montrer clairement que les soi-disant "caractères illégaux" ne sont pas des caractères (ni épines minuscules islandaises, ni minuscules latines p (à quoi elles ressemblent à première vue)) mais juste binaires ordures. –