J'ai un gros fichier XML que je suis en train d'éditer avec BBEdit.Suppression d'un ensemble de tags d'un autre ensemble à l'aide d'expressions régulières
Dans le fichier XML, qui est une reconstitution numérique d'un ancien journal, se trouve un texte entouré de balises de note. Cependant, certaines étiquettes de note comportent des guillemets inclus dans les guillemets qui y sont imbriqués. Je dois supprimer toutes les occurrences de guillemets des balises de note, tout en conservant le contenu réel des balises de guillemets. Ainsi, l'exemple deviendrait:
<note>Example of a note, but "here is a quotation within the note"</note>
Je l'ai utilisé GREP BBEdit pour éliminer avec succès certains d'entre eux, mais je commence à être coincé avec les balises de notes plus complexes qui vont sur plusieurs lignes ou qui ont du texte entre les deux ensembles différents d'étiquettes. Par exemple:
<note>Example of a note, <quote>"with a quotation"</quote> and a <quote>"second quotation"</quote> along with some text outside of the quotation before the end of the note.</note>
Quelques citations peuvent durer plus de 10 lignes. Utiliser \ r dans mon expression rationnelle ne semble pas aider.
Je devrais aussi dire que les balises de citation peuvent exister en dehors des balises de note, ce qui exclut la possibilité de simplement trouver en bloc /? Quote et de le supprimer. Je dois toujours utiliser les balises de citation dans le document, mais pas dans les balises de note.
Un grand merci pour toute aide.