J'ai besoin de trouver et remplacer des milliers d'URLs cibles (ahrefs) dans des dizaines de documents html différents ... tous les ahrefs sont formatés différemment. J'ai besoin de remplacer toutes les différentes URLs cibles avec une URL cible uniforme.Regex trouver avec deux caractères génériques, remplacer l'un d'eux - TextMate
Il y a deux accrocs:
- Je ne veux pas bousiller les linkhrefs pour les références de fichier css, etc., mais plutôt que changer les ahrefs réels
2.in ces documents là-bas n'est pas une structure uniforme aux ahrefs. Certains ont class = stuff entre le a et le href. Voici quelques exemples:
<a class='image' href="examplelinkone.com">
<a class='image ' href="examplelinkone.com"> (space between e and ')
<a class='someotherclass' href="examplelinktwo.com"
Je peux avec succès trouver toutes les occurrences des ahrefs quand j'utilise regex comme ça ...
<a[^<>]+href="[^<>]+"
... mais je ne peux pas comprendre comment REMPLACER seulement ce qui est entre les doubles guillemets de la partie href = et laissez seul tout ce qui peut être entre le a et le href
C'est pourquoi vous ne faites pas correspondre HTML avec regex. Imaginez ceci: ' '. – h2ooooooo