2010-04-19 6 views
0

Mon fichier XML est mal formaté pour l'étiquette. Plus précisément, je veux que chaque étiquette qui n'est pas terminée soit corrigée. Comment puis-je correspondre à un tel modèle et en utilisant ReplaceAll pour le faire?Regex: simple Java Regex Question

Pattern r = "<img.*?[^/]>" // sth like that? 

Répondre

4

Vous avez oublié un point-virgule :)

Non sérieusement, utilisez un (X) HTML parser/API de nettoyage qui peut convertir tagsoup (HTML) à XHTML. Sous chaque JTidy peut le faire dans un seul appel:

new Tidy().parseDOM(inputStream, outputStream); 

Regex est tout simplement pas bien adapté à ce travail.

+0

Merci. Mais est-il nécessaire d'inclure une bibliothèque externe pour cette opération simple? Je veux juste quelque chose de plus simple. – Yang

+0

Opération simple? Pourquoi ne peux-tu pas le coder toi-même? ;) Ce n'est vraiment pas aussi simple que vous semblez le penser. – BalusC

+0

Il suffit d'ajouter le pot à votre classpath :) – Alfred