J'ai un éditeur WYSIWYG qui construit du contenu HTML. Les balises ne sont pas toujours construites en tant que xml valide, et j'en ai besoin pour être valide xml. Quelqu'un at-il un tel script? Comment ferais-je cela?Script pour convertir le balisage html en XML valide
Répondre
Je ne suis pas sûr de ce que la langue que vous utilisez sur le serveur, mais vous pouvez regarder dans le Html Agility Pack si vous utilisez .NET
J'ai trouvé que Html Agility Pack a quelques bugs. Dans certains cas, produit du XML non valide. – Muxa
Il y a un certain nombre d'outils tels que la TagSoup de John Cowan qui font un bon travail de conversion HTML en XML.
Il pourrait être utile d'avoir un regard sur cette version .NET de HTML Tidy: Tidy.NET
Microsoft a publié un exemple de code: SgmlReader. Il vous permet de lire (entre autres formats) bien rangé html.
j'ai écrit une petite méthode utilitaire qui convertit une chaîne Html à une chaîne xml:
/// <summary>
/// Converts a string from potential dirty HTML to valid XML
/// </summary>
/// <param name="input">The string to convert</param>
/// <returns>A valid XML fragment that contains the cleaned HTML</returns>
/// <remarks>This methods only format the html to an xml compatible parser.
/// The method does not clean dangerous tags from the source string</remarks>
public static string HtmlToXHtml(string input)
{
using (var sr = new StringReader(input))
{
var hr = new SgmlReader(sr);
hr.InputStream = sr;
hr.DocType = "HTML";
var output = new StringBuilder();
var hw = new XmlTextWriter(new StringWriter(output));
hr.Read();
while (!hr.EOF)
{
hw.WriteNode(hr, true);
}
return output.ToString();
}
}
Vous pouvez « simplement » mettre à jour l'entrée d'utilisateur après la publication. Dans des scénarios plus complexes (pour passer du mode source wysiwyg au mode source HTML), vous pouvez avoir besoin d'un bit Ajax pour convertir la chaîne html en xhtml derrière le rideau, avant d'afficher la source html dans la zone de texte.
- 1. Regex - Convertir HTML en balise XML valide
- 2. Convertir démarquage en HTML balisage
- 3. Convertir le texte textarea en HTML valide
- 4. Importance d'un balisage valide pour le référencement?
- 5. JSON non valide avec le balisage de ma page html
- 6. Comment convertir un XML non valide en XML valide
- 7. html - table de formulaire - balisage non valide
- 8. convertir xml en html
- 9. simple html dom sur balisage non valide
- 10. balisage en xsl xml
- 11. Utilisation de l'expression régulière pour convertir le balisage en italique Textile en HTML
- 12. Comment convertir XML (String) en document valide?
- 13. XSLT pour convertir le schéma XML en HTML
- 14. Balisage de balisage HTML
- 15. échapper le balisage html
- 16. Comment écrire un programme java pour convertir html en xml
- 17. Traitement du balisage HTML en XML pendant la désséralisation d'ASP.Net
- 18. convertir xml en html en utilisant php
- 19. regex pour supprimer le balisage html
- 20. Outils pour convertir XML en HTML en utilisant XSLT
- 21. Conversion beaucoup de HTML valide pour HTML valide
- 22. Outil pour convertir le balisage du moteur d'affichage WebForm en balisage du moteur d'affichage Razor
- 23. Regex pour le balisage correspondant dans le balisage PHPish?
- 24. Convertir une chaîne en texte valide en xml dans Coldfusion
- 25. SSIS - Composant de script VB pour convertir l'entrée en XML
- 26. Comment convertir cdata de xml en html
- 27. PHP Script pour convertir les fichiers .CSV en .XML
- 28. Comment convertir un flux xml en HTML
- 29. XML modifié toujours valide pour le traitement?
- 30. Script vba pour analyser html & create xml
Quelle langue côté serveur? – alex
Avez-vous une chance de réparer l'éditeur? –
@ John Saunders, oui. –