2009-07-07 4 views
0

Nous utilisons JTidy pour nettoyer certains html pour le traitement de sax. Nous avons eu beaucoup de problèmes autour des questions d'espacement comme indiqué dans cet exemple:Tidy causant de mauvais problèmes d'espacement (JTidy)

Html

<i>stack<span 
class="bold">overflow</span></i> 

qui sort "stackoverflow"

Mais ...

Poster JTidy

<i>stack 
<span 
class="bold">overflow</span></i> 

qui génère un "débordement de pile" (notez le nouvel espace)

Tout le monde a des conseils pour corriger/gérer cela mieux. J'ai été à travers tous les paramètres de Tidy/JTidy et ne vois rien pour expliquer ce problème.

Répondre

2

Transforme ce simple exemple ne montre pas vraiment la question. Le problème réel était que Tidy/JTidy utilisait un paramètre d'habillage par défaut qui provoquait le problème ci-dessus (et d'autres problèmes d'espacement différents) lorsqu'il y avait des valeurs d'attribut très longues.

Tout a été fixé avec:

jtidy.setWraplen(0); 
jtidy.setWrapAttVals(false); 
0

Quels paramètres utilisez-vous? L'exécution JTidy de la ligne de commande en utilisant ses paramètres par défaut sur l'extrait que vous avez posté ce imprime:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> 
<html> 
<head> 
<meta name="generator" content="HTML Tidy, see www.w3.org"> 
<title></title> 
</head> 
<body> 
<i>stack<span class="bold">overflow</span></i> 
</body> 
</html> 
+0

Convenu. Cet exemple simple fonctionne. Notre contenu actuel a beaucoup plus de listes d'attributs de style, ce qui m'a indiqué les paramètres de "emballage" de Tidy. Effectivement, cela a réglé le problème. – jfeust

Questions connexes