J'essaye d'analyser un fichier xml. Le texte qui est dans les balises est analysé avec succès (ou il semble que oui) mais je veux sortir comme le texte qui n'est pas contenu dans quelques étiquettes et le programme suivant l'ignore juste.Analyser un fichier XML alors qu'une balise est manquante
from xml.etree.ElementTree import XMLTreeBuilder
class HtmlLatex: # The target object of the parser
out = ''
var = ''
def start(self, tag, attrib): # Called for each opening tag.
pass
def end(self, tag): # Called for each closing tag.
if tag == 'i':
self.out += self.var
elif tag == 'sub':
self.out += '_{' + self.var + '}'
elif tag == 'sup':
self.out += '^{' + self.var + '}'
else:
self.out += self.var
def data(self, data):
self.var = data
def close(self):
print(self.out)
if __name__ == '__main__':
target = HtmlLatex()
parser = XMLTreeBuilder(target=target)
text = ''
with open('input.txt') as f1:
text = f1.read()
print(text)
parser.feed(text)
parser.close()
Une partie de l'entrée que je veux analyser: <p><i>p</i><sub>0</sub> = (<i>m</i><sup>3</sup>+(2<i>l</i><sub>2</sub>+<i>l</i><sub>1</sub>) <i>m</i><sup>2</sup>+(<i>l</i><sub>2</sub><sup>2</sup>+2<i>l</i><sub>1</sub> <i>l</i><sub>2</sub>+<i>l</i><sub>1</sub><sup>2</sup>) <i>m</i>) /(<i>m</i><sup>3</sup>+(3<i>l</i><sub>2</sub>+2<i>l</i><sub>1</sub>)) }.</p>
C'est pas comme xml j'ai jamais vu. Bien sûr, vous ne voulez pas un analyseur _html_? – James
C'est produit ici: http://wims.unice.fr/wims/en_tool~linear~linsolver.fr.html Lorsque vous obtenez la solution, si vous regardez la source, vous voyez quelque chose de similaire. –
Vous venez d'éditer le tag LaTeX. ??? –