2010-09-24 4 views
0

J'utilise HTML :: TokeParser pour analyser un site Web pour un champ particulier. Le champ se présente comme suitPourquoi HTML :: TokeParser's get_trimmed_text change le format de la date?

09/23/10 - 24:14 EDT

Cependant, lorsque j'imprime tout ce qui est reçu, il affiche,

2010-09- 23 12: 14: 32.0

Pourquoi l'incohérence? Le reconnaît-il comme un paramètre temporel et le convertit-il en un format interne? Si oui, comment puis-je le lire comme une chaîne?

+3

Vous devez montrer du code pour que les gens puissent reproduire le problème par eux-mêmes. – daxim

+0

Son se passe avec un seul site Web auquel je dois me connecter et je ne peux pas révéler que :(.Il n'y a pas là une approche générale à ce problème? – aks

+2

Imprimer le contenu entier avant de le nourrir dans le TokeParser.S'il est déjà mal à ce moment-là, vous avez éliminé l'analyseur comme source du problème et cette question de dépassement de pile serait erronée/invalide – daxim

Répondre

3

Serait-il possible que la valeur HTML :: TokeParser vous donne la date qui est dans le code HTML du site Web, mais le site Web a également un javascript pour convertir la date dans votre fuseau horaire local?