J'essaie d'extraire l'horodatage d'un fichier XML en utilisant serde xml dans Hive. La création de la table externe est liée à un répertoire hdfs. Actuellement, la valeur d'horodatage apparaît comme nulle dans ma table.XML Hive Serde Extrait horodatage Hadoop
Je pense que l'horodatage doit être casté? Je ne suis pas sûr. Le reste des informations XML fonctionne correctement et apparaît dans la ruche.
fichier d'entrée est:
<example>
<date>2017-02-09 22:03:58<date>
</example>
Création Ruche Script:
create external table example (
date timestamp
)
ROW FORMAT SERDE 'com.ibm.spss.hive.serde2.xml.XmlSerDe'
WITH SERDEPROPERTIES (
"column.xpath.date"="/example/date/text()"
)
STORED AS
INPUTFORMAT 'com.ibm.spss.hive.serde2.xml.XmlInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.IgnoreKeyTextOutputFormat'
LOCATION 'mypath'
TBLPROPERTIES (
"xmlinput.start"="<example>",
"xmlinput.end"="</example>"
);