Je travaille dans Impala avec le tableau suivant:Hadoop Impala: Format entier type de données à jour/horodatage pour utiliser la fonction AddTime
customer_id | day_id | return_day_id
ABC 20170830 20170923
BCD 20170830 20170901
Malheureusement, les deux day_id & champs return_day_id sont INT et non la date.
Comment puis-je changer leur type de données pour être date, de sorte que je peux compter les customer_ids distincts seulement avec return_day_id dans les 4 jours après day_id. Aurais-je besoin de le lancer à ce jour, puis à l'horodatage afin que je puisse utiliser la fonction adddate?
Utilisez une combinaison de '' unix_timestamp' et from_unixtime' et jeter la résultante 'timestamp' utiliser la' date_add' fonction. – philantrovert
merci @philantrovert - Je suis assez nouveau à Impala, cela vous dérange de poster un exemple de la façon dont vous le feriez comme une réponse? De cette façon, je peux aussi upvote/l'accepter. Merci beaucoup – jeangelj