J'essaie d'utiliser Presto sur un compartiment Amazon S3, mais je n'ai pas trouvé beaucoup d'informations connexes sur Internet.Presto sur Amazon S3
J'ai installé Presto sur une micro-instance mais je n'arrive pas à comprendre comment je pourrais me connecter à S3. Il y a un seau et il y a des fichiers dedans. J'ai un serveur métastore de ruche en cours d'exécution et je l'ai configuré dans presto hive.properties. Mais quand j'essaie d'exécuter la commande LOCATION dans la ruche, cela ne fonctionne pas.
IT renvoie une erreur indiquant que le type de schéma de fichier s3 est introuvable.
Et aussi je ne sais pas pourquoi nous devons lancer hadoop mais sans hadoop la ruche ne fonctionne pas. Y a-t-il une explication à cela?
This et this sont les documentations que j'ai suivies lors de la configuration.
Merci pour votre réponse. Je veux essayer presto avec absolument aucun coût associé. S'il vous plaît vérifier les modifications, j'ai eu plus de doutes après avoir parcouru le matériel pertinent que vous venez de mentionner. – Codex
Avec Amazon EMR, j'encaissais des coûts, donc j'essaie d'éviter cela. Y a-t-il un moyen de contourner cela? – Codex
J'ai écrit le [post] suivant (http://blog.danielcorin.com/code/2016/04/11/querying-s3-with-presto.html) l'année dernière sur le sujet. Je n'ai pas essayé la configuration depuis mais il y a une chance que cela puisse aider. L'idée générale est d'utiliser un conteneur Docker en tant que métastore Hive. Vous n'avez donc pas besoin d'un service géré comme EMR uniquement pour le routage de vos requêtes Presto. –