Je souhaite télécharger des données de Google Cloud Storage vers BigQuery, mais je ne trouve aucun exemple de code Java décrivant comment procéder. Est-ce que quelqu'un pourrait me donner un indice sur la façon de faire cela? Ce que je veux réellement faire est de transférer des données des tables de Google App Engine à BigQuery (et de les synchroniser quotidiennement), afin que je puisse faire une analyse. J'utilise le service Google Cloud Storage dans Google App Engine pour écrire de (nouveaux) enregistrements dans Google Cloud Storage. La seule partie manquante consiste à ajouter les données aux tables dans BigQuery (ou à créer une nouvelle table pour la première écriture). Certes, je peux télécharger/ajouter manuellement les données en utilisant l'outil de navigateur BigQuery, mais je voudrais qu'il soit automatique, sinon je dois le faire manuellement tous les jours.Charger des données de Google Cloud Storage vers BigQuery en utilisant Java
2
A
Répondre
4
Je ne connais pas d'exemples Java pour le chargement de tables de Google Cloud Storage dans BigQuery. Cela dit, si vous suivez les instructions pour l'exécution des travaux de requête here, vous pouvez exécuter un travail de charge à la place avec le folowing:
Job job = new Job();
JobConfiguration config = new JobConfiguration();
JobConfigurationLoad loadConfig = new JobConfigurationLoad();
config.setLoad(loadConfig);
job.setConfiguration(config);
// Set where you are importing from (i.e. the Google Cloud Storage paths).
List<String> sources = new ArrayList<String>();
sources.add("gs://bucket/csv_to_load.csv");
loadConfig.setSourceUris(sources);
// Describe the resulting table you are importing to:
TableReference tableRef = new TableReference();
tableRef.setDatasetId("myDataset");
tableRef.setTableId("myTable");
tableRef.setProjectId(projectId);
loadConfig.setDestinationTable(tableRef);
List<TableFieldSchema> fields = new ArrayList<TableFieldSchema>();
TableFieldSchema fieldFoo = new TableFieldSchema();
fieldFoo.setName("foo");
fieldFoo.setType("string");
TableFieldSchema fieldBar = new TableFieldSchema();
fieldBar.setName("bar");
fieldBar.setType("integer");
fields.add(fieldFoo);
fields.add(fieldBar);
TableSchema schema = new TableSchema();
schema.setFields(fields);
loadConfig.setSchema(schema);
// Also set custom delimiter or header rows to skip here....
// [not shown].
Insert insert = bigquery.jobs().insert(projectId, job);
insert.setProjectId(projectId);
JobReference jobRef = insert.execute().getJobReference();
// ... see rest of codelab for waiting for job to complete.
Pour plus d'informations sur l'objet de configuration de charge, voir la javadoc here.
Questions connexes
- 1. Charger des données de Google Cloud Storage vers BigQuery en utilisant Java
- 2. Comment télécharger des images/vidéos vers Google Cloud Storage en utilisant Java
- 3. Interopérabilité Google Cloud Storage
- 4. exporter des tables de google bigquery à google storage
- 5. Supprimer des fichiers de Google Cloud Storage
- 6. Google Drive/Google Cloud Storage
- 7. Liste de fichiers de google cloud storage
- 8. Google Cloud Storage avec get_serving_url
- 9. Télécharger un fichier depuis un formulaire HTML via Servlet vers Google Cloud Storage (en utilisant la bibliothèque client Google Cloud Storage pour Java)
- 10. Google Cloud Storage avec gspythonlibrary
- 11. Comparaison de Blobstore et Google Cloud Storage
- 12. Système de gestion de documents utilisant Google Cloud Storage
- 13. Comment télécharger une image vers Google Cloud Storage dans Android?
- 14. Comment exporter des données interrogées à partir de Google Cloud Datastore vers csv en utilisant Java?
- 15. fichiers Google App Engine sur Cloud Storage
- 16. Limite budgétaire de Google Cloud Storage
- 17. Google Cloud Storage Java Client Library avec Gradle
- 18. Google Cloud Storage (GCS) Erreur 200 sur Chunk non-finale
- 19. Authentification Google Cloud Storage pour App Engine
- 20. Wordpress BackWPup et Google Cloud Storage
- 21. Bibliothèque C/C++ pour Google Cloud Storage
- 22. Google Cloud Storage télécharger des fichiers modifiés aujourd'hui
- 23. Insert Google BigQuery utilisant POST
- 24. Cloud Storage Transfer "Failed"
- 25. Performance de Google Cloud Storage et recherche de texte intégral
- 26. Impossible de transférer des fichiers du projet GAE vers Google Cloud Storage à l'aide de la bibliothèque client GCS + java
- 27. Télécharger des fichiers .raw à Google Cloud Storage
- 28. cache express flux d'images de Google Cloud Storage
- 29. Comment raccourcir les URL de téléchargement signées Google Cloud Storage?
- 30. Google Cloud Storage - Set Acl pour Google Compute Engine
Merci beaucoup pour votre code. Je l'ai essayé et ça a très bien marché. Pour que cet extrait soit utile à plus de gens, il y a quelques fautes d'orthographe mineures, et ce sera formidable si vous pouviez le réviser un peu. 1. Ligne 3 "JobConfigurationQLoad" devrait être "JobConfigurationLoad"; 2. Jobs.insert() fonction nécessite deux paramètres et le premier paramètre est une chaîne (même si cela n'a pas d'importance ce que vous mettez là); 3. Dans la dernière ligne de code, je pense que vous voulez dire "JobReference jobRef" au lieu de "jobId". Merci encore! –
Le code a été mis à jour avec les modifications que vous avez suggérées. Merci pour les commentaires. –