Il existe deux façons d'insérer des informations dans Amazon Redshift:
- Via la commande
COPY
- Via
INSERT
déclarations
Il est pas recommandé d'utiliser INSERT
déclarations parce qu'ils sont pas efficace pour les grands volumes de données. Ils sont autorisés à effectuer des processus de type ETL tels que la copie de données entre des tables, mais en règle générale, les données doivent être chargées via COPY
.
Comme par Using a COPY Command to Load Data, la commande COPY
peut charger des données à partir de:
- Amazon S3 (recommandé, hautement parallèle)
- Amazon EMR (Hadoop)
- Amazon DynamoDB
- Via SSH de distance hôtes
La charge d'Amazon S3 est effectuée en parallèle sur tous les nœuds et est le moyen le plus efficace pour charger des données.
Le Amazon Redshift COPY command peut lire plusieurs formats de fichiers:
- Délimité (par exemple CSV)
- Largeur fixe
- AVRO
- JSON
- Et ces formats peuvent également être compressés (par exemple gzip)
Bottom line: Obtenez vos données dans Amazon S3 dans un format compatible, puis utilisez COPY
pour le charger.
Essayez également de comprendre les codes DISTKEY
et SORTKEY
pour bénéficier pleinement des avantages de Redshift. Bien lire le manuel - il vous fera gagner plus de temps qu'il n'en faut pour lire!
Vous voulez mettre des données dans Redshift? Oui, vous devez utiliser S3 et exécuter une commande COPY. Plusieurs documentations disponibles. –
@JonEkiz il n'y a pas d'autre moyen? – Frollo