2017-05-04 2 views
12

Je me demandais quelle est la meilleure pratique consistant à déplacer un documentDB vers Azure Data Lake Storage. Dois-je créer un fichier pour chaque document d'une collection ou déplacer tout le documentDB? Aussi, je n'ai pas trouvé beaucoup d'informations sur la façon dont je peux accéder au documentDB en utilisant U-SQL?Déplacement d'une collection DocumentDB vers Azure Data Lake Storage

Une contribution serait appréciée.

+0

Je suppose que je dois demander pourquoi vous voulez faire cela? DocDB et ADL sont des outils différents à des fins différentes. Est-ce un mouvement permanent. Ou voulez-vous simplement copier les données dans ADL pour les rapports? Si oui, avez-vous envisagé d'utiliser des tables dans le service d'analyse Data Lake? –

+0

Pour le simplifier, j'ai un certain nombre de fichiers journaux qui sont envoyés à ADL. J'ai aussi un documentDB qui contient des informations supplémentaires pour chaque fichier (ne me demandez pas pourquoi mais c'est comme ça que ça se passe). Chaque fichier journal a donc un document documentdb correspondant. Le documentDB est stocké dans ADL en tant que fichier json. Je peux interroger le fichier json mais il semble que je ne peux pas le stocker en documentDB et l'interroger directement (ce qui serait mieux comme indexé). – reachify

Répondre

1

Vous ne pouvez actuellement pas utiliser U-SQL pour accéder aux données dans DocumentDB (ou maintenant appelé CosmosDB). Il existe une demande de fonctionnalité here. N'hésitez pas à ajouter votre vote. Si vous déplacez les données, l'organisation dépend de la façon dont vous voulez gérer les données (supprimer toutes les parties, ou seulement les parties?), Comment elle est structurée (conserver des données structurées similaires, soit dans le même fichier ou dans le même dossier).) et comment vous l'utilisez (toujours besoin de tout ou parties?) et ce qui vous donne les meilleures performances pour y accéder (les fichiers plus gros sont normalement meilleurs, mais s'ils sont JSON, assurez-vous également que le processus d'extraction fonctionne).