2017-05-16 1 views
0

Nous travaillons avec des tables U-SQL et nous avons des questions liées à l'index clusterisé. Dans la table U-SQL, le parallélisme est géré par la manière dont les données sont partitionnées et distribuées. L'index clusterisé affecte-t-il également le parallélisme dans la table U-SQL? Deuxièmement comment il gère l'asymétrie de données dans un compartiment de distribution?L'index clusterisé dans la table U-SQL affecte-t-il le parallélisme?

Répondre

0

L'index clusterisé n'a pas d'incidence sur le parallélisme en tant que tel, mais il peut avoir un impact si vous lisez les données à l'aide d'une recherche d'index ou d'un index en fonction du prédicat de requête. Cela affecte donc les performances d'accès aux données à l'intérieur d'un sommet.

L'inclinaison de données n'est pas gérée. Si vous avez un biais, vous devrez soit trouver une meilleure clé de distribution, soit utiliser un indice skewfactor, soit utiliser la distribution ROUND ROBIN.