J'essaie de comprendre pourquoi une requête BigQuery prend tellement de temps.vitesse BigQuery - temps de __SHUFFLE1_REPARTITION0
Il ya quelques messages sur l'interprétation de la sortie de Explanation
, mais n'a rien trouvé pour vous aider à comprendre ce qui se passe dans ce cas.
Vous ne savez pas pourquoi lire depuis __PSRC___SHUFFLE2_0
et écrire au __SHUFFLE2_REPARTITION0
prendrait tellement de temps? Est-ce repartitionnement par une nouvelle clé? (Bien que l'étape précédente, 13, a également été écrit par HASH($290)
Cela prend actuellement environ 200s sur un échantillon de nos données, dont 70% est consacré à cette étape.
(je ne peux pas poster toute requête ici, si je pouvais poster une version expurgée si utile.)
Les étapes 2 et 5 sont intéressantes. L'étape 2 va de 2M lignes à 7M et l'étape 5 reçoit 10 M lignes avec une sortie de 140M. Je suspecte des jointures explosives. Quelle est la taille de la taille des données interrogées? –