CUDA: Un SM peut-il alterner alternativement des warps provenant de différents blocs?

Supposons qu'un SM a été rempli avec 8 blocs de 64 threads chacun.CUDA: Un SM peut-il alterner alternativement des warps provenant de différents blocs?

Cela nous donne 2 warps/block, et 16 warps au total. Les SM peuvent alterner entre les warps afin de cacher les latences. Ces chaînes doivent-elles appartenir au même bloc, ou une chaîne du bloc 5 peut-elle être remplacée par une chaîne du bloc 8, par exemple?

Source

2017-02-09 ismarlowe

Oui, le planificateur SM peut "alterner" ou choisir des déformations pour la planification à partir de n'importe quel résident de ce SM. Le fait que les SM ont une charge de distorsion maximale possible (64, actuellement, pour certains GPU) ou charge de thread (2048, actuellement, pour certains GPU) dépasse la limite possible d'un seul bloc (1024, actuellement, pour tous les GPU supportés par les toolkits CUDA récents) sont pour que le SM puisse choisir des warps de différents blocs pour la planification, pour améliorer les possibilités de dissimulation de la latence.

Source

2017-02-09 16:50:42

CUDA: Un SM peut-il alterner alternativement des warps provenant de différents blocs?

Répondre

Questions connexes