Supposons qu'un SM a été rempli avec 8 blocs de 64 threads chacun.CUDA: Un SM peut-il alterner alternativement des warps provenant de différents blocs?
Cela nous donne 2 warps/block, et 16 warps au total. Les SM peuvent alterner entre les warps afin de cacher les latences. Ces chaînes doivent-elles appartenir au même bloc, ou une chaîne du bloc 5 peut-elle être remplacée par une chaîne du bloc 8, par exemple?