J'ai un noyau qui fonctionne deux fois avec une taille de grille différente.CUDA, cuPrintf provoque "échec de lancement non spécifié"?
Mon problème est avec cuPrintf. Quand je n'ai pas cudaPrintfInit()
avant l'exécution du noyau et cudaPrintfDisplay(stdout, true)
et cudaPrintfEnd()
après l'exécution du noyau, je n'ai pas d'erreur mais quand je les mets là je reçois l'erreur "échec de lancement non spécifié".
Dans mon code de l'appareil, il n'y a qu'une seule boucle comme celui-ci pour l'impression:
if (threadIdx.x==0) {
cuPrintf("MAX:%f x:%d y:%d\n", maxVal, blockIdx.x, blockIdx.y);
}
J'utilise CUDA 4.0 avec une carte avec la capacité de cuda 2.0 et donc je compiler mon code avec cette syntaxe :
nvcc LB2.0.cu -arch=compute_20 -code=sm_20