Je veux utiliser la mémoire __constant__
qui sera accessible par tous les threads dans tous mes noyaux.cudaMemcpyToSymbol ne pas copier les données
La déclaration est quelque chose comme ça
extern __constant__ float smooth [8 * 1024];
Je copie des données à cette variable en utilisant
cudaMemcpyToSymbol("smooth", smooth_local, smooth_size, 0, cudaMemcpyHostToDevice);
smooth_size = 7K octets
Il me donnait une sortie incorrecte
mais quand je l'ai exécuté en mode -deviceemu
et essayé pour imprimer le contenu de ces deux variables à l'intérieur du noyau, j'obtenais tous les zéros pour smooth et smooth_local était correct.
J'ai essayé d'imprimer la sortie juste après cudaMemcpyToSymbol
encore il me donnait des 0.
Pouvez-vous éclairer quelqu'un sur mon problème?
@Nishu, avez-vous résolu? – elect