Je n'ai jamais utilisé CUDA ou C++ auparavant, mais j'essaie d'obtenir le GPU de Ramses (http://www.maisondelasimulation.fr/projects/RAMSES-GPU/html/download.html en cours d'exécution.) En raison d'une erreur dans le fichier autogen.sh j'ai utilisé ./ configurer et a obtenu celui-ci travaille Ainsi, le makefile produit contient les drapeaux FPUNV suivants NVCCFLAGS = -gencode=arch=compute_10,code=sm_10 -gencode=arch=compute_11,code=sm_11 -gencode=arch=compute_13,code=sm_13 -gencode=arch=compute_20,code=sm_20 -gencode=arch=compute_20,code=compute_20 -use_fast_math -O3
Mais lorsque je tente de compiler le programme à l'aide faire, je reçois plusieurs erreurs: ptxas.CUDA ptxas Erreur "la fonction utilise trop de données partagées"
Entry function '_Z30kernel_viscosity_forces_3d_oldPfS_S_S_iiiiiffff' uses too much shared data (0x70d0 bytes + 0x10 bytes system, 0x4000 max) Entry function '_Z26kernel_viscosity_forces_3dPfS_S_S_iiiiiffff' uses too much shared data (0x70d0 bytes + 0x10 bytes system, 0x4000 max) Entry function '_Z32kernel_viscosity_forces_3d_zslabPfS_S_S_iiiiiffff9ZslabInfo' uses too much shared data (0x70e0 bytes + 0x10 bytes system, 0x4000 max)
Je suis en train de compiler ce code sur Linux avec Kernel 2.6 et CUDA 4.2 (j'essaie de le faire dans mon université et ils ne mettent pas à niveau régulièrement) sur deux NVIDIDA C1060. sm_10, sm_11 et sm_13 par sm_20, (j'ai vu cette correction ici: Entry function uses too much shared data (0x8020 bytes + 0x10 bytes system, 0x4000 max) - CUDA error) mais cela n'a pas résolu mon problème. Avez-vous des suggestions? Je peux télécharger le Makefile ainsi que tout le reste, si vous en avez besoin. Nous vous remercions de votre aide!
Peut-être que le message d'erreur est correct et que vous essayez d'utiliser trop de mémoire partagée pour la carte GPU que vous avez installée? –