Je viens de passer de CUDA 4 à 5 et j'ai installé la version 5.0 de CUDA sur Ubuntu 12.04, mais les performances ont considérablement baissé. Un noyau CUDA particulier qui prenait auparavant 1 seconde prend 6 secondes. Il semble que le nouveau pilote est le coupable puisque lorsque j'ai réinstallé l'ancienne performance du pilote 4 est retrouvé, mais je ne sais pas pourquoi. Quelqu'un at-il rencontré des problèmes similaires?Pilote CUDA 5.0 lent
0
A
Répondre
2
Toutes mes excuses pour prendre si longtemps pour revenir ..
Je trouve que le principal coupable était __threadfence(). Pas bien comprendre son utilisation que j'écrivais quelque chose comme
__threadfence()
__syncthreads()
Sur les nouveaux pilotes Cela prenait beaucoup de temps supplémentaire
Je travaille sur GTX680
Merci beaucoup Daniel
Questions connexes
- 1. API du pilote CUDA: Où est nvcuda?
- 2. CUDA 5.0 Fichiers d'en-tête
- 3. Pilote CUDA crashé du programme
- 4. count3 dans cuda est très lent
- 5. Problème avec le pilote Mac Caffe CUDA
- 6. Que fait le pilote nVIDIA CUDA exactement?
- 7. CUDA 5.0: CUBIN et CUBLAS_device, capacité de calcul 3.5
- 8. Quel est le nombre de registres dans CUDA CC 5.0?
- 9. L'appel de pilote Cuda renvoie l'erreur 1 (cudaErrorMissingConfiguration)
- 10. Le programme CUDA provoque le plantage du pilote nvidia
- 11. API Cuda Runtime et questions API de pilote
- 12. Transmission directe du programme PTX au pilote CUDA
- 13. programme de copie de la matrice Cuda est très lent
- 14. Ajout de pas de vecteur plus lent sur cuda
- 15. Cuda cudaMemcpy et cudaMalloc
- 16. projet simple CUDA Netbeans reliant problème
- 17. Erreur compilation CUDA noyau
- 18. CUDA versions confusion
- 19. Causée par: java.lang.NumberFormatException: Double invalide: "[" 5.0 "," 5.0 "]"
- 20. CUDA plugin dlopen
- 21. Configuration du noyau Cuda
- 22. Cuda erreur spécifique:% s
- 23. multiplication matricielle en cuda
- 24. Les fonctions de vote CUDA Warp rendent le code plus lent?
- 25. Comment exécuter et comprendre CUDA Visual Profiler?
- 26. CUDA 5 compatible avec CUDA 4
- 27. Erreur avec 'cuda-memcheck' dans cuda 8.0
- 28. CUDA 5 et CUDA 4.2 en parallèle
- 29. Blocage d'invocation du noyau CUDA?
- 30. Erreur de compilation CUDA SDK
Les statistiques du compilateur pour ce noyau sont-elles sensiblement différentes entre CUDA 4.0 et CUDA 5.0 (nombre de registres, emplacements de déversements, etc.)? Ajoutez -Xptxas -v à votre ligne de commande nvcc pour voir les statistiques. Comment mesurez-vous le temps d'exécution du noyau? Un moyen simple de le mesurer consiste à exporter CUDA_PROFILE = 1 pour activer le profilage simple, puis inspecter le fichier journal résultant. Cela montrera également l'occupation du noyau. Voyez-vous des différences d'occupation entre les deux versions de CUDA? Quel GPU êtes-vous? – njuffa
En général, cette question nécessite beaucoup plus d'informations pour être responsable. – harrism