Comment ces deux tailles de blocs (1024x1 vs 32x32) sont-elles censées fonctionner à partir de la planification des threads et de la perspective de bande passante mémoire? Y a-t-il une différence de performance attendue de ces 2 tailles de blocs? Notez que les deux utilisent 1024 threads par bloc.Y aurait-il une différence de performance pour CUDA blocksize 1024x1 vs 32x32?
4
A
Répondre
3
Les dimensions des blocs de threads, en particulier lorsque nous parlons du même nombre de threads par bloc, n'affectent pas les performances.
Les fils sont toujours grouped for execution into warps. Le seul effet direct des cotes threadblock est de changer les variables intégrées par ex. threadIdx.x
, blockIdx.x
, etc. qui sont transmis à chaque thread, ce qui n'est pas un problème de performance.
+0
Cela a du sens. Merci pour la perspicacité! – FundamentalAxiom
Questions connexes
- 1. Problème de performance CUDA
- 2. CUDA test de performance
- 3. opérateur BETWEEN vs> = AND <=: Y a-t-il une différence de performance?
- 4. Utiliser avec vs déclarer une table temporaire: performance/différence?
- 5. Asp.net Vs Php Performance
- 6. Performance pour myCollection.Add() vs myCollection ["key"]
- 7. itération sql vs group by, différence de performance massive
- 8. Performance: Pig vs Hive
- 9. CUDA bande passante théorique vs bande passante effective
- 10. Compteur de performance vs ETW
- 11. Y a-t-il une différence de performance entre ces deux algorithmes pour mélanger un IEnumerable?
- 12. Y at-il une différence de performance entre Begin * et * Async pour les sockets dans .NET?
- 13. LINQ Tout vs Performance Existant
- 14. .Net vs C++ (performance)
- 15. performance d'adapterIntegrate vs intégrer
- 16. numpy np.array vs np.matrix (performance)
- 17. différence de performance C# foreach pour LINQ
- 18. Javascript Performance this. vs varname. pour l'accès aux propriétés
- 19. WPF DataContext vs ItemsSource Performance
- 20. performance: ruby CSV.foreach vs CSV.parse
- 21. MonoTouch - Foreach vs pour les boucles (performance)
- 22. OpenCL ou CUDA Quelle route y aller?
- 23. économiseur d'écran blesse la performance CUDA?
- 24. Performance de sprintf vs String.Format
- 25. Gestion de mémoire CUDA vs. CuBlas
- 26. Qt vs performance GTK +
- 27. Y a-t-il une différence de performance ou de fonctionnalité entre ces deux instructions SQL?
- 28. Comment créer une DLL CUDA?
- 29. Generics vs Performance de l'objet
- 30. Y a-t-il une différence de performance entre ces deux morceaux de code?
Le nombre d'opérations ALU associées à l'indexation peut avoir un impact sur les performances, mais il s'agit souvent d'un pourcentage mineur du total des instructions exécutées. Ecrivez le code dans les deux sens et différez l'assemblage. –