J'ai lu qu'il y avait 100X accélération sur certains problèmes lorsque vous utilisez GPU NVIDIA au lieu de CPU.
quels sont les meilleurs moments d'accélération de performance en utilisant cuda sur différents problèmes.
veuillez indiquer le problème et le facteur d'accélération ainsi que les liens pour les documents si possible.Cuda GPU optimisation
Répondre
Voici quelques exemples frappants de sciences naturelles:
Ab initio de chimie quantique (TeraChem): jusqu'à 50x
simulations de dynamique moléculaire (HOOMD): jusqu'à 32x
visualisation moléculaire de orbitals avec VMD: 20x-100x
Plus se trouve ici:
http://www.nvidia.com/object/tesla_bio_workbench.html
documents se trouvent dans le lien. Malheureusement, je ne pouvais pas montrer plus de liens directs, puisque mon statut (nouveau compte) ne permet pas plus de un hyperlien. Merci.
Je prendrais ces chiffres avec un grain de sel. L'omission la plus flagrante - la simple précision contre la double précision sur le processeur, ce qui, pour de nombreuses applications, rend les résultats suspects au mieux – Anycorn
D'accord. Non que je préconise une seule précision: Cependant, une critique générale doit être renforcée par des exemples concrets où la précision unique ne fonctionne pas. Après tout, l'addition à virgule flottante n'est pas une opération associative - dans n'importe quel contexte d'exécution parallèle, cela compte beaucoup. – artaak
mon arrière-plan est la chimie, où la précision doit être '10^-8'. Pour de telles applications, l'utilisation de la simple précision est une mauvaise option à mon avis. Dans certaines applications chimiques, même une double précision n'est pas suffisante, dans le cas d'une récurrence longue. – Anycorn
Vérifiez la vitrine communautaire CUDA: http://www.nvidia.com/object/cuda_showcase_html.html
Gumerov a pu accélérer le FMM pour le potentiel de Laplace jusqu'à ~ 70x. Vous pouvez lire son excellent papier here (pdf).
Cependant, ces résultats sont généralement plutôt insignifiants. Par exemple, l'Intel Core i7 980 XE est évalué à 109GFLOPS, tandis que le Nvidia GTX 480 atteint 672 GFLOPS. Si les deux architectures sont pleinement utilisées, l'accélération maximale possible serait d'environ 6 fois. Bien sûr, pour certains problèmes, il est facile d'obtenir une utilisation élevée sur le GPU mais dur sur le processeur.
- 1. nVidia CUDA sur GPU avec interface PCI
- 2. CUDA: La copie de mémoire vers GPU 1 est plus lente dans multi-GPU
- 3. CPU et GPU minuterie dans profileur visuelle cuda
- 4. Optimisation des échanges d'éléments vectoriels en utilisant CUDA
- 5. Développement CUDA et web
- 6. Le moyen le plus simple de tester l'existence d'un GPU compatible cuda de cmake?
- 7. Concurrence, 4 applications CUDA en concurrence pour obtenir des ressources GPU
- 8. Comment exécuter du code MATLAB sur le GPU en utilisant CUDA?
- 9. Lancement simultané de plusieurs noyaux en utilisant CUDA pour un GPU
- 10. CUDA - Erreur de bus
- 11. Libérer la mémoire CUDA lentement lente
- 12. CUDA Linking erreur Visual Studio 2008
- 13. Sélection de périphérique cuda avec plusieurs threads cpu
- 14. Débutant à la programmation GPU: quoi apprendre?
- 15. printf inside CUDA __global__ function
- 16. OpenCL ou CUDA Quelle route y aller?
- 17. Logiciel de surveillance GPU
- 18. Détection de chipset GPU
- 19. Traitement d'image sur GPU
- 20. Impossible de tuer le noyau défectueux fonctionnant sur NVIDIA GPU
- 21. J'ai un GPU Nvidia, comment puis-je coder dessus?
- 22. nvidia cuda en utilisant tous les cœurs de la machine
- 23. Programmation CUDA
- 24. Arrêtez tous les processus CUDA sous Linux sans redémarrer l'ordinateur?
- 25. Optimisation
- 26. Est-il possible d'exécuter un noyau cuda sur plusieurs gpus
- 27. Quelle bibliothèque utilisez-vous pour les calculs matriciels sur CUDA?
- 28. OpenCL et GPU programmation Roadmap
- 29. les algorithmes graphiques sur GPU
- 30. En utilisant openMP dans le code hôte cuda?
Eh bien, cela dépend totalement du matériel dont vous disposez. La carte graphique la plus récente et le processeur le plus ancien et vous aurez une énorme augmentation des performances sur les opérations en virgule flottante, je suppose. – Jonas
j'ai besoin des derniers résultats ... sur les nouveaux GPUs – ghrayeb
Je recommanderais l'aller avec OpenCL que CUDA. – Jonas