2010-03-10 3 views
1

J'ai lu qu'il y avait 100X accélération sur certains problèmes lorsque vous utilisez GPU NVIDIA au lieu de CPU.
quels sont les meilleurs moments d'accélération de performance en utilisant cuda sur différents problèmes.
veuillez indiquer le problème et le facteur d'accélération ainsi que les liens pour les documents si possible.Cuda GPU optimisation

+0

Eh bien, cela dépend totalement du matériel dont vous disposez. La carte graphique la plus récente et le processeur le plus ancien et vous aurez une énorme augmentation des performances sur les opérations en virgule flottante, je suppose. – Jonas

+0

j'ai besoin des derniers résultats ... sur les nouveaux GPUs – ghrayeb

+1

Je recommanderais l'aller avec OpenCL que CUDA. – Jonas

Répondre

3

Voici quelques exemples frappants de sciences naturelles:

Ab initio de chimie quantique (TeraChem): jusqu'à 50x
simulations de dynamique moléculaire (HOOMD): jusqu'à 32x
visualisation moléculaire de orbitals avec VMD: 20x-100x

Plus se trouve ici:
http://www.nvidia.com/object/tesla_bio_workbench.html
documents se trouvent dans le lien. Malheureusement, je ne pouvais pas montrer plus de liens directs, puisque mon statut (nouveau compte) ne permet pas plus de un hyperlien. Merci.

+0

Je prendrais ces chiffres avec un grain de sel. L'omission la plus flagrante - la simple précision contre la double précision sur le processeur, ce qui, pour de nombreuses applications, rend les résultats suspects au mieux – Anycorn

+0

D'accord. Non que je préconise une seule précision: Cependant, une critique générale doit être renforcée par des exemples concrets où la précision unique ne fonctionne pas. Après tout, l'addition à virgule flottante n'est pas une opération associative - dans n'importe quel contexte d'exécution parallèle, cela compte beaucoup. – artaak

+0

mon arrière-plan est la chimie, où la précision doit être '10^-8'. Pour de telles applications, l'utilisation de la simple précision est une mauvaise option à mon avis. Dans certaines applications chimiques, même une double précision n'est pas suffisante, dans le cas d'une récurrence longue. – Anycorn

0

Gumerov a pu accélérer le FMM pour le potentiel de Laplace jusqu'à ~ 70x. Vous pouvez lire son excellent papier here (pdf).

Cependant, ces résultats sont généralement plutôt insignifiants. Par exemple, l'Intel Core i7 980 XE est évalué à 109GFLOPS, tandis que le Nvidia GTX 480 atteint 672 GFLOPS. Si les deux architectures sont pleinement utilisées, l'accélération maximale possible serait d'environ 6 fois. Bien sûr, pour certains problèmes, il est facile d'obtenir une utilisation élevée sur le GPU mais dur sur le processeur.

Questions connexes