Gestion de mémoire CUDA vs. CuBlas

J'ai remarqué que je peux utiliser des blocs de mémoire pour des matrices allouées en utilisant la fonction cudamalloc() ou cublasalloc() pour appeler les fonctions cublas. Les taux de transfert matriciels et de calcul sont plus lents pour les tableaux alloués en utilisant cudamalloc() plutôt que cublasalloc(), bien qu'il y ait d'autres avantages à utiliser des tableaux en utilisant cudamalloc(). Pourquoi est-ce le cas? Ce serait bien d'entendre quelques commentaires.Gestion de mémoire CUDA vs. CuBlas

Source

2009-11-05 stanigator

Voyez-vous cela lorsque vous travaillez avec des flotteurs, des doubles ou les deux? Cela pourrait être un problème d'alignement ('cudaAlloc()' prend un argument 'elemSize', mais' cudaMalloc() 'ne l'est pas). – Gabriel

Je travaillais avec des flotteurs dans les deux cas. Je n'ai pas vu cela en double car je n'ai pas besoin de travailler avec des doubles dans mon application. Je vais vérifier avec cudaAlloc en même temps. – stanigator

Btw, Gabriel, voulez-vous dire '' cublasAlloc() '' plutôt que '' cudaAlloc() ''? – stanigator

cublasAlloc est essentiellement une enveloppe autour de cudaMalloc() donc il ne devrait y avoir aucune différence, y a-t-il autre chose qui change dans votre code?

Source

2009-11-19 10:38:26 Tom

Gestion de mémoire CUDA vs. CuBlas

Répondre

Questions connexes