cub

    2La chaleur

    2Répondre

    J'essaye de faire une réduction de somme exclusive dans CUDA. J'utilise la bibliothèque CUB et j'ai décidé d'essayer le CUB :: DeviceReduce. Cependant, mon résultat est NaN, et je n'arrive pas à compr

    2La chaleur

    1Répondre

    J'utilise la fonction cub::DeviceScan et le sample code snippet a un paramètre temp_storage_bytes, qu'il utilise pour allouer de la mémoire (que, par ailleurs, l'extrait de code ne libère jamais). L'e

    0La chaleur

    1Répondre

    Est-il nécessaire d'appeler cudaDeviceSynchronize après l'appel d'une classe CUB à partir d'un noyau CUDA? Quand on utilise dire DeviceReduce :: Somme() de l'appareil, il y a des copies de mémoire imp