J'ai quelques noyaux CUDA que je veux exécuter dans des pthreads individuels.Passage du contexte cuda à des pthreads de travail
J'ai fondamentalement besoin que chaque pthread exécute, disons 3 noyaux cuda, et qu'ils soient exécutés séquentiellement. Je pensais que j'essaierais de faire passer chaque pthread une référence à un flux, et donc chacun de ces 3 noyaux cuda s'exécuterait tous séquentiellement, dans le même flux.
Je pourrais obtenir ceci fonctionnant avec un contexte différent pour pthread, qui exécuterait alors les noyaux comme normal, mais cela semble prendre beaucoup de frais généraux.
Comment faire en sorte que chaque pthread fonctionne dans le même contexte, en même temps que les autres pthreads?
Merci