J'essaie de faire une multiplication matricielle entre une matrice 3x3 et une matrice 360x360. La plus petite matrice (3x3) va être manipulée avec le premier bloc (3x3) de la grande matrice et ainsi de suite. Par conséquent, je veux avoir ma matrice plus petite et la faire glisser sur ma plus grande matrice.cuda: multiplication de matrices en utilisant des matrices partagées et globales
Est-il possible de stocker ma matrice plus petite dans la mémoire partagée et ma plus grande matrice est divisée en 3x3 en global?
Je ne trouve pas un moyen de copier la plus petite matrice à partager directement à partir de l'hôte. Veuillez me corriger si ma visualisation de cuda est fausse.
Merci.
Vous ne pouvez pas copier dans la mémoire partagée de l'hôte. Ce n'est pas supporté. – talonmies