Dans Intel Xeon Phi, il existe 32 registres vectoriels de 512 bits par cœur. Chaque registre vectoriel peut effectuer 16 opérations en virgule flottante à simple précision par cycle. Et 2 opérations peuvent être effectuées en 1 cycle (1 dans le v-pipe et 1 dans le u-pipe).Nombre de multiplications par cycle d'horloge sur Intel Xeon Phi
Je veux savoir combien de multiplications scalaires peuvent être faites dans un cycle d'horloge en dehors des multiplications vectorielles effectuées dans les registres vectoriels.
Merci. Pouvez-vous s'il vous plaît partager un lien qui dit, 2 opérations vectorielles par cycle par noyau peuvent être faites dans Xeon Phi. Et quand nous disons 2 opérations vectorielles, cela signifie-t-il que les deux sont des opérations vectorielles de 512 bits? – arunmoezhi
@sssylvester ne voulez-vous pas dire FMA plutôt que MADD? – damienfrancois