2013-10-09 2 views
0

Dans Intel Xeon Phi, il existe 32 registres vectoriels de 512 bits par cœur. Chaque registre vectoriel peut effectuer 16 opérations en virgule flottante à simple précision par cycle. Et 2 opérations peuvent être effectuées en 1 cycle (1 dans le v-pipe et 1 dans le u-pipe).Nombre de multiplications par cycle d'horloge sur Intel Xeon Phi

Je veux savoir combien de multiplications scalaires peuvent être faites dans un cycle d'horloge en dehors des multiplications vectorielles effectuées dans les registres vectoriels.

Répondre

1

Quelques idées fausses ici. Il y a 1 unité vectorielle par cœur. Les registres stockent les valeurs, ils ne calculent pas. Ainsi, vous pouvez exécuter 1 512 octets d'opérations vectorielles étendues par cycle et par cœur. Vous pouvez également faire une multiplication scalaire en 1 cycle. Vous ne pouvez pas émettre les deux en même temps. En utilisant les tubes & v, vous pouvez exécuter une opération vectorielle ou scalaire, puis une opération de mémoire dans l'autre canal. Vous pouvez également effectuer une instruction MADD (fusion multiple-added) par cycle, ce qui vous donne 2 opérations vectorielles par cycle et par cœur.

+0

Merci. Pouvez-vous s'il vous plaît partager un lien qui dit, 2 opérations vectorielles par cycle par noyau peuvent être faites dans Xeon Phi. Et quand nous disons 2 opérations vectorielles, cela signifie-t-il que les deux sont des opérations vectorielles de 512 bits? – arunmoezhi

+1

@sssylvester ne voulez-vous pas dire FMA plutôt que MADD? – damienfrancois

Questions connexes