J'analyse Agner Fog's "Optimizing subroutines in assembly language: An optimization guide for x86 platforms". Surtout j'essaie de comprendre le chapitre 12.7. Et il y a un problème que je ne peux pas comprendre. L'auteur écrit:Motif de l'instruction de décodage
Le décodage d'instructions dans le processeur PM suit le modèle 4-1-1. Le modèle de (fusionné) μops pour chaque instruction de la boucle dans l'exemple 12.6b est 2-2-2-2-2-1-1-1. Ce n'est pas optimal, et il faudra 6 cycles d'horloge pour décoder. Ceci est plus que le temps de retrait, donc nous pouvons conclure que le décodage d'instruction est le goulot d'étranglement dans l'exemple 12.6b. La durée totale d'exécution est de 6 cycles d'horloge par itération ou de 3 cycles d'horloge par valeur Y [i] calculée.
- Qu'est-ce que cela signifie que le décodage d'instruction suit le schéma 4-1-1 et comment le savoir?
- Le motif de la boucle est 2-2-2-2-2-1-1-1. Ok, mais pourquoi il faut 6 cycles pour décoder je ne sais pas. Pourquoi?
merci :) Comment savoir modèle pour processeur patricular? – Gilgamesz
Le guide d'Agner devrait avoir quelques informations. Sinon, recherchez des articles sur l'architecture CPU sur Ars Technica – Nayuki
Pour certains processeurs Intel récents (Skylake et Haswell jusqu'à présent) - vous pouvez trouver une recherche détaillée du comportement de recherche d'instruction [dans cette réponse] (http://stackoverflow.com/a/39940932/149138). – BeeOnRope