Процессоры уже в нулевых были странными, хотя бы тем, что имели свой набор микрокоманд (тот самый микрокод) и транслятор в них ассемблерных инструкций + отдельные подсистемы для разных видов задач (FPU, память, несколько ALU) со взаимодействием этих подсистем связан один из кейсов для реплея в NetBurst. Даже если тебе известны все проблемы в данной архитектуре, ты в большинстве случаев ничего не можешь сделать с высоты ассемблера, поскольку никто не знает, в каком порядке микрокоманды попадут в конвейер — енджой ёр спекулятивное выполнение. Сейчас они ещё более странные.
Производители процессоров ни с кем своими секретами не делятся, даже то, что я рассказываю про NetBurst, — это результаты реверса, опубликованного в 2005-м году; в официальной же документации написано очень уклончиво, что мол есть такая система и некоторый код может вызвать в ней некоторое падение производительности.
Вся документация и учебные курсы написаны на английском, на русском есть только редкие отрывочные сведения из того же Фидо, лол.
Так что выше тебе верно замечают, что делать процессоры и писать под них — это две разные вещи. Только в восьмибитках, вроде AVR, процессор делает ровно то, что ты ему сказал.