вот тут вот, например
https://habrahabr.ru/post/254121/
есть результаты тестирования си и асма, и делается парадоксальный вывод:
Скорость работы программ на ассемблере может быть более 50% медленнее, чем программ на си/си++, скомпилированных с максимальной оптимизаций;
как это может быть, если си сам транслируется в тот же самый ассемблер?
UPD. поситал там внизу комментарии, действительно, автор написал бред. Дело в криворукости и трудности оптимизации ассемблерного кода, видимо.
В общем, назрел еще вопрос. Насколько в общем случае, приблизительно, грамотный код на си будет медленней грамотно оптимизированного, качественного кода на асме?