Довольно давно уже бьюсь с такой проблемой. Есть 8 серверов, на каждом хостится по 40 виртуалок. Везде Centos 7. Иногда эти виртуалки стартуют одновременно и начинают в себя устанавливать пакеты - драйвера фс и собранное под них ядро. При этом иногда одна-две виртуалки внезапно не осиливают установку, которая валится с якобы ошибками зависимостей, примерно так
Error: Package: kmod-lustre-2.12.4.2_205.el7.x86_64 (/kmod-lustre-2.12.4.2_205_3.10.0_957.1.3.x4.4.40.x86_64)
Requires: ksym(ib_query_port) = 0xc9ab4f08
Error: Package: kmod-lustre-2.12.4.2_205.el7.x86_64 (/kmod-lustre-2.12.4.2_205_3.10.0_957.1.3.x4.4.40.x86_64)
Requires: ksym(rdma_bind_addr) = 0x19ea6b1f
Error: Package: kmod-lustre-2.12.4.2_205.el7.x86_64 (/kmod-lustre-2.12.4.2_205_3.10.0_957.1.3.x4.4.40.x86_64)
Requires: ksym(ib_register_event_handler) = 0x749f0a70
Выглядит как попытка поставить модули под чужое ядро, но ядро гарантированно правильное. Другие точно такие же виртуалки ставятся успешно и если потом зайти на проблемную и сделать yum install руками - всё ставится без проблем.
Вероятность падения - около 0.5%. Может и меньше. Воспроизвести проблему при одиночном запуске не получается - то ли мало пытался, то ли проблема свойственна массовым одновременным запускам. Виртуалки (kvm) живут на отдельных ssd, репозитории все локальные, памяти на хостах полно.
У меня две версии, обе дурацкие - то ли это баг yum/rpm и я его ловлю просто по закону больших чисел, то ли где-то есть узкое место, которое проявляется таким странным образом. Но как например высокий i/o на хосте или сетевые проблемы, или затыки на стороне локального зеркала с репозиториями могут ломать именно разрешение зависимостей?