LINUX.ORG.RU
ФорумTalks

⚡⚡⚡У процессоров AMD очередные проблемы

 


0

1

Процессоры AMD EPYC Rome зависают через 1044 дня непрерывной работы, и исправлять эту ошибку не будут

AMD обнародовала (PDF) информацию об ошибке, которая возникает у серверных процессоров EPYC 7002 Rome — она приводит к зависанию ядра после 1044 дней непрерывной работы. То есть для корректной работы сервер придётся перезагружать каждые 2,93 года. И исправлять эту ошибку в AMD не собираются.

Проблема связана с тем, что ядру не удаётся выйти из энергосберегающего режима CC6 (Core C6 State), который предусматривает понижение напряжения и снижение частоты при бездействии. AMD уточнила, что срок возникновения сбоя может зависеть от модуляции Spread Spectrum и опорной частоты REFCLK, которая помогает чипу отслеживать время.

Правдоподобную гипотезу о причине возникновения ошибки выдвинул пользователь Reddit acid_migrain. По его версии, ошибка в реальности проявляется не через 1044, а через 1042 дня и 12 часов. Timestamp Counter Scaling работает на частоте 2800 МГц. Путём нехитрых вычислений получается, что 2800 × 106 × 1042,5 приблизительно равно 0x3800000000000000 — здесь «слишком много нулей, чтобы это не было совпадением». У проблемы два простых решения: либо перезагружать сервер через каждые 1044 дня (исходя из информации AMD), либо отключить энергосберегающий режим CC6.

Процессоры серии AMD EPYC Rome вышли в 2018 году, и не исключено, что некоторые их владельцы уже сталкивались с этой проблемой. Производитель добавил, что исправлять ошибку не планирует — возможно, это потребовало бы слишком высоких затрат или она затрагивает не столь большое число клиентов.

Подробности

Ответ на: комментарий от targitaj

Конечно, я прав. Как ты был чайник, так ты и есть чайник. Мышевоз, поди. Из венды работает, поди.

Сам факт, что Oracle не юзает своё VB-поделие доказывает, что VB и KVM - проги для ИП-шников, у кого деняк нет на VMWare. Всё очевидно. ;)

xwicked ★★☆
()
Последнее исправление: xwicked (всего исправлений: 1)
Ответ на: комментарий от targitaj

Скажем так, этот баг значительно менее значителен

Он ОЧЕНЬ значителен, когда у тебя ни с того ни с сего повис сервак, и ты не знаешь из-за чего.

А если это парк серверов запущенных в разное время - то у тебя по сути каждые несколько часов зависает какой-то комп в датацентре, а ты не можешь ни понять ни найти.

Я не знаю как бы я среагировал честно говоря. Может обратил свой взор на ставшие в ряд планеты.

windows10 ★★★★★
()
Последнее исправление: windows10 (всего исправлений: 1)
Ответ на: комментарий от targitaj

VB вообще никак не связано с KVM и друг друга оно не использует.

Facepalm... Это не смежно даже. Как ты их логически связал, причём 2 раза? Я всё внятно объясняю. Все поняли, кроме тебя.
Для продвинутых линупсоедов объясняю на пялцах, что проги уровня ущербности типа KVM и VB не достойны внимания продакшона, поэтому их никто не пользует, только нищеброды ИП-шники, у которых на нормальные проги типа VmWare деняк не хватило.

Мышевоз, поди. Из венды работает, поди.

Спроси у Dimez'а, что я из линупса работаю и в офисе и дома. Я твой брат линупсоед. 😁

xwicked ★★☆
()
Ответ на: комментарий от targitaj

Иди матчать учи, ламер. Гугл на KVM работает, например.

Примеры пошли, после признания. Молодец. С этого нужно начинать, а то выглядишь глупо. Я не нашёл ничего внятного на тему использования KVM. Один сервис небось какой-нить работает сто пудова. Пойду искать.

xwicked ★★☆
()
Ответ на: комментарий от no-such-file

про твой ларёк

аммиачное производство 2-я категория электроснабжения

amd_amd ★★★★★
()
Ответ на: комментарий от xwicked

Для продвинутых линупсоедов объясняю на пялцах, что проги уровня ущербности типа KVM и VB не достойны внимания продакшона, поэтому их никто не пользует

Все хостинги используют KVM, закажи виртуалку в любом, в 99 из 100 случаев будет KVM. Amazon/Oracle/Rackspace/Hetzner/DO/Yandex (да любой назови) используют KVM в проде плотно и давно. Ты просто ничего не знающий, но с морей апломба, эникейщик.

Я всего 2 хостера встречал на vmware - aruba и забыл как назывался канадский говнохостинг, который обещал вечные виртуалки за $50, а в результате дико их оверселлил и потом начал всё равно требовать за них дополнительные деньги.

cloudatcost, во.

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 3)
Ответ на: комментарий от xwicked

Я не нашёл ничего внятного на тему использования KVM

В своём сортире в газетах искал, небось.

Dimez ★★★★★
()
Ответ на: комментарий от leave

Что было раньше - уже не особо интересно, ещё раньше был OVZ у всех. У селектела AFAIK есть всё под разных заказчиков: VMware, KVM, что угодно под клиентские запросы и деньги.

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 1)
Ответ на: комментарий от amd_amd

а пока заведут генератор - вечность пройдет

Зачем его заводить? Он сам умеет по сигналу от автоматики.

imul ★★★★★
()
Ответ на: комментарий от imul

по сигналу от автоматики

тогда сигнал этот должен прийти до того как вырубится электричество, что бы когда оно вырубилось - генератор уже вышел на рабочие обороты и перепада напряжения не произошло

amd_amd ★★★★★
()
Ответ на: комментарий от targitaj

Аккумуляторный ИБП —> генератор

ибп есть - генератор отсутствует и везде где я когда либо работал его не было, а если и был то лишь потому что единственный источник электроэнергии и крутился на постоянку… надо будет айтишнику этот тред на работе показать - пусть поставит пред начальством вопрос ребром, вон у всех уже генераторы есть - у одних нас отсутствует.

amd_amd ★★★★★
()
Ответ на: комментарий от amd_amd

Ну это уже от объекта зависит. Генератор может стоять потому что нормы такие. А может руководство поставить, если стоимость простоя выше стоимости гены.

targitaj ★★★★★
()
Ответ на: комментарий от imul

ИБП у них нет

есть, но он корректно завершает работу сервера сразу после того как электричество пропало, там стоит какая то задержка, но она минимальная, когда моргнуло еще держит, но если конкретно нет напряжения - начинает тушить сервер.

amd_amd ★★★★★
()
Последнее исправление: amd_amd (всего исправлений: 2)
Ответ на: комментарий от targitaj

Ещё один чайник. Алло, через полгода+ аптайма уже появляются риски незагруза ОСи при ребуте.

С чего бы это ?

Какие еще риски ?

windows10 ★★★★★
()
Ответ на: комментарий от targitaj

Виртуализация на базе KVM
А теперь о главном. Достаточно молодая разработка под управлением ОС Linux,
Все лидирующие российские хостинг-провайдеры используют систему виртуализации KVM, Timeweb не является исключением:

Гипервизор Kernel-based Virtual Machine представляет собой аппаратную виртуализацию, благодаря которой невозможно понять, виртуальный это сервер или физический.

Если сравнивать KVM с системой виртуализации VMware, то последнюю чаще выбирают для внедрения облачных решений по модели IaaS. В то же время платформа Kernel удобна для разработчиков, специализирующихся на создании и внедрении «линуксового» ПО.

Расскажите други, ваш гипервизор KVM - это qemu-kvm или нешто другое? Почему они такую херь пишут, что «лидирут в россии»(для ИП-шников, как я говорил?) и почему упоминание о «линуксовом ПО»(1%)?
Выходит я был прав, что никто не пользуется? Против 99% остальных. Облака не используют, так кто, мамкины хостеры для экономии используют? Скиньте ссылку плиз, гугел выдаёт мне воду, никакой конкретики... :(

xwicked ★★☆
()
Ответ на: комментарий от xwicked

Квм вещь интересная конечно, но уровень пердолинга просто заоблачный, по сравнению с варей или боксом.

Лично я выбрал варю. И даже гонял под ней старые игори, которые под вайном не шли

utanho ★★★★★
()
Ответ на: комментарий от xwicked

KVM - это модуль ядра и не более того. KVM лежит в базе proxmox и ovirt, например. У нашего текущего заказчика хосты на просто ubuntu с просто lbivirt. Я бы предпочёл proxmox, но и так норм. Хосты и гости рулятся паппетом.

targitaj ★★★★★
()
Последнее исправление: targitaj (всего исправлений: 2)
Ответ на: комментарий от windows10

Это из опыта. Нечасто, но такое случается. С обновлениями прилетают изменения, часть из которых требует ребута. Но ребута нет. Зато есть последующие обновления. Такое стараются отслеживать, но бывают спецэффекты. Спецэффекты бывают от так называемых «накапливаемых» ошибок. Иногда машина с большим аптаймом просто не может уйти в ребут.

Ты должен быть уверен, что хост загрузится. Нормально делать плановые ребуты.

https://www.fedora.md/2007/11/23/опасения-по-поводу-накопления-ошибок/ интересно, запилили что-нибудь по теме?

Сама постановка вопроса аптайма - не новая, если что https://www.reddit.com/r/sysadmin/comments/c02zbp/is_huge_uptime_sigh_of_good...

targitaj ★★★★★
()
Последнее исправление: targitaj (всего исправлений: 4)

сервер все равно не может 1000 дней непрерывно работать. хотя бы раз в месяц обновляться нужно, а следовательно и перезагружаться

uwuwuu
()
Ответ на: комментарий от targitaj

Если все работает - обновления не нужны.

У меня например аптаймы есть по 4.5 года - пациент жив, выполняет свои функции.

windows10 ★★★★★
()
Ответ на: комментарий от xwicked

KVM в проде обычно в связке с libvirt или proxmox используется. У одного из заказчиков моей фирмы, например. И да, пруфы с именами и точными данными дать не могу, NDA. Как и у 99% админов — нам в деталях расписывать первому встречному нашу инфраструктуру.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Dimez

Ты просто ничего не знающий, но с морей апломба, эникейщик.

Да это было понятно, когда он KVM с VirtualBox в одну кучу смешал. Явно виртуализацию только на десктопе и видел.

Вот VB в проде я и правда не встречал. Хотя в теории можно.

Vsevolod-linuxoid ★★★★★
()
Последнее исправление: Vsevolod-linuxoid (всего исправлений: 1)
Ответ на: комментарий от amd_amd

Чувак, у вас просто дохлый бытовой, ты нормальные не видел. Я говорю о тех ИБП, что размерами с серверную стойку :-) И их ещё нередко ставят много, обычно сразу на весь ВЦ.

Вот их хватает на время выхода на режим дизеля. Сперва ИБП работают, если подача электроэнергии от города через какое-то время не восстановилось, то стартует дизель (сам), а ИБП всё это держат.

Vsevolod-linuxoid ★★★★★
()

Кстати, обновление ядра при помощи kexec не сбрасывает процессор, поэтому на этих эпиках аптайм будет суммироваться с прошлыми и процессор зависнет даже при малом аптайме в системе.

Dimez ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

Да это было понятно, когда он KVM с VirtualBox в одну кучу смешал.

Дело не в этом. Никто всего знать не может уже лет 150, я в admin/devops наверняка больше не знаю, чем знаю.

Но настолько на голубом глазу порят пургу вида «только ИПшники ис пользуются» и «я нигде не встречал про использование KVM» только эникейщики с морем апломба.

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 1)
Ответ на: комментарий от Vsevolod-linuxoid

NDA. Как и у 99% админов — нам в деталях расписывать первому встречному нашу инфраструктуру.

Не парься, нигде нет. 2.5 фирмы - это не показатель.

Программное обеспечение KVM состоит из загружаемого модуля ядра (называемого kvm.ko), предоставляющего базовый сервис виртуализации, процессорно-специфического загружаемого модуля kvm-amd.ko либо kvm-intel.ko, и компонентов пользовательского режима (модифицированного QEMU)

VmWare уже давно годный продукт, потому что коммерческий, в то время как qemu даже в 2023г. кособокий, а KVM, судя по вики, исользует часть qemu в режиме пользоваеля. Так как под виндой нет, то и распространение логично убусловлено и NDA тут не причём.

xwicked ★★☆
()
Ответ на: комментарий от xwicked

qemu даже в 2023г. кособокий, а KVM, судя по вики, исользует часть qemu в режиме пользоваеля. Так как под виндой нет, то и распространение логично убусловлено

Это какое отношение к проду имеет? Там виртуалки на серваках без GUI крутятся.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от amd_amd

В датацентрах есть источники бесперебойного питания.

KivApple ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

4) QEMU-KVM
KVM предоставляет доступ гостям к Ring 0 и использует QEMU для эмуляции I/O (процессор, диски, сеть, видео, PCI, USB, серийные порты и т.д., которые «видят» и с которыми работают гости).
Отсюда QEMU-KVM (или KVM-QEMU) :)

Я понял, это маркетинговый ход. Они из названия убрали qemu и остался некий абстрактный KVM, но ВСЁ делает кособокий Qemu, со всеми его проблемами и последствиями. Расходимся.

xwicked ★★☆
()
Ответ на: комментарий от xwicked

Расскажи-ка подробнее, чем нездоров Qemu.

  • Интерфейс на десктопе у него и правда не очень — но кого это волнует на серверах без GUI?
  • Аппаратное ускорение KVM обеспечивает.
  • Libvirt или Proxmox предоставляют более удобный интерфейс для тех, кому не по душе оригинальный.
Vsevolod-linuxoid ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)