LINUX.ORG.RU
решено ФорумAdmin

тест оперативной памяти на ошибки

 


0

3

здрасьте здрасьте люди добрые... скажите пожалуйста имеет ли смысл делать тест на ошибки серверной памяти утилитами, к примеру как memtester? ведь у серверной памяти есть коррекция ошибок. учитывает ли это memtester? я решил, что лучше спросить у спецов, чем теряться в догадках на эту тему.

Не имеет. Кроме того у memtest+ ЕМНИП есть проблемы с тестированием ECC. Имеет смысл mcelog поднять и следить за его логом.

Jameson ★★★★★
()
Ответ на: комментарий от Assembler

Вдобавок почитай про EDAC и edac-utils, это тоже вариант. Если грамотно настроишь сможешь узнать какой физически модуль в каком слоте ошибки сыпет. Но для этого нужно будет самому таблицу соответствия сочинить, если готовой в базе не найдётся для твоего сервера.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Кроме того у memtest+ ЕМНИП есть проблемы с тестированием ECC.

Та они у любой софтинки будут, если ей правленные данные выдавать :)

anc ★★★★★
()
Ответ на: комментарий от greenman

mprime нет, не пробовал.

я бы хотел отметить справедливости ради, что за год через мои руки прошла тысяча++ серверов и с ошибкой памяти я столкнулся впервые, тогда как обычно битые планки памяти попросту не запускались и на этом всё сразу было понятно.

а вообще делайте бэкапы. остальное всё полумеры.

Spoofing ★★★★★
()

У меня был случай, когда излишне грелись модули памяти и давали ошибки. После монтажа радиаторов перестали давать ошибки. Тестировал бинарником sys-apps/memtest86-bin

Shushundr ★★★
()
Ответ на: комментарий от Dimez

Эта, как поднимешь не пугайся если он тебе «Disk errors» найдёт кучу при наличии в системе nvme ssd. Эта фича экспериментальная, он за ошибки принимает команды по управлению питанием которые устройство само себе отдаёт. Я чуть в штаны не наделал, думал что у меня свежекупленный ssd на 4тб дохнет.

# ras-mc-ctl --summary
No Memory errors.

No PCIe AER errors.

No ARM processor errors.

No Extlog errors.

No devlink errors.
Disk errors summary:
        0:66304 has 234 errors
No MCE errors.
Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.