LINUX.ORG.RU

BADRAM + ESXi — есть ли решение?

 ,


0

1

Есть тазик для построения сервера Ubuntu, на который есть выбор поставить или ESXi (и уже внутрь него виртуалку Ubuntu Server) или сразу Ubuntu на bare metal. У тазика аппаратная ошибка в памяти, есть вывод программы Memtest86+ 5.01. ВОПРОС: можно ли как-то передать в параметры загрузки ядра ESXi параметр badram, как это делается с помощью GRUB2 на обычном линухе? Или это только для GNU/Linux такой трюк работает, и придется на это железо ставить Ubuntu однозначно? ESXi — более гибкое решение, и хочется именно его.

★★★★★
Ответ на: комментарий от jewy

Рассматриваются все решения. Но железо было изначально дешевое десктопное. Если менять, то на что-нибудь посерьёзней, типо с поддержкой памяти EСС, тем более аппаратный контроллер RAID стоит дискретный, и сетевуха серверная многопортовая. Уже подыскал модель материнки для замены, на подходе память. Проц уже есть для этого.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от Infra_HDC

О господи, планка памяти для твоего говна стоит 200-500 рублей. Нет смысла даже обсуждать это, разве что для спортивного интереса - получится ли из говна и палок сделать что-то работающее?

jewy
()
Ответ на: комментарий от Deleted

А твоё какое дело? Может он на торрентах купил.

jewy
()

UP!

Memtest86+ выдал в частности такие диапазоны памяти:

badram=0x91a6d150,0xbffff9dc,0x91a6d390,0xbffffb9c,0x91a6d410,0xbffffcdc,
0x91a6d490,0xbfffff9c,0x91a6d610,0xbfffff1c,0x91a6d490,0xfffffcbc,
0x91a6d910,0xbffffb9c,0x91a6da10,0xbffffe1c,0x91a6d010,0xfffff23c,
0xd1a6d030,0xfffff23c
Но он зараза зависает после какого-то там по счету цикла. Поэтому я решил замаскировать по крупному, то есть весь кусок 2G-4G. Этому диапазону соответствуют адреса 0x80000000-0xffffffff, я провел соответствующие вычисления, и нашел, что в маске будет только старший бит. Правильно ли будет, если я напишу:
badram=0x80000000,0x80000000 
Пожалуйста, господа знатоки, проверьте правильность моих выкладок.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от jewy

Планка может и стоит 500 деревянных. Но проблема в том, что ни одна из планок, которых я пробовал вынуть, механически не вынимаются, застряли намертво, либо low profile, и не за что ухватить. Ломать материнку я не хочу. А другие закрыты проводами и надо вынимать блок питания или всю материнку. Там замочки только с одной стороны края слота, неграмотно сделали, я тяну с другой стороны где нет замочка, но вытянуть не могу. Приходится искать workaround-ы.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от Infra_HDC

У бомжей уже выменяй что-нибудь нормальне вместо этого хлама.

anonymous
()

Еще вопрос. Могут при проходе мемтестом при обращении к плохим ячейкам памяти происходить помехи по питанию? Например, если на пересечении строки и столбца вместо вентиля короткое замыкание?

Infra_HDC ★★★★★
() автор топика

Продолжение истории. У тазика материнка такая: ASUS P8H67-M Rev 3.00. Версия BIOS — 0607 x64, обновлена до версии 3901 x64. После обновления BIOS, количество ошибок памяти уменьшилось. Плюс вспомнил, что дискретная многопортовая сетевуха такой же модели, как установлена тут, уже имела проблемы с совместимостью железа на другом системнике. Буду вынимать эту сетевуху и тестировать память еще раз.

Infra_HDC ★★★★★
() автор топика

Продолжение истории - 2. Параметра badram= нет сейчас в линухе, по крайней мере в версии 4.14. Пруфлинк: https://www.kernel.org/doc/html/v4.14/admin-guide/kernel-parameters.html. Зато параметр memmap=nn[KMG]$ss[KMG], по той же ссылке, может делать практически то же самое, причем через запятую можно перечислять несколько nn[KMG]$ss[KMG]. Иногда приходится экранировать символ $ одним ... тремя обратными слешами, чтобы конфиг GRUB2 удачно парсился.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от jewy

полтинник американских шекелей за 8 Гб DDR3 UDIMM за б/у
копеечную

Этот еврей сломался, несите нового.

shatsky ★★
()

UP! Хочу зарезервировать сбойные адреса с помощью опции memmap параметра загрузки ядра linux. Адресов много, но они компактно расположены. При выборе формы отчета badblocks вылезают только 32-битные указатели, а ошибки кучкуются в диапазоне выше 4ГБайт, то есть формат badblocks не подходит. Если же в начале теста нажать на пробел, то есть (SPACE) scroll_lock, то после заполнения окна тест останавливается и чего-то ждет. Вопрос в том, нажатие какой клавиши ждет тест для продолджения заполнения списка ошибок? Я не знаю какую клавишу нажать, чтобы продолжить тест после фотканья экрана. Если нажать на энтер, то есть на (CR) scroll_unlock, то экран быстро заполняется, и походу часть информации теряется, т. к. ошибок больше чем может влезть на экран, и часть старых ошибок замещается новым выводом. А мне нужны все ошибки, а не только последние. Их больше ста, но походу меньше тысячи, и я смогу их распарсить, если у меня будет полный список всех ошибок. Помогите. :-). https://www.dropbox.com/s/knr5785g6ug0vyb/20181210_111957.jpg?dl=0

Infra_HDC ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.