LINUX.ORG.RU
ФорумTalks

memtest86+ убивает ThinkPad-ы!

 , , ,


1

2

https://habr.com/post/413469/

Для Ъ:

Недавно у нас произошла душераздирающая история — за одно утро умерли два ноутбука Lenovo T500.
...
Естественно, в первую очередь были опробованы все кустарные способы реанимации: заменить батарею, заменить адаптер питания… Вытащить батарею и обесточить, сбросить CMOS и так далее… Результат? Ровно ноль — ноутбуки продолжали находиться в состоянии кирпичей.
...
В ночь на день «Д», на обоих компьютерах запустили memtest (точнее — memtest86+ 5.01-3 из дистрибутива Debian)
...
...memtest делает примерно то же самое — читает и пишет разные значения в разные области памяти. Теоретически, BIOS должен описывать области памяти, зарезервированные под устройства ввода-вывода. А memtest не должен туда ничего записывать — но… записал! И, видимо, в какой-то момент то-ли поднял, то-ли опустил неудачную ногу PMH. Соответственно, через выходной транзистор ноги PMH, шина питания VCC3SW оказалась накоротко замкнута на землю...

Весьма вероятно, что memtest может убивать таким образом ноутбуки начиная с серии T6x, и заканчивая серией T420/520 включительно. Начиная с T430/530 изменен способ коммуникации с EC, и записью в память до регистров PMH долезть нельзя в принципе. Возможно, этому подвержены только определенные версии BIOS или прошивки EC. Багрепорт debian-мейнтейнерам пакета отписан, может быть с апстримами чего и найдут...

UPD: альтернативная теория (omz+libreboot)

В сервисных центрах известна склонность RINKAN к выходу из строя. Коллеги из Libreboot дополнительно утверждают, что это особенно присуще контроллерам производства Toshiba (а ROHM получше будет). Соответственно, memtest всю дорогу был невиновен, а практически одновременный выход из строя двух ноутбуков произошел:

  • Либо по независящим друг от друга причинам (возможно, спровоцированным нагревом материнской платы под длительным memtest)
  • Либо неисправностью (шумом) по выходу питания адаптера, к которому (хотя и на короткое время) присоединялись оба ноутбука.

(В статье на хабре появляются апдейты и новые комментарии. Читайте первоисточник.)

★★★★★

Последнее исправление: greenman (всего исправлений: 6)

Надо поискать такое в «Эльбрусах» и «Байкалах».

abraziv_whiskey ★★★★★
()

Тут есть тред, в котором описывается случай, когда lm-sensors (а точнее утилита sensors-detect) убивала EDID монитора при сканировании шины I2C.

Zubok ★★★★★
()

На T420 такой проблемы нет, а с какой помойки они откопали *00 линейку, да и еще продолжают на ней работать? Там ведь корки 10-летней давности-то и GMA 4500.

Bruce_Lee ★★
()

Вчера на FreeBSD тоже пытался запустить memtest86+, установленный из порта. Не смог - комп из загрузчика командной строки при попытке подгрузить код memtest уходит в перезагрузку. Может руки?

iZEN ★★★★★
()
Ответ на: комментарий от Zubok

Замена платы монитора с убитым EDID несколько лет назад стоила 4,5 т.руб.

iZEN ★★★★★
()

не мемтест, а рукожопы-проектировщики железа

Harald ★★★★★
()
Ответ на: комментарий от iZEN

Регулярно сталкивался с тем, что memtest86+ не запускается.

Если не мешает проприетарность, то можно попробовать memtest86. Он и в UEFI работает.

greenman ★★★★★
() автор топика
Ответ на: комментарий от Zubok

Не удивительно, на EDID i2c eeprom, а i2c-detect выставляет write без данных. Соответственно кривой eeprom с разрешенным rw и мы получаем факап.

ncrmnt ★★★★★
()

«Это невозможно» - говорили они... Хотя, если подумать, что если BIOS перезаписывается через тот же usb-порт, значит есть программный выход и это теоретически можно сделать на любой машине из под любой ОС...

xwicked ★★☆
()
Ответ на: комментарий от xwicked

Хотя, если подумать, что если BIOS перезаписывается через тот же usb-порт

Тихо там, первый раз в сезоне думать надо аккуратно.

t184256 ★★★★★
()
Ответ на: комментарий от Deleted

Старожилы помнят историю с усройствами CD-ROM фирмы LG...

И жёсткие диски фирмы Fujitsu...

rst
()

только синкпад ли?

Valeg ★★★
()
Ответ на: комментарий от zgen

Конечно можно. Программатор Верьянова и вперёд. Хотя мне там в linux-hardware сейчас доказывают что 30 баксов за программатор дорого, а этот целых 100 стоит.

al-kasch
()

тут вопрос в том, почему вообще какое-либо выполнение чтений/записей процессором должно приводить к аппаратной поломке.

xmikex ★★★★
()
Ответ на: комментарий от Rastafarra

Не, с зарядкой у меня все норм сразу было. Да и остальное хоть и не сразу, но заработало.

kardapoltsev ★★★★★
()
Ответ на: комментарий от al-kasch

Я вроде EDID info в телеке powerstrip'ом перезаписывал.

zgen ★★★★★
()

мдя. феерическое рукожопие разработчиков харда!

Iron_Bug ★★★★★
()
Ответ на: комментарий от Zubok

Тут есть тред, в котором описывается случай, когда lm-sensors (а точнее утилита sensors-detect) убивала EDID монитора при сканировании шины I2C.

Тут есть тред, как челу поставившему кубунту, монитор откусил голову.

vasya_pupkin ★★★★★
()

Читайте первоисточник

не, ну как вот это называется? Во первых — посылаешь по ссылки, а во вторых — посылаешь на хабр... Что за неуважение к Ъ?

Deleted
()

Херня какая-то. Запускал мемтест на своём t61 много раз с разными планками памяти, всё отлично, работает до сих пор, умирать не собирается.

Deleted
()
Ответ на: комментарий от ncrmnt

Не удивительно, на EDID i2c eeprom, а i2c-detect выставляет write без данных. Соответственно кривой eeprom с разрешенным rw и мы получаем факап.

То, что он на i2c висит — это понятно. Собственно DDC и есть i2c, да. Вот тред этот нашел: Как исправить EDID? .

И еще один точно такой же несчастный: http://lm-sensors.lm-sensors.narkive.com/xBcKZ7s1/sensors-detect-changed-scre...

И еще один: https://lists.freedesktop.org/archives/xorg/2011-January/052041.html

Alex Deucher патч потом приделал:

drm/radeon: only add the mm i2c bus if the hw_i2c module param is set

commit 46783150a6552f9513f08e62cfcc07125d6e502b upstream.

It seems it can corrupt the monitor EDID in certain cases on certain boards when running sensors detect. It's rarely used anyway outside of AIW boards.

Но весело. Кому-то так прибило EDID. Только на радеонах проявлялся, судя по всему. :)

Zubok ★★★★★
()
Ответ на: комментарий от Zubok

Но весело. Кому-то так прибило EDID. Только на радеонах проявлялся, судя по всему. :)

Вангую, что тупо на радеонах кривой i2c контроллер был (или драйвер к нему), который что-то еще после старт-бита, адреса девайса и rw флага слал. В общем, веселуха, согласен.

ncrmnt ★★★★★
()
Последнее исправление: ncrmnt (всего исправлений: 1)
Ответ на: комментарий от Deleted

Херня какая-то. Запускал мемтест на своём t61 много раз с разными планками памяти, всё отлично, работает до сих пор, умирать не собирается.

Тут нет зависимости от планок памяти.Тут прямая зависимость от номера прошивки биоса.Ты наверняка не перешивал биос на своем ноуте.

BlackJack
()
Ответ на: комментарий от Deleted

Я перешивал биос, стоит предпоследний патченный

Блин я не внимательный. Там бага в биосах для T500.

BlackJack
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.