LINUX.ORG.RU

Очень странные дела с новой оперативной памятью

 , , , ,


2

1

Имеется материнскна плата ASUS PRIME B450M-A https://www.regard.ru/catalog/tovar292646.htm с последней доступной версией bios и amd ryzen 5 2600.
На ней полтора года без проблем и нареканий работает два модуля памяти Kingston HyperX Fury HX426C16FB2K2/16 https://www.regard.ru/catalog/tovar248982.htm
Согласно рекомендации https://dlcdnets.asus.com/pub/ASUS/mb/SocketAM4/PRIME_B450M-A/E14212_PRIME_B450M-A_UM_WEB.pdf память была установлена в слоты материнской платы DIMM_A2 и DIMM_B2

Вчера прикупил ещё два модуля аналогичной по всем характеристикам, но не точно такой же памяти (ввиду её отсутствия) Kingston HyperX Fury HX426C16FB3K2/16 https://www.regard.ru/catalog/tovar329060.htm (разница в одну цифру в номере модели) и обнаружил проблемы в работе памяти, а именно:
1) при установке старой и новой памяти (пропорция не важна т.е. две старых+две новых или 1 старая+две новых или две старых + 1 новая или 1 старая и 1 новая), если любая планка любой памяти вставлена в слот DIMM_B1, ПК не стартует (при включении кулеры работают на максимуме, на мониторе нет сигнала, на материнке горит аварийная подсветка);
2) старые модули памяти (без установки новых) работают в любых слотах в любой комбинации, в том числе в DIMM_B1;
3) по одиночке любая планка любой памяти, как старой так и новой работает в любом слоте материнке, в том числе в DIMM_B1;
4) если установить три модуля любой памяти (т.е. 2 старых + 1 новая либо 2 новых + 1 старая) в слоты кроме DIMM_B1, то система запускается, но работает нестабильно, а именно я в первый раз в своей жизни за 10 лет пользования linux увидел kernel panic при загрузке системы. Кроме того один раз компьютер завис на этапе загруки initramfs.
Но самым неожиданным эффектом является то, что при загрузке в ~ 3/4 случаев в таком режиме перестаёт подходить пароль от зашифрованного через luks корневого раздела. Помогает только новая загрузка, в ходе которой есть шанс, что пароль сработает.
5) опытным путём было установлено, что по всей видимости стабильной конфигурацией является установка двух модулей старой памяти в слоты DIMM_A1 и DIMM_A2, а новой в слот DIMM_B2. Во всяком случае после пары десятков загрузок проблем с доступом к зашифрованному устройству или зависаний не обнаружено. 5-часовойmem memtest86 также прошёл без ошибок.
Первый раз встречаю подобные траблы с памятью, при этом мой случае не уникален, по поиску «not start 4 ram sticks» встречается много ссылок, но конкретной причины проблемы и её решения я так и не нашёл (пробовал незначительно поднимать волтаж на память и снижать частоту, но это не помогло).
Но больше всего мне не понятно, как проблемы с памятью влияют на cryptsetup


Некоторые тупые материнки некорректно выставляют настройки частоты/таймингов/напряжения. Должны установиться «худшие» настроки, на которых заведëдся любая из четырëх плашек. Но иногда мать бесит настройки, например, по первому слоту. И от банальной перестановки плашек может измениться ситуация. Для начала выставки вручную настройки не по XMP профилю, а по JEDEC.

anonymous
()
Ответ на: комментарий от anonymous

у старых и новых планок тайминги и частота абсолютно одинаковые. Фактически это одна модель, просто разные ревизии.

tm4ig
() автор топика
Ответ на: комментарий от tm4ig

Это так не работает. Там могут быть хоть абсолютно разные чипы от абсолютно разных производителей.

anonymous
()

Если у тебя есть оффтоп, то скачай CPU-Z. Там можно будет посмотреть доступные профили каждой из плашек. Сначала на одних плашках запастись, потом на других.

anonymous
()
Ответ на: комментарий от Korchevatel

я в посте написал «Имеется материнскна плата … с последней доступной версией bios», обновляться некуда

tm4ig
() автор топика
Ответ на: комментарий от anonymous

да, мне мужик из поддержки kingstone также сказал, что отличаются чипами памяти, но работы аффектить это не должно по его мнению

tm4ig
() автор топика
Ответ на: комментарий от anonymous

А это нормально. У кингстона есть дисклеймер, что внутри модулей может быть что угодно, главное характеристики соответствуют. Лучше вообще с этим «производителем» не связываться.

anonymous
()
Ответ на: комментарий от anonymous

Да на любых планках, но не у любого. У Crucial может быть только Micron, с Hynix и Samsung всё и так понятно. Поклейщики радиаторов лишь в редких случаях обещают что-то конкретное, типа модулей Samsung B-die.

anonymous
()
Ответ на: комментарий от tm4ig

И вот настал тот самый раз, когда они есть. Бывает, ничего нового.

anonymous
()
Ответ на: комментарий от tm4ig

да, проблема возникла неожиданно и чтож теперь делать?

linuxya
()

Когда обновлялся до 64 ГБ, были похожие проблемы. Мемтест говорил, что типа всё ок, но бывали рандомные зависания (с cryptsetup не проверял, правда). Матплата постарше, X370. Модельные номера плашек лень искать, но тоже было типа FB2 vs FB3 (первый в QVL, второй нет).

Теперь решение:

  1. Купить плашки из QVL, имеющиеся сжечь в микроволновке, лол. Про типа разные ревизии это чушь, конечно.
  2. Повысить напряжение с 1,2 В до 1,35 В. В плюсе больше стабильность, в минусе выше тепловыделение. Хз насколько реально горячее, но у меня проблем не было.
lu4nik ★★★
()
Ответ на: комментарий от anonymous

Для Zen/Zen+ Micron вроде не очень рекомендовали, для Zen2 уже пофиг по большому счёту.

anonymous
()
Ответ на: комментарий от anonymous

На сколько я знаю, основные проблемы по памяти были на Zen(Ryzen 1xxx) на старте, и был смысл гоняться за дорогущей B-die. Потом обновлениями BIOS проблему более-менее/частично сгладили. На Zen+/Zen2 (Ryzen 2xxx-3xxx) таких проблем уже нет (но это не точно).

anonymous
()
Ответ на: комментарий от anonymous

дорогущей B-die

Причём до момента, когда производители прочухали, что к чему, она стоила по 10 рублей за ведро.

anonymous
()
Ответ на: комментарий от anonymous

когда производители прочухали

Очень быстро =)

anonymous
()

А вот выхлоп dmidecode

# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 3.1.1 present.

Handle 0x0030, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0029
        Error Information Handle: 0x002F
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM_A1
        Bank Locator: BANK 0
        Type: DDR4
        Type Detail: Synchronous Unbuffered (Unregistered)
        Speed: 2666 MT/s
        Manufacturer: Kingston
        Serial Number: 1AD35B1D
        Asset Tag: Not Specified
        Part Number: KHX2666C16/8G       
        Rank: 1
        Configured Memory Speed: 2666 MT/s
        Minimum Voltage: 1.2 V
        Maximum Voltage: 1.2 V
        Configured Voltage: 1.2 V

Handle 0x0033, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0029
        Error Information Handle: 0x0032
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM_A2
        Bank Locator: BANK 1
        Type: DDR4
        Type Detail: Synchronous Unbuffered (Unregistered)
        Speed: 2666 MT/s
        Manufacturer: Kingston
        Serial Number: 17D45B1D
        Asset Tag: Not Specified
        Part Number: KHX2666C16/8G       
        Rank: 1
        Configured Memory Speed: 2666 MT/s
        Minimum Voltage: 1.2 V
        Maximum Voltage: 1.2 V
        Configured Voltage: 1.2 V

Handle 0x0036, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0029
        Error Information Handle: 0x0035
        Total Width: Unknown
        Data Width: Unknown
        Size: No Module Installed
        Form Factor: Unknown
        Set: None
        Locator: DIMM_B1
        Bank Locator: BANK 2
        Type: Unknown
        Type Detail: Unknown
        Speed: Unknown
        Manufacturer: Unknown
        Serial Number: Unknown
        Asset Tag: Not Specified
        Part Number: Unknown
        Rank: Unknown
        Configured Memory Speed: Unknown
        Minimum Voltage: Unknown
        Maximum Voltage: Unknown
        Configured Voltage: Unknown

Handle 0x0038, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0029
        Error Information Handle: 0x0037
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM_B2
        Bank Locator: BANK 3
        Type: DDR4
        Type Detail: Synchronous Unbuffered (Unregistered)
        Speed: 2666 MT/s
        Manufacturer: Kingston
        Serial Number: 00E26D8D
        Asset Tag: Not Specified
        Part Number: KHX2666C16/8G       
        Rank: 1
        Configured Memory Speed: 2666 MT/s
        Minimum Voltage: 1.2 V
        Maximum Voltage: 1.2 V
        Configured Voltage: 1.2 V

Что значит Error Information Handle: 0x00* ?

tm4ig
() автор топика

пробовал незначительно поднимать вольтаж на память Сколько ставил? 1.35 - можно смело ставить.

anonymous
()

Кстати, 4 плашки одновременно часто работают на меньших частотах, чем 1 или 2. Даже в мануалах к материнкам это пишут. Обычно такое бывает на двухранковых модулях. Советую откатиться вручную, например, на 2133 и проверить.

anonymous
()
Ответ на: комментарий от anonymous

С Рязанью то и мудохался… 3 планки шли!!!

anonymous
()
Ответ на: комментарий от anonymous

да хрен ее сдашь уже, как бы память исправна и это технически-сложный товар, плюс целостность упаковки нарушена

tm4ig
() автор топика
Ответ на: комментарий от anonymous

Не, не оно… Но кто-то точно имел похожие проблемы. Может и denvas-tv

anonymous
()
Ответ на: комментарий от anonymous

На практике важнее частоты, чем тайминги, а с ними у микрона в общем-то не сильно хуже многих других. Ну с CL=19, а не 17 и тем более 15 и фиг с ними

anonymous
()

про слот DIMM_B1 я поторопился, с тремя планкам и с ним работает (не факт что стабильно). Короче не работает именно 4 планки или три (или даже две) старых и новых, но расположенных в определённом порядке (т.к. не записывал все комбинации даже хз какая закономерность). Пишут, что это может быть из-за погнутых ножек проца или матери, но что-то лень снимать проц и смотреть. Т.е. все слоты матери рабочие. Все модули памяти рабочие. Влияет только расположение модулей и эффект может быть от отказа в запуске до нестабильной работы (как уже писал по всей видимости стабильной конфигурацией является установка двух модулей старой памяти в слоты DIMM_A1 и DIMM_A2, а новой в слот DIMM_B2). Добиться работы с 4 плашками не удалось даже при повышении напруго до 1.3В и понижения частоты до 2133Мгц

tm4ig
() автор топика
Последнее исправление: tm4ig (всего исправлений: 1)

Короче в следующий раз надо проверять QVL и количество/режим поддерживаемых модулей из него…

tm4ig
() автор топика
Ответ на: комментарий от tm4ig

в следующий раз надо проверять QVL

Перестал смотреть в QVL во времена 775 сокета. Думается, что это или проц дефектный или мать.

anonymous
()
Ответ на: комментарий от anonymous

да, интуитивно чувствую что скорее мать. ХЗ как это проверить, нужен комплект другой памяти…

tm4ig
() автор топика

Пробовали откатить Bios до версии в которой не отключен PCIe gen4 ? На Prime B350 я откатил, у меня стало меньше невосстановимых сбоев по PCIe. Похоже что-то перемудрили с этим, возможно, какая-то регрессия по Bios-у…

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.