LINUX.ORG.RU

Максимум ECC-памяти для X570

 , ,


3

2

Собираю систему на Ryzen 9 3900X, материнская плата (предварительно) ASUS ROG Crosshair VIII Hero.

Формально в материнку можно воткнуть 128 Гб памяти, и есть поддержка Un-buffered ECC. С другой стороны, в продаже можно найти только планки по 16 Гб, типа Crucial CT16G4WFD8266 или Kingston KSM26ED8/16ME, заодно получаем и низкие частоты (2666 МГц), и латентность CL19. Хочется чего-то большего.

Есть ли здесь какие-то опции, которые я упускаю? Насколько успешно разгоняется память с ECC? Бывает ли ECC-память хотя бы на 2933 МГц?

Ответ на: комментарий от anonymous

Это вселяет определенный оптимизм. Интересно было бы узнать об актуальных подводных камнях.

Zeta_Gundam
() автор топика
Ответ на: комментарий от gag

Вроде бы первый тоже образец.

…но при этом есть в продаже на newegg. Занятно.

Zeta_Gundam
() автор топика
Последнее исправление: Zeta_Gundam (всего исправлений: 1)

Так, на всякий случай напомню, что ЕСС имеет смысл только если ты гоняешь многочасовые или многосуточные тяжёлые процессы, которые очень дорого или муторно перезапускать при ошибке или падении.

Deleted
()
Ответ на: комментарий от Deleted

Я не припомню ни одного случая, чтобы у меня что-то упало «по неведомой причине», кроме багов в самом ПО

anonymous
()
Ответ на: комментарий от anonymous

Более правильная постановка вопроса: зачем память без ECC, если можно с ECC?

anonymous
()
Ответ на: комментарий от anonymous

У меня иногда бывает, что какая-нибудь программа начинает необъяснимо глючить или падать. После ребута - всё ок. Не знаю, космические лучи в этом виноваты, или что-то более прозаическое, но вот факт.

Вот только случается такое раз в полгода максимум. А комп у меня круглосуточно включен.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от Deleted

нет, актуально для любых приложений где важна корректность результата вычислений (включая СУБД и файлохранилища, да).

NiTr0 ★★★★★
()

С другой стороны, в продаже можно найти только планки по 16 Гб, типа Crucial CT16G4WFD8266 или Kingston KSM26ED8/16ME, заодно получаем и низкие частоты (2666 МГц), и латентность CL19. Хочется чего-то большего.

возможно - потому, что планки с ЕСС работают согласно спекам чипов памяти, распаянных на плашках, а не разогнаны производителем как обычные плашки? :)

NiTr0 ★★★★★
()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от anonymous

Зачем тебе память с ECC? Что это тебе даст?

Я расчитываю, что ECC с хорошей вероятностью информирует меня о проблемах с целостностью данных.

У меня на компьютерах по несколько недель вертится много гигабайт IEEE754-чисел. Можно себе представить, что в какой-то момент у одного из них перевернется бит в экспоненте, и ошибка каскадом распространится по всей модели. ECC даст хоть какую-то диагностику, ну и это вроде бы дешевле, чем массово пересчитывать все на двух машинах.

Zeta_Gundam
() автор топика
Ответ на: комментарий от NiTr0

не разогнаны производителем

Ну конечно нужно исправить эту несправедливость. Вопрос насколько оно стабильно под разгоном.

Zeta_Gundam
() автор топика
Ответ на: комментарий от Zeta_Gundam

Ну конечно нужно исправить эту несправедливость. Вопрос насколько оно стабильно под разгоном.

Там стоят точно такие же чипы памяти, как и в обычных модулях, только на один дополнительный чип больше, вот и вся разница. Разгоняются эти модули точно так же, просто найди «гражданские» модули на таких же чипах и оцени разгонный потанцевал. Бонусом при переразгоне ты увидишь ошибки в логах без применения тестов памяти.

Khnazile ★★★★★
()
Ответ на: комментарий от Zeta_Gundam

точно так же как и обычные не-ЕСС. с чего бы быть менее стабильным?

NiTr0 ★★★★★
()
Ответ на: комментарий от Zeta_Gundam

А зачем разгонять ECC память? Тут или ЕСС, или ололоразгон.

Всё равно, что покупать мерседес бизнес-класса и участвовать в гонках по бездорожью.

Release
()
Ответ на: комментарий от Release

А вдруг это даст +10% к производительности? Вдруг оно себя при этом нормально чувствует? Почему бы и нет.

Zeta_Gundam
() автор топика
Ответ на: комментарий от Release

Вот чтобы собрать подобные мнения я и завел эту тему.

ECC память не предназначена для разгона.

Что ты имеешь в виду?

Zeta_Gundam
() автор топика
Ответ на: комментарий от Release

ECC память не предназначена для разгона. Тебе стабильность или циферки?

ЕСС не про такую стабильность. Это защита от случайных событий вроде стекания заряда из-за пролета сквозь ячейку частицы с высокой энергией. Такое случается постоянно, и может приводить к тихой проче данных. У меня есть доступ к одному компьютеру, который включен 24/7, и там минимум раз в квартал бывают выявленные ECC ошибки кэша процессора (в разных ядрах). А вот разгон это уже влияние постоянного фактора.

Khnazile ★★★★★
()
Ответ на: комментарий от Khnazile

Такое случается постоянно

На самом деле не так часто.

У меня есть доступ к одному компьютеру, который включен 24/7, и там минимум раз в квартал бывают выявленные ECC ошибки кэша процессора (в разных ядрах).

Это 99.999% не космические лучи, а дефект процессора или материнской платы.

anonymous
()

ASUS ROG Crosshair VIII Hero

На какой тебе леший линупс с таким железом?
Для эстафеты кто быстрее соберет из сорцов ядро.
Никогда не понимал укурушей, которые покупают оверпрайсное железо и ставят на него линь

anonymous
()
Ответ на: комментарий от anonymous

Это 99.999% не космические лучи, а дефект процессора или материнской платы.

Только что проверил другой компьютер, который обычный офисный и без разгона, там с 20 октября по сегодня было сразу 3 случая ошибок ECC в кэше L3. Все «Corrected error, no action required.» Более старых логов на нем просто нет.

Khnazile ★★★★★
()
Ответ на: комментарий от anonymous

Нркмн чтл? Если я пользуюсь линуксом, мне теперь что, покупать хлам вместо нормального железа?

anonymous
()
Ответ на: комментарий от Khnazile

Кстати читал, что в современных плашках ECC далеко не самая полезная и эффективная метода устранения ошибок. Но плашки до сих пор так и называют ECC.

Deleted
()
Ответ на: комментарий от Khnazile

Место проклятое :) Вообще хз, конечно, но я ни разу не видел ошибок ни в RAM с ECC, ни, тем более, в кэше CPU. Последнее я бы точно воспринял как признак проблем с нагревом, питанием, или брак.

anonymous
()
Ответ на: комментарий от anonymous

Ну вообще-то эти компьютеры стоят совсем в рfзных местах, довольно далеко друг от друга. Важное замечание: это не серверы, обычные компьютеры, и оперативная память там тоже самая обычная.

Khnazile ★★★★★
()
Ответ на: комментарий от Deleted

ничего удивительного - у тебя же штеуд чуханский вместо процессора

anonymous
()

заодно получаем и низкие частоты (2666 МГц)

Высокое быстродействие можно получать не только на большой частоте с большими таймингами, но и на маленькой частоте с маленькими таймингами.
Последнее к стати более правильнотак как УСКОРЯЕТ случайный доступ к данным.

torvn77 ★★★★★
()
Ответ на: комментарий от torvn77

Высокое быстродействие получается только на одновременно высокой частоте и низких таймингах. Наименьшая реальная задержка («случайный доступ к данным») тоже получается при таких настройках.

anonymous
()
Ответ на: комментарий от anonymous

Треугольник Быстро-Качественно-Дёшево знаешь?
Ну вот при проверке этим треугольником явно видно то, что в твоих рассуждениях явно что-то накосячено.
Что именно разбирайся сам, чай не девочка, а зрелая личность.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 2)
Ответ на: комментарий от torvn77

Во-первых, это твой пост-фактум манёвр. У тебя изначально было конкретно про «высокое быстродействие».

Во вторых, у тебя широко распространённое заблуждение, что реальная задержка памяти зависит только от таймингов.

В третьих, модули способные на низкие тайминги, как правило способны и на высокие частоты, а говёные модули неспособны на реально низкие тайминги. При этом оем самсунги не обязаны дорого стоить но они будут брать высокие частоты и низкие тайминги одновременно.

anonymous
()
Ответ на: комментарий от anonymous

Есть несколько серверов без ECC. Встречаются случаи порчи данных. Например, в redis среди тысяч ключей один символ может быть испорчен.

exst ★★★★
()

Благодарю всех за обсуждение. Отдельное спасибо gag за ссылки на Самсунг.

Сам я решил остановиться на низкопрофильной Crucial CT16G4XFD8266 (16GB DDR4-2666 VLP ECC UDIMM). Модули по 32 Гб пришлось бы, вероятно, закупать на ebay, к чему я пока морально не готов.

Zeta_Gundam
() автор топика
Ответ на: комментарий от torvn77

Треугольник Быстро-Качественно-Дёшево знаешь?

А я вот как-то пытался разобраться, что именно записано в spd, чтобы планки определялись так, как надо было мне, а не как в них написано с завода. И может я не понял все до конца, но там вообще никаких частот и таймингов нету. Только время в наносекундах. А тайминги считаются для определенной частоты автоматически по формуле. Т.е. время, за которое в памяти происходят физические процессы должно быть примерно одинаковым для любой частоты, и как ты ни крутись, меньше, чем она физически способна сделать не выйдет.

Khnazile ★★★★★
()
Последнее исправление: Khnazile (всего исправлений: 1)
Ответ на: комментарий от Khnazile

Т.е. время, за которое в памяти происходят физические процессы должно быть примерно одинаковым для любой частоты,

Я тоже пришёл к такому выводу

и как ты ни крутись, меньше, чем она физически способна сделать не выйдет.

А вот тут есть нюансы:

  1. отдельные тайминги можно ужимать без видимых последствий.
  2. Работа на меньшей частоте при том же темпе доступа к данным должна означать меньшее тепловыделение.
  3. Доступ к ячейкам памяти осуществляется двумя разными методами, чнением одного слова или чтением последовательности слов.
    Так вот, как мне объяснил один гуру разгон по таймингам оптимизирует работу ОЗУ так, что метод чтения одого слова(он же рандомный доступ) оказывается более выгодным чем чтение последовательности слов, что сказывается на быстродействии тех или иных участков кода.
torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
29 января 2020 г.
Ответ на: комментарий от Zeta_Gundam

Тоже сейчас думаю в связи с апгрейдом

Сам я решил остановиться на низкопрофильной Crucial CT16G4XFD8266 (16GB DDR4-2666 VLP ECC UDIMM).

А почему не Crucial CT16G4WFD8266 ? Эта вроде дешевле? Различие в низкопрофильности или в чем?

И вообще интересно как и на чем она отработала это время.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

А почему не Crucial CT16G4WFD8266 ?

Взял низкопрофильную чтобы в перспективе был минимум проблем с выбором кулера (часто оставляю комп считать на ночь, важна тишина).

Кстати, боксовый кулер оказался так себе (и по шуму, и по отводу тепла), заменил его на Noctua NH-U12A — действительно очень тихий на низких оборотах, но на максимуме начинает противно завывать.

И вообще интересно

Из интересного, с чем еще не разобрался — за месяц комп несколько раз (меньше десяти) внезапно отключался при самых различных обстоятельствах (копирование данных с sftp на внешний диск, просмотр видео в браузере, игры... системы пока не видно). Версии ядра от 5.3 до свежего 5.4.13, память разгонял до 3600 МГц, снижал до 3333 МГц — пока ничего не помогает.

Zeta_Gundam
() автор топика
Ответ на: комментарий от Zeta_Gundam

Из интересного, с чем еще не разобрался — за месяц комп несколько раз (меньше десяти) внезапно отключался при самых различных обстоятельствах (копирование данных с sftp на внешний диск, просмотр видео в браузере, игры... системы пока не видно). Версии ядра от 5.3 до свежего 5.4.13, память разгонял до 3600 МГц, снижал до 3333 МГц — пока ничего не помогает.

Не факт, что проблема в памяти. Из-за памяти он бы скорее зависал или перезагружался, чем отключался. Тем более, я так понимаю, что память тестировал и вообще в логах ничего такого нет?

Более похоже на проблемы с питанием процессора. Может лишнее энергосбережение надо отключить. Даунвольтнуть или наоборот увеличить напряжение.

А вообще, хочу апгрейд сделать, но такое чувство, что «настоящая» система - это тредриппер, а обычные райзены - так баловство для игрушек. К сожалению на TR нет денег. Не, можно 1-го поколения взять, но с ними сейчас овчинка выделки похоже не стоит.

Дошло до того, что приглядываюсь к Intel Core i9-7920X, вроде не сильно и медленнее Ryzen 3900X, зато платформа «настоящая». Еще бы цену на него сделали как на 3900X и я бы пожалуй точно его выбрал бы.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 2)
Ответ на: комментарий от praseodim

Не факт, что проблема в памяти.

Согласен. В системе еще стоит новая видеокарта от AMD, мне представляется что проблема может быть и в сырых дровах. Но вообще перед этим память нормально отработала месяц на стоковых частотах.

Тем более, я так понимаю, что память тестировал и вообще в логах ничего такого нет?

Вроде того. Несколько проходов memtester ничего не нашли, edac-util ошибок не показывает... Ну да ладно, со временем что-нибудь прояснится.

такое чувство, что «настоящая» система - это тредриппер

Может это психология? Крутой мотоцикл дает кайфа на неделю, а сбережения в кубышке греют годами :) Но 4 канала памяти это конечно весомый бонус, особенно когда вляпаешься в задачу с низкой плотностью вычислений и даже несколько ядер не можешь нормально загрузить.

Zeta_Gundam
() автор топика

купи лучше тредриппер - поддержи АМД во славу!

anonymous
()
Ответ на: комментарий от Zeta_Gundam

Согласен. В системе еще стоит новая видеокарта от AMD, мне представляется что проблема может быть и в сырых дровах. Но вообще перед этим память нормально отработала месяц на стоковых частотах.

В плане выбора платформы не хотелось бы нарваться на такой фантомный баг связки матплаты и процессора.

Может это психология? Крутой мотоцикл дает кайфа на неделю, а сбережения в кубышке греют годами :)

Да хз, просто есть опасение, что так как «обычная» платформа позиционируется фактически как «игровая», то всем и наплевать, что иногда чего-то виснет или выключается, типа для игр или даже видеомонтажа, но любительского оно не особо критично.

Но 4 канала памяти это конечно весомый бонус, особенно когда вляпаешься в задачу с низкой плотностью вычислений и даже несколько ядер не можешь нормально загрузить.

Все-равно, по тестам вроде получается, что 2-х канал DDR4 быстрее или равен 4-х канала DDR3 как сейчас у меня. Или не всегда?

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 2)
Ответ на: комментарий от praseodim

зато платформа «настоящая»

HEDT, конечно, выглядит прикольно для начинающих, но там часто адовый процент брака. Объёмы выпусков маленькие, платформы не обкатаны. Если тебе хочется «настоящего», то это брендовые компьютеры Dell/HP. Самосбор на TR4/2066 - точно такая же игрушка, как на более массовых платформах, но с потенциалом для дополнительных проблем.

anonymous
()
Ответ на: комментарий от praseodim

В плане выбора платформы не хотелось бы нарваться на такой фантомный баг связки матплаты и процессора.

Все системы были когда-то сырыми и необкатанными.

Все-равно, по тестам вроде получается, что 2-х канал DDR4 быстрее или равен 4-х канала DDR3 как сейчас у меня.

Это прям на тех же частотах?

Кстати, по результатам насколько все же нужна ECC память?

Ну это такой вопрос... С одной стороны, за месяц я не видел ни одного срабатывания ECC — тут конечно актуальный вопрос работает ли оповещение вообще, потому что для этой платформы его завезли только в ядре 5.4, и кто знает сколько раз еще будут чинить. Ошибок не видно даже на высоких частотах, просто начиная с какого-то уровня (у меня 3666 МГц) материнка не стартует. Я бы с удовольствием поставил себе 128 Гб памяти на 4 ГГц, выбор плашек с ECC в этом ограничивает. С другой стороны, я в своей работе руководствуюсь принципом, что если непонятно что компьютер считает, то в общем-то уже не так и важно с какой скоростью он это делает. Поэтому я лично переезжаю на ECC, думается, навсегда — тем более что объемы памяти будут только расти.

Zeta_Gundam
() автор топика
Ответ на: комментарий от Zeta_Gundam

Вроде того. Несколько проходов memtester ничего не нашли, edac-util ошибок не показывает... Ну да ладно, со временем что-нибудь прояснится.

Может вот этот баг? https://bugzilla.kernel.org/show_bug.cgi?id=196683

Даже тему создал Что с soft lockup в Linux с Ryzen 3000-ными на x570 чипсете

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Не похоже. У меня симптомы такие, как будто комп просто из розетки выдернули.

Zeta_Gundam
() автор топика
21 августа 2020 г.
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.