LINUX.ORG.RU

Насколько все же важна ECC-память

 


1

5

Сейчас на перепутье. Брать ли к Gigabyte Aorus x570 Elite + Ryzen 3900X еще и ECC память или нет.

Довод за - снижение вероятности ошибок.

Довод против - жалко денег. Плюс она медленнее.

Предыдущее что-то вроде обсуждения: Максимум ECC-памяти для X570

Пищи для размышления еще статья на хабре подкинула https://habr.com/ru/post/328370/

★★★★★

Последнее исправление: praseodim (всего исправлений: 1)

Сильно зависит от высоты над уровнем моря и особенностей местности.

anonymous
()

Зависит от целей. Если есть необходимость в гарантированном сохранении файлов, т. е. используются raid/raidz, и нужно обеспечить корректность записи файлов на носители, или хранятся базы данных, потеря информации в которых в результате порчи после записи недопустима, то ECC имеет смысл. Если нет, то, мне кажется, заморачиваться с ней не стоит. Вообще, кейсы использования ECC описаны. Ситуация с частотой памяти тоже понятна - чем выше частота, тем сложнее обеспечить неизменность и надежность. По опыту (на воркстейшене память 3600, на ноуте 2666) разница при обычном использовании вообще не заметна.

sunnandt
()
Ответ на: комментарий от sunnandt

Никаких raid/raidz, вообще серверных целей. Собирается для себя. Из задач - компиляции, виртуальные машины, обработка текстов, может иногда расчеты. Есть планы «поиграться» с тренировкой нейронных сеток.

Разница в цене примерно в 8-9 т.руб. между обычной 4x16 Crucial Ballistix BLS4K16G4D32AESE - 3200 МГЦ и ECC 4x16 Crucial CT16G4WFD8266 - UDIMM ECC 2666 МГц.

Кстати, имеет ли значение, что мне подойдет только unbuffered, то есть НЕ регистровая ecc-память.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 3)
Ответ на: комментарий от sunnandt

т. е. используются raid/raidz

Обычно они используются на сервере, а данные испортятся на клиенте, например. Всегда было интересно, как рассуждают васяны, которые собирают NAS с ECC, но клиентами у них являются макбуки и разогнанные в хлам десктопы, качество работы памяти в которых определяется получасовым стресс-тестом общего назначения. Да, вроде чуть лучше, чем без ECC совсем, но только лишь чуть.

anonymous
()

Сколько раз в день выключаешь/перезагружаешь компьютер, в том числе неожиданно из-за внезпного отключения электричества?

Если чаще чем раз в неделю, то точно не нужен. Неконтролируемые переходые процессы при включении и выключении внесут больше ошибок, чем испортится один бит в корректируемом блоке.

anonymous
()
Ответ на: комментарий от anonymous

От этого «чуть» могу зависеть миллионы рублей для компании. Если организация серьезная, там не будут экономить на таких вещах. Понятно, что для мелких целей вроде soho или домашнего пк без нужд максимальной надежности в хранении на ecc можно сэкономить. Даже нужно, наверное. По крайней мере по геймерским тестам обычная память с высокой частотой дает прирост к фпс.

sunnandt
()
Ответ на: комментарий от sunnandt

От этого «чуть» могу зависеть миллионы рублей для компании.

О производственном применении речи нет, там на этом нет смысла экономить.

домашнего пк

Именно здесь и процветает всё это мракобесие :) ECC-память преподносится как панацея, возникает ложное ощущение защищённости (почти как с RAID вместо бэкапа), а данные всё равно портятся по какой-то другой причине.

anonymous
()
Ответ на: комментарий от sunnandt

Вообще, кейсы использования ECC описаны

Есть ссылка на детальный разбор полётов по этой теме?

reprimand ★★★★★
()
Ответ на: комментарий от anonymous

а данные всё равно портятся по какой-то другой причине.

Когда я был молодой и у меня в компе была куча винчестеров, а данные на диске хранились на нескольких разделах и заметил то, что компьютер в случае паралельного запуска нескольких процессов копирования начинает портить данные.

То есть данные скорее всего портились или в контролёре pata/sata на материнской плате или непосредственно в контролёре самого диска.

torvn77 ★★★★★
()

Довод против - жалко денег. Плюс она медленнее.

медленнее в смысле частоты ниже? так не удивительно, чипы на плашках те же просто «заводской разгон» не используется, а работают согласно даташиту (да-да, все «оверклокерские» плашки по сути разогнаны с завода). в остальном - ничуть не медленее. если сильно хочется - можете потом сами попробовать разогнать…

NiTr0 ★★★★★
()
Ответ на: комментарий от praseodim

Кстати, имеет ли значение, что мне подойдет только unbuffered, то есть НЕ регистровая ecc-память.

да, только нерегистровая.

NiTr0 ★★★★★
()

Пищи для размышления еще статья на хабре подкинула https://habr.com/ru/post/328370/

Я не собираюсь нападать на разработчиков файловых систем. Они лучше разбираются, чем 99,9% программистов.

Истинно так.

А вот на лоре очень часто любят нападать на авторов Reiser5 и всячески выгораживать комманду Поттерингов отвественных за BTRFS.

Хотя по сути это такого же уровня поделка-недоделка как и какой-нибудь systemd…

anonymous
()
Ответ на: комментарий от anonymous

Сколько раз в день выключаешь/перезагружаешь компьютер, в том числе неожиданно из-за внезпного отключения электричества?

Обычно pm-suspend на ночь делаю. Полностью выключаю раз в три-четыре дня, редко больше. Изредка перезагружается из-за зависаний или еще чего.

Неконтролируемые переходые процессы при включении и выключении внесут больше ошибок, чем испортится один бит в корректируемом блоке.

Внесут куда? Данные то не хранятся при этом.

Пока еще так и не решил стоит или нет. Может стоит, а может для моих применений фактически просто блажь.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от anonymous

А x570? Вообще я смотрю, что x470 в чем-то привлекательнее, а в чем-то слишком много проблем.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от torvn77

Когда я был молодой и у меня в компе была куча винчестеров, а данные на диске хранились на нескольких разделах и заметил то, что компьютер в случае паралельного запуска нескольких процессов копирования начинает портить данные.

Может надо отдать должное Intel и ее чипсету x79, но у меня бывают разные глюки изредка, но не порча данных. Последний раз, когда у меня портились данные (задолго до x79) это происходило из-за плохой памяти.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Обычно pm-suspend на ночь делаю.

Ночью во время сна (suspend) твои данные в ОЗУ не могут испортиться?

Изредка перезагружается из-за зависаний или еще чего.

:) Что есть зависание, если не причина неисправимой ошибки? Ошибка уже случилась. Error Correction (Code) уже не имеет смысла.

Внесут куда? Данные то не хранятся при этом.

Данные всегда где-то хранятся. Вопрос в том, насколько ты контролируешь, как эти данные хранятся. Включение и выключение - это в основном неконтролируемый процесс.

anonymous
()

Вероятность записи ошибочных данных с ECC-памятью не больше вероятности единичных ошибок в буферной памяти самого носителя. То есть ценность ECC нивелируется качеством локальной памяти носителя. ZFS к ошибкам такого рода относится с подозрением и требует повторения транзакции. Файловые системы Linux, скорее всего, пропустят ошибку и запишут повреждённые данные (впоследствии ошибка обнаружится, конечно - проверочный код контрольной суммы не совпадёт). Так что роль ECC-памяти сильно переоценена. Не стоит она того.

iZEN ★★★★★
()
Ответ на: комментарий от iZEN

ZFS к ошибкам такого рода относится с подозрением и требует повторения транзакции.

Что это за бред. Если контроллер вернул любую ошибку, то это называется I/O error. Если он ничего не вернул, то и подозревать нечего. Никакая файловая система не будет пытаться повторить операцию при ошибке, это вопрос для userspace.

Файловые системы Linux

…едят детей. А в Windows - взрывают дома. Только ZFS на чужой для неё платформе работает как надо :)

anonymous
()
Ответ на: комментарий от iZEN

То есть ценность ECC нивелируется качеством локальной памяти носителя.

Как ты думаешь, хранит ли «носитель» избыточные данные, и как он узнает что неверно прочитал сектор? А как там устроено во всяких «ненадежных» SSD, там ECC - это детские шалости.

anonymous
()
Ответ на: комментарий от anonymous

и как он узнает что неверно прочитал сектор?

Вообще-то у секторов бывает контрольная сумма.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Вообще-то у секторов бывает контрольная сумма.

И что ты хотел сказать? Повторить вот это: «ценность ECC нивелируется качеством локальной памяти носителя»?

anonymous
()
Ответ на: комментарий от anonymous

Я все прикидываю какой заказ отменить: на обычную память или на ecc. Пока что оба сделал с самовывозом.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Я все прикидываю какой заказ отменить

Ничего не отменяй! Всё бери! Чем больше лапши себе на уши развесишь, тем лучше макаронным фабрикам. И при любой непонятной ситуации перегружай систему reset’ом, а лучше полностью переустанови всю систему, предварительно все форматнув начисто. Так точно данные не испортишь и не потеряешь, потому что их не будет.

anonymous
()
Ответ на: комментарий от torvn77

Когда я был молодой и у меня в компе была куча винчестеров, а данные на диске хранились на нескольких разделах и заметил то, что компьютер в случае паралельного запуска нескольких процессов копирования начинает портить данные.

Дай повангую, nvidia чипсет?

Deleted
()
Ответ на: комментарий от Deleted

Не только он, по этому дело не в нём.

Моя версия импульсные помехи от механики позиционирования головок и возможно просто ошибки позиционирования.

Надо учитывать что порча данных наблюдалась в разной степени в зависимости от того как и куда копировались данные.

torvn77 ★★★★★
()
Ответ на: комментарий от Deleted

Ну и как нвидиевский чипсет мог повлиять на другие компы?

П.С. До чего вы все утомительны, разве нельзя внимательно прочитать то, что написано раньше?
Обязательно надо напрашиааться на повторное объяснение?

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от iZEN

Разучился читать? Я говорю о буферной памяти носителя.

То буферная, то локальная память. Тут лучше не уметь читать, а то начитаешься.

Почему бы носителю данные в «локальной памяти» не держать в том же виде, как будет читаться и записываться, то есть с «контрольными суммами»?

И здесь «контрольные суммы», надо больше «контрольных сумм» от «контрольных сумм». А то вдруг «контрольные суммы» испортятся, и что делать? Ура, нас спасет еще одна «контрольная сумма»! :)

anonymous
()
Ответ на: комментарий от torvn77

П.С. До чего вы все утомительны, разве нельзя внимательно прочитать то, что написано раньше?

До чего вы все утомительны. В голове подумали, написать забыли, а возмущаетесь. Где «другие компы» в этом треде от тебя?

контролёре

Упрлс?

P.S. А, это после этого твоего «глубокомысленного» довода ты теперь SAS LSI себе в комп поставил?

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от anonymous

Ничего не отменяй! Всё бери!

Не настолько богат =)

Чем больше лапши себе на уши развесишь, тем лучше макаронным фабрикам.

Так я и пытаюсь понять хоть какой-то смысл для меня в ней будет или это такое себе развлечение? В принципе люди говорят, что пару-тройку раз в месяц в логах сыпятся ошибки, выявленные ecc. Вопрос в том, сколько при этом не от памяти.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Если у тебя планируется важная числодробильная задача, занимающая 1-2-3 недели (ну и тебе, разумеется, нужен правильный результат), то ставь ECC.

Deleted
()
Ответ на: комментарий от praseodim

Если у тебя много ОЗУ то скопируй из urandom на tmpfs файлик не менее 3ГБ, посчитай его хешсумму, подожди пока она изменится.

По моему опыту при исправном ОЗУ он там будет лежать без изменений, вот при копировании на диск он может изменится с той или иной вероятностью в зависимости от конкретной ситуации.

torvn77 ★★★★★
()
Ответ на: комментарий от Deleted

Да вроде нет такой. Чтобы еще и счет непрерывный шел 1-2-3 недели, такого точно не планирую. Зарекаться не стану, но пока мои хобби не настолько ресурсожручие.

И сильно подозреваю, что задача с таким временем счета упрется не в ECC, а вообще в нестабильность работы обычных компов.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от torvn77

вот при копировании на диск он может изменится с той или иной вероятностью в зависимости от конкретной ситуации.

Что ты несёшь, иди отсюда с бреднями своими. UER у обычного (десктопного) диска - 10^14. Задолбаешься ждать.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 2)
Ответ на: комментарий от torvn77

Надо попробовать будет. Но обычно проблемы такого рода рано или поздно на чем-то вылазят, хотя бы на чексумах образов дисков или ошибках в раздаваемых (и скачиваемых) торентах.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от Deleted

Ну если система багованая, то может. Но раньше будут проблемы с распаковкой архивов и многие другие.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Ну если система багованная, то надо аппаратную неисправность исправлять (заменой неисправного компонента), а не ахинею нести (хотя после тараканного ролика с выпаиванием pch я ничему не удивляюсь)

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от praseodim

Я практически не встречал ошибок при чтении, только при записи.

Во вторых этот опыт получен на hdd, как будет с ssd я не знаю, но думаю что с ними как и с флешками должно быть всё хорошо.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от praseodim

ECC-память исправляет ошибки в передаче данных «на лету» - на аппаратном уровне. Это быстрее. Обычная память вынуждена тратить дополнительные циклы процессора (на повторные транзакции обмена) для правильной передачи данных. Это медленнее и вызывает единичные фризы (стопперы в играх).

iZEN ★★★★★
()
Ответ на: комментарий от anonymous

Очередной продажный блоггер наговаривает на АМД и продаёт ключи для богомерзкой проприетарной винды 🤢

впрочем, ничего нового

по-последниму опросу в стиме AMD захватили почти 20% рынка (и уже совсем скоро захватят весь), но при этом АБСОЛЮТНОЕ БОЛЬШИНСТВО ЖАЛОБ И ПРЕТЕНЗИЙ ИМЕННО НА НИХ!!!! ДАЖЕ ТУТ!!!!!

разве такое может быть? ты подумай!

конечно же это невозможно!!! а значит это всё проплаченные интелоботы везде спамят что на АМД чтото неработает!!! И ЕЩЁ БЛОГЕРОВ ПОДКУПАЮТ 100%!!!1

anonymous
()
Ответ на: комментарий от praseodim

В принципе люди говорят, что пару-тройку раз в месяц в логах сыпятся ошибки, выявленные ecc.

Ты тоже говори, что у тебя «25 см и каждую ночь 5 раз!». Но с «биологической точки зрения» смысл в том, что сколько у тебя детей, а не сколько сантиметров и сколько раз на дню А не звисимость ли это? На учете у нарколога стоишь?

Пока от тебя не был озвучен смысл «зачем нужен ecc». Если для того чтобы отметиться здесь на форуме, то лучше «иметь всё, что движется», а то пацаны засмеют. Ну хотя бы говори, что всё есть. Но лучше - бери всё! Чо лох, чтоли!

anonymous
()
Ответ на: комментарий от praseodim

Надо попробовать будет.

Для большей чувствительности можешь торрент сделать, указав не очень большой размер части.

И да, у меня на торрентах после сохранения на диск вылезало. При этом вероятность ошибки тем больше, чем больше потоков записи/чтения приходится на конкретный диск(самое вероятное при запуске встречного чтения), по этому на время сохранения файлов останавливал работу торрент-клиента.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 3)
Ответ на: комментарий от torvn77

При этом вероятность ошибки тем больше, чем больше потоков записи/чтения

Что за жесть? Зачем ты этим пользуешься, подари лучше соседу/врагу?

anonymous
()
Ответ на: комментарий от torvn77

Наверное суть в том, что если данные портятся при записи на диск (контроллером ли самим диском), то умный zfs-raid (или подобная ФС) за счёт контрольных сумм с какой-то вероятностью сможет их восстановить (за счет избыточности рейда), или хотя бы обнаружить ошибку. А если испортится до этого в памяти, то ошибка скорее останется незамеченной, когда на диск испорченные данные запишутся корректно с правильными чексуммами, и это не сразу не обнаружится

TheAnonymous ★★★★★
()

Насколько все же важна ECC-память

Очень важна для сохранности нервной системы админа, для серверов, по опыту, не очень.

King_Carlo ★★★★★
()
Ответ на: комментарий от TheAnonymous

Согласен, но zfs появилась позднее, до этого времени, когда я обнаружил порчу данных при копировании больших объёмов, особенно при встречном чтении я одну только винду знал, примерно в это время у меня появился Linux и я понял что это явление независит от ОС, но наличие на Linux tmpfs который я использовал как промежуточный буфер позволило обойти эту проблему.

В принципе если копировать по схеме диск-tmpfs-диск то порча данных происходила крайне очень редко и по этому я не ощущал это как большую проблему, основной мотив освоения zfs для меня это сквозная компрессия уровня 6, а райд и сохранение данных были второстепенным мотивом.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от torvn77

И да, у меня на торрентах после сохранения на диск вылезало. При этом вероятность ошибки тем больше, чем больше потоков записи/чтения приходится на конкретный диск(самое вероятное при запуске встречного чтения), по этому на время сохранения файлов останавливал работу торрент-клиента.

У тебя какая-то извиняюсь довольно глючная система получается. Я про ECC раздумываю в плане довольно редких эпизодических ошибок, а то что у тебя происходит - это или чипсет или память или даже не знаю, что еще.

Просто я у себя и встречное и не встречное и какое только копирование туда сюда всего разного не делал таких глюков не помню.

Самое неприятное, что случалось - это по непонятной причине отвал диска, который перестает видеться системой. После перезагрузки - нормально. Но это большая редкость. Когда-то давно у меня был комп с глючной памятью, вот там встречались приколы с битыми архивами после копирования. Сейчас ничего такого не было ни разу.

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от anonymous

Пока от тебя не был озвучен смысл «зачем нужен ecc». Если для того чтобы отметиться здесь на форуме, то лучше «иметь всё, что движется», а то пацаны засмеют. Ну хотя бы говори, что всё есть. Но лучше - бери всё! Чо лох, чтоли!

Ну к чему сарказм такой?

Как я понимаю, для потребления контента или даже для редактирования видео/фоток оно не важно. Даже если что-то битое попадется оно не факт, что будет заметно.

Но пытаюсь понять юзкейс с недельными расчетами или сервер с raid - это фактически единственные случаи, когда желательна ecc или все же нет? Ну то есть, действительно это валерьянка для нервов админа или что-то большее?

praseodim ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.