LINUX.ORG.RU
ФорумTalks

Про ECC и ошибки (битые торренты)

 


1

2

Держу в курсе.

Сетап:
Рабочая машина на ubuntu 16.04 на AM3+. Поставил на эту машину модули с ECC на НГ 2019-2020. На этой машине три диска по 8000G под хранение всякого восстановимого барахла.

Игровая машина на windows 10 на 1155 с «обычными» модулями.

Клиентом uTorrent проводил перехеширование (данных достаточно много для оценки, на слово поверьте). Итого:
Вариант исходный. Диски на машине с ECC расшарены в сеть самбой и подключены к игровой, на которой работает uTorrent. Перехеширование проводил периодически, специально. Ошибки стабильно были, на около 10% торрентов.

Вариант текущий. На рабочей машине поднял виртуальную машину с windows 10 и выдал ей диски целиком. Клиент uTorrent работает в этой виртуалке. Диска выданы в сеть силами этой же виртуальной венды. Ошибок НЕТ. Я прогнал два раза - НИ ОДНОЙ ОШИБКИ. Прогон перехеширования занимает более 2 суток.

Делайте выводы.

★★★★★

Последнее исправление: targitaj (всего исправлений: 1)

Делайте выводы

«Самбу» в утилизацию.

Korchevatel ★★★★★
()

при возможности проверь другими модулями памяти. вдруг, от ECC одно название. типа маркетинговый ход.

простые планки памяти просто работают: а с чего они должны были сыпать ошибками?

ну и да, производителей чипов памяти фстудию. не удивлюсь если простая память от Samsung, а ECC от Hynix. ;)

Spoofing ★★★★★
()
Ответ на: комментарий от Spoofing

при возможности проверь другими модулями памяти. вдруг, от ECC одно название. типа маркетинговый ход.

Планки с ECC не делают никакой магии, на них тупо или есть «лишняя» микросхема памяти, или ее нет. Все проверки и коррекция происходят в самом процессоре (контроллере памяти).

Khnazile ★★★★★
()

Делайте выводы.

Какая-то из сторон при работе по сети ленилась проверять контрольные суммы на уровне ethernet.

GPFault ★★
()

расшарены в сеть самбой

У меня лет 7 назад была точно такая-же проблема. Тоже с utorrent’ом и самбой. ECC не было ни на сервере, ни на венде.

DawnCaster ★★
()
Последнее исправление: DawnCaster (всего исправлений: 1)
Ответ на: комментарий от GPFault

контрольные суммы на уровне ethernet.

да, 16-битные контрольные суммы - это позор современной сети
эзернет ловит на провод ошибки, и самые удачливые из них (одна на 60 тыс) пишутся в файлы контента
что удивительного в том, что на больших объёмах эти ошибки пролезают?

предположим, что у ОП было 1000 торрент-раздач общим весом 8 Тбайт
10% торрентов - с ошибками
значит, примерно 100 непойманных ошибок
с учётом пойманных было грубо порядка 6 млн ошибок
8 ТБайт / 6 млн ошибок = где-то 1 МБайт / 1 ошибку
это очень хорошая сеть, если там только одна ошибка на 10 миллионов бит
а вот если 1 ошибку на 1 мегабайт допускает оперативка, то это очень плохая оперативка, ты на ней даже винду не запустишь

короче, дело не в «чудесной ЕЦЦ-памяти»

Egor_
()
Последнее исправление: Egor_ (всего исправлений: 1)

uTorrent

А, заметил, тогда вопросы отпадают. Чего ж нормальными клиентами не пользуетесь?

Korchevatel ★★★★★
()
Ответ на: комментарий от Egor_

В принципе, надо попробовать к игровой машине подключить расшаренные виратульной вендой диски и еще раз прогнать перехеширование с игровой машины, по сети. Что мы исключим в этом случае? Точно исключим самбу. Что еще?

targitaj ★★★★★
() автор топика

Какая модель материнки и процессора? А то я в свою материнку могу ECC память воткнуть, вот только работать она будет в Non-ECC режиме.

V1KT0P ★★
()
Ответ на: комментарий от GPFault

Какая-то из сторон при работе по сети ленилась проверять контрольные суммы на уровне ethernet.

Хрена себе, ты самбу переписал, чтоб она прямо через голимый ethernet работала ??

vasya_pupkin ★★★★★
()
Ответ на: комментарий от Egor_

контрольные суммы на уровне ethernet.

да, 16-битные контрольные суммы - это позор современной сети

Ребзя, вам в ПТУ про OSI что-нибудь рассказывал трудовик ?

vasya_pupkin ★★★★★
()
Последнее исправление: vasya_pupkin (всего исправлений: 1)

Ещё вариант - у тебя HDD на машине с виндой сыпятся ошибками (а там куда-то во временный файл на них пишутся данные и портятся). SMART выйдет сегодня погулять в тред или он на самоизоляции?

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 2)
Ответ на: комментарий от vasya_pupkin

Хрена себе, ты самбу переписал, чтоб она прямо через голимый ethernet работала ??

На уровне TCP - контрольные суммы 16бит - это точно хуже, чем на уровне ethernet, поэтому я и упомянул ethernet.

А на уровне samba - есть ли они вообще? Большинство приложений где не используется проверка цифровой подписи подразумевает что через сокет проходит без ошибок.

Про уровень smb - https://serverfault.com/questions/946887/smb-cifs-verify-data-integrity

То есть от настроек зависит.

GPFault ★★
()
Последнее исправление: GPFault (всего исправлений: 2)
Ответ на: комментарий от GPFault

На уровне TCP - контрольные суммы точно хуже, чем на уровне ethernet, поэтому я и упомянул ethernet.

В твоей реальности контрольные суммы существуют либо в ethernet либо в tcp ? Те если ethernet кадр верный, то tcp свою чексумь не проверяет ?

vasya_pupkin ★★★★★
()
Последнее исправление: vasya_pupkin (всего исправлений: 2)
Ответ на: комментарий от vasya_pupkin

Про уровень smb - https://serverfault.com/questions/946887/smb-cifs-verify-data-integrity

То есть от настроек зависит.

По факту tcp + ethernet дают контрольную сумму в 48бит - довольно много. Если кабель очень плохзой и сажает ошибки в каждом втором пакете, то примерно каждый из 2**48 пакетов он будет пропускать ошибочно. То есть надо пропустить 100 000 ТБайт чтоб словить ошибку на плохом кабеле.

В твоей реальности контрольные суммы существуют либо в ethernet либо в tcp ? Те если ethernet кадр верный, то tcp свою чексумь не проверяет ?

В моей реалности - в софте и железе баги из-за оптимизаций:

Цитирую исходное предположение:

Какая-то из сторон при работе по сети ленилась проверять контрольные суммы на уровне ethernet.

GPFault ★★
()
Последнее исправление: GPFault (всего исправлений: 1)
Ответ на: комментарий от GPFault

Какая-то из сторон при работе по сети ленилась проверять контрольные суммы на уровне ethernet.

То она отловит ее на уровне tcp :) Ethernet до самбы не дойдет вааще никак...

vasya_pupkin ★★★★★
()
Последнее исправление: vasya_pupkin (всего исправлений: 1)
Ответ на: комментарий от vasya_pupkin

на уровне tcp увы жалкие 16бит. Вот их реально мало, тут на 100МБ уже при плохом кабеле можно проблему поймать.

GPFault ★★
()
Ответ на: комментарий от GPFault

на уровне tcp увы жалкие 16бит. Вот их реально мало, тут на 100МБ уже при плохом кабеле можно проблему поймать

Пля, ты по кабелю гоняешь ethernet или tcp?

Или все же tcp через ethernet?

Про osi все же почитай на летних каникулах, оно в жизни пригодится, чтоб фигню не писать....

vasya_pupkin ★★★★★
()
Последнее исправление: vasya_pupkin (всего исправлений: 1)
Ответ на: комментарий от praseodim
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
edac-util: No errors to report.
targitaj ★★★★★
() автор топика
Ответ на: комментарий от Egor_

теоретически он может задействовать NFSv4 в связке с керберос (если умеет его настраивать). M$ сейчас это поддерживает.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.