Это нормальное поведение ZFS?

Разве пул представлял собой mirror или один из видов raid, чтобы мог включиться hotspare и заменить повреждённый физический носитель?

iZEN ★★★★★
(02.07.24 21:26:01 MSK)

Ответ на: комментарий от iZEN 02.07.24 21:26:01 MSK

собственно да. У меня пул был создан, как raidz из 4-х дисков, 5-ый под горячую замену

pavel_l ★
(02.07.24 21:35:18 MSK) автор топика

Ссылка

Ничего не понял. Можно поподробней?

Harliff ★★★★★
(02.07.24 22:09:17 MSK)

Ответ на: комментарий от Harliff 02.07.24 22:09:17 MSK

Один из дисков пула по какой-то причине (возможно посыпался) потерял метку (выхлоп в первом сообщении). Ни избыточность, ни диск горячей замены не помогли и уже не помогут, официальное решение - уничтожение пула )) (ссылка там же в первом сообщении)

pavel_l ★
(02.07.24 22:28:10 MSK) автор топика

Ответ на: комментарий от pavel_l 02.07.24 22:28:10 MSK

А нет ли zpool status -x поглядеть? Чисто ради интереса.

BOOBLIK ★★★★
(02.07.24 22:29:33 MSK)
Последнее исправление: BOOBLIK 02.07.24 22:29:58 MSK (всего исправлений: 1)

Ссылка

я кроме RAID-1 икакой другой не использую. RAID-5 - это интересный механизм записи данных змейкой, но он и в Btrfs глючит, а с ZFS… теж самые проблемы, если верить гуглу. У всех какие-то сложности с его реализацией. Испытай тогда уж BcacheFS может он/она/оно/они не ломается

~~rtxtxtrx~~ ★★★
(02.07.24 23:09:32 MSK)
Последнее исправление: rtxtxtrx 02.07.24 23:11:11 MSK (всего исправлений: 1)

Ссылка

Пул не уничтожай. В теории можно написать скрипт чтобы вытянуть данные. Там же на каждом диске копируются какие-то данные с предыдущего. Нужно только подумать как все их собрать

~~rtxtxtrx~~ ★★★
(02.07.24 23:13:41 MSK)

zdb -l /dev/ada1

А остальные диски?

Harliff ★★★★★
(03.07.24 00:34:45 MSK)

Ссылка

Ответ на: комментарий от pavel_l 02.07.24 22:28:10 MSK

Там по ссылке ещё много чего говорится, а не только «грохни пул».

Harliff ★★★★★
(03.07.24 00:38:40 MSK)

Ссылка

А что со здоровьем накопителей? Один помер или два?

Harliff ★★★★★
(03.07.24 00:40:07 MSK)

Ссылка

Ответ на: комментарий от rtxtxtrx 02.07.24 23:13:41 MSK

Вот я бы тоже пул пока не грохал:

ZFS includes built-in metadata replication to prevent this from happening even for unreplicated pools

Harliff ★★★★★
(03.07.24 00:41:27 MSK)

Ссылка

Если у тебя меньше 256 Гб оперативной памяти, то zfs будет терять данные.

anonymous
(03.07.24 00:43:31 MSK)

Ссылка

Можно побольше информации?

Гадать о состоянии всего пула по «failed to unpack label 0» на одном физическом носителе из 4х не очень получается.

Harliff ★★★★★
(03.07.24 00:43:56 MSK)

хранение данных с избыточностью - значит возможно восстановление данных

нет, избыточность может быть только для контроля

Если грохнулся pool, то он уже прошел этапы деградации, hotspare (авто восстановление), снова деградации, …

Ты просто прощёлкал свой zfs

futurama ★★★★★
(03.07.24 07:18:46 MSK)
Последнее исправление: futurama 03.07.24 07:20:40 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Harliff 03.07.24 00:43:56 MSK

Сегодня вечером возьмусь за препарирование пула, покажу все подробнее. Пока могу только на словах - система на zfs имеет два пула:

nas_pool - хранилище из 4-х дисков с избыточностью raidz
system - 1 диск под систему

Автоматическое использование диска горячей замены указано в настройках пула, так же по расписанию раз в неделю запускается scrub для проверки целостности (к вопросу, о том, что прощелкал zfs) с отправкой отчета. Пул пропал одномоментно. На данный момент команды zpool list, zpool status выдают информацию только о целом имеющемся в системе пуле system. zdb -l по остальным трем дискам выдает полную информацию о метках. При попытке импорта zpool import выдает о наличии пула nas_pool и о невозможности его импорта. Ключ -f, импорт RO заканчиваются также corrupted

Начну с рекомендации импортировать пул на другой системе.

pavel_l ★
(03.07.24 09:21:56 MSK) автор топика

Ответ на: комментарий от pavel_l 03.07.24 09:21:56 MSK

zpool import выдает о наличии пула nas_pool и о невозможности его импорта

Так у тебя пул не развалился, а отвалился.

и о невозможности его импорта

Покажи как он ругается об этом?

BOOBLIK ★★★★
(03.07.24 10:28:30 MSK)

Ответ на: комментарий от BOOBLIK 03.07.24 10:28:30 MSK

я в первом сообщении так и написал - отвалился. Вечером все ошибки выложу

pavel_l ★
(03.07.24 10:57:30 MSK) автор топика

Ссылка

Ну вот и обещанные «портянки»:

Как можно увидеть пул только один - system

root@NAS:~ # zpool list
NAME     SIZE  ALLOC   FREE  CKPOINT  EXPANDSZ   FRAG    CAP  DEDUP    HEALTH  ALTROOT
system   107G  8.49G  98.5G        -         -     6%     7%  1.00x    ONLINE  -

естественно его статус - ОК

root@NAS:~ # zpool status
  pool: system
 state: ONLINE
  scan: scrub repaired 0B in 00:00:51 with 0 errors on Tue Aug 17 22:54:45 2021
config:

        NAME        STATE     READ WRITE CKSUM
        system      ONLINE       0     0     0
          ada2p3    ONLINE       0     0     0

errors: No known data errors

Здоровье в порядке

root@NAS:~ # zpool status -x
all pools are healthy

выхлоп zdb

zdb -l по 4-ём дискам из пула nas_pool

Ну и на последок попытка импорта пула

root@NAS:~ # zpool import
   pool: nas_pool
     id: 8864619166620872156
  state: FAULTED
status: The pool metadata is corrupted.
 action: The pool cannot be imported due to damaged devices or data.
        The pool may be active on another system, but can be imported using
        the '-f' flag.
   see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-72
 config:

        nas_pool                           FAULTED  corrupted data
          raidz1-0                         ONLINE
            gpt/WD_BLUE_WCC6Y3LKA9YS       ONLINE
            gpt/WD_BLUE_WCC3F5646375       ONLINE
            gpt/TOSHIBA_ACA100_69B5N62NS   ONLINE
            gpt/TOSHIBA_HDWH110_18K96AXNS  ONLINE

pavel_l ★
(03.07.24 17:49:12 MSK) автор топика

Ответ на: комментарий от pavel_l 03.07.24 17:49:12 MSK

Ну тут похоже только zfs import -nFX и рестор бэкапов поможет.

BOOBLIK ★★★★
(03.07.24 23:10:35 MSK)

Ссылка

Ответ на: комментарий от pavel_l 03.07.24 09:21:56 MSK

Уж не на дешмань-писяй-е-контроллере ли он висел?

anonymous
(04.07.24 02:19:27 MSK)

Ссылка

ZFS это ненадёжная технология. Для рейда надо покупать дорогие брендовые хардварные рейд-контролеры. Если что-то сломалось - рядом с диском загорается красная лампочка. Диск выкидываешь, замену вставляешь и всё, ничего восстанавливать не надо.

vbr ★★★★★
(04.07.24 02:36:54 MSK)

Ответ на: комментарий от vbr 04.07.24 02:36:54 MSK

сомнительное утверждение, да и у него судя по NAS - домашняя файлопомойка. ZFS с его проблемами с RAID5 aka RAIDZ ведет себя так же как Btrfs. Наверное, это какая-то родовая болезнь раз прогрессивные файловые системы не могут в этот RAID. Да и для файлопомойки и обычный mdadm raid10 с ext4 предпочтительнее. Зачем снапшоты какие-то для хранения мусора??? Тем более фильмы и прочая параша уже сжатые и сжать их невозможно

~~rtxtxtrx~~ ★★★
(04.07.24 04:57:03 MSK)

Ответ на: комментарий от rtxtxtrx 04.07.24 04:57:03 MSK

Зря так, бесплатные снапшоты это как раз одна из причин по которой была выбрана zfs, к слову делались они ежедневно. Сжатие фс тоже полезная штука, у меня хранилось достаточно много данных для которых сжатие было вполне актуально.

pavel_l ★
(04.07.24 07:47:59 MSK) автор топика

Ссылка

Ответ на: комментарий от rtxtxtrx 04.07.24 04:57:03 MSK

RAID 10 это ненадёжно. Лучше RAID 6. Что в RAID 10, что в RAID 5 вылет любого диска сразу ставит весь массив на грань поломки. При восстановлении данных на новый диск у тебя в массиве остаётся только одна реплика для данных и если что-то происходит хоть с одним сектором второго диска (а вероятность этого ненулевая, т.к. идёт большая нагрузка), то у тебя данные пропали, привет бэкап. В RAID 6 при вылете одного диска всё равно есть два источника для данных, то бишь при восстановлении должны поломаться ещё два сектора, причём оба в нужных местах, это прям очень маловероятно. И даже если ещё один диск вылетит, всё равно рейд не сдох. В общем RAID 6 это минимально допустимый уровень для систем, где большой даунтайм очень дорог. А рассыпавшийся при ребилде RAID 10 или 5 это норма.

Ну или RAID 1 из трёх дисков, для простоты и скорости, если объёмы не нужны.

vbr ★★★★★
(04.07.24 07:55:01 MSK)
Последнее исправление: vbr 04.07.24 07:56:48 MSK (всего исправлений: 2)

Ответ на: комментарий от vbr 04.07.24 07:55:01 MSK

Ну это очевидные вещи, чем больше избытычность - тем надежнее. И тут уже вопрос возможностей и целесообразности того или иного выбора.

pavel_l ★
(04.07.24 08:22:33 MSK) автор топика

Ссылка

Ответ на: комментарий от pavel_l 03.07.24 17:49:12 MSK

«The pool may be active on another system, but can be imported using the ‘-f’»

zpool import -f пробовали?

Harliff ★★★★★
(06.07.24 03:29:01 MSK)
Последнее исправление: Harliff 06.07.24 03:29:14 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 04.07.24 02:36:54 MSK

Вот Вы стебётесь, а вдруг поверит человек.

Harliff ★★★★★
(06.07.24 03:31:09 MSK)
Последнее исправление: Harliff 06.07.24 03:34:32 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от vbr 04.07.24 07:55:01 MSK

А рассыпавшийся при ребилде RAID 10 или 5 это норма.

Про 5 рейд слышал неоднократно, про 1 (10) - первый раз. Там же линейное чтение получается, от чего рассыпаться?

Harliff ★★★★★
(06.07.24 03:34:00 MSK)
Последнее исправление: Harliff 06.07.24 03:34:12 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от vbr 04.07.24 07:55:01 MSK

У меня был raid6 - тормознутая штука. Сейчас raid 10.

Harliff ★★★★★
(06.07.24 03:35:37 MSK)

Ответ на: комментарий от vbr 04.07.24 07:55:01 MSK

Кстати, есть zfs draid, который ребилдится быстрей. Но я его не пробовал.

Harliff ★★★★★
(06.07.24 03:42:41 MSK)

Ссылка

Ответ на: комментарий от Harliff 06.07.24 03:29:01 MSK

Да, установил новую систему пытался импортировать пул в неё, результат тот же.

pavel_l ★
(06.07.24 21:56:29 MSK) автор топика

Ответ на: комментарий от pavel_l 06.07.24 21:56:29 MSK

Выложите логи?

Harliff ★★★★★
(07.07.24 03:25:53 MSK)

Ссылка

Ответ на: комментарий от pavel_l 03.07.24 17:49:12 MSK

vdev_tree: type: ‘root’ id: 0 guid: 8864619166620872156 create_txg: 4 children[0]: type: ‘raidz’ id: 0 guid: 57248501214257434 nparity: 1

Почему был выбран «raid-z», а не «raid-z2» с удвоенным дублированием? «raid-z» может пережить потерю одного любого диска, а тут, видимо, отвалились какие-то два. На это указывает потеря 0, 1 и 3 меток на ada5/ada4/ada1, я думаю.

Похоже на то, что Вы решили сэкономить на дублировании в угоду получения больше дискового пространства для себя за что и поплатились.

UPD: https://superuser.com/questions/1305302/howto-recover-a-raidz-with-3-disk-that-faulted

dsl ★★
(07.07.24 11:04:57 MSK)
Последнее исправление: dsl 07.07.24 11:17:54 MSK (всего исправлений: 2)

Ответ на: комментарий от vbr 04.07.24 07:55:01 MSK

Лучше RAID 6. …
в RAID 10 … вылет любого диска сразу ставит весь массив на грань поломки.

Уверены?

А рассыпавшийся при ребилде RAID 10 или 5 это норма.

Вы складываете разные яйца в одну корзину.

Ну или RAID 1 из трёх дисков, для простоты и скорости

Ну и чем оно лучше raid 10 из 6 дисков акромя стоимости?

anc ★★★★★
(07.07.24 12:50:14 MSK)

Ссылка

Ответ на: комментарий от Harliff 06.07.24 03:35:37 MSK

У меня был raid6 - тормознутая штука. Сейчас raid 10.

А оно у вас на одном и том же железе работало?

anc ★★★★★
(07.07.24 12:52:29 MSK)

Ответ на: комментарий от anc 07.07.24 12:52:29 MSK

Да.

Harliff ★★★★★
(07.07.24 21:29:58 MSK)

Ссылка

Ответ на: комментарий от dsl 07.07.24 11:04:57 MSK

Почему был выбран «raid-z», а не «raid-z2» с удвоенным дублированием?

А если бы у меня был raidz2 вы бы видимо спросили почему не raidz3?

Похоже на то, что Вы решили сэкономить на дублировании в угоду получения больше дискового пространства для себя за что и поплатились.

Не надо заниматься гаданием, я выбрал то, что считал нужным для себя.

На это указывает потеря 0, 1 и 3 меток на ada5/ada4/ada1

Задавался этим же вопросом, надо более подробно почитать в документации zfs о метках, нормально ли это поведение или нет.

pavel_l ★
(08.07.24 07:45:26 MSK) автор топика

Ответ на: комментарий от pavel_l 08.07.24 07:45:26 MSK

А если бы у меня был raidz2 вы бы видимо спросили почему не raidz3?

raidz требует хотя бы три диска, а raidz2 - четыре. При условии, что новые диски в существующий raidz добавить нельзя, делаю вывод что у Вас с самого начала было хотя бы 4 диска. Наиболее логичным решением было бы создание либо одного raidz2 из всех четырёх, либо два зеркала по два диска, мне кажется.

Задавался этим же вопросом, надо более подробно почитать в документации zfs о метках, нормально ли это поведение или нет.

Как диски были подключены?

dsl ★★
(08.07.24 10:49:39 MSK)
Последнее исправление: dsl 08.07.24 10:50:17 MSK (всего исправлений: 2)

Ссылка

Все чудесатее и чудесатее. Читаю мануал (да, не оригинал) по zfs касательно меток -

Для повышения надёжности на диске присутствуют 4 метки - две в начале диска и две в конце (по номерам, соответственно, 1, 2 и 3, 4). Кроме того, при обновлении данных в метках вначале обновляются первая и третья, а потом - вторая и четвёртая. Это также повышает отказоустойчивость: если произошла ошибка при записи одной из пар, то может использоваться другая пара.

И тут же возникает вопрос, а какого, как говориться, у меня на всех дисках по одной метке??? Чуть ранее dsl уже обратил на это внимание и предположил, что остальные 3 метки на всех дисках так же были потеряны. Вроде бы сходится, но! У меня же есть еще один пул - system, смотрим метки у него:

root@NAS:~# zdb -l /dev/ada2
failed to unpack label 0
failed to unpack label 1
------------------------------------
LABEL 2
------------------------------------
    version: 5000
    name: 'system'
    state: 0
    txg: 17892862
    pool_guid: 18378120902235485168
    errata: 0
    hostname: ''
    top_guid: 8510313443781539880
    guid: 8510313443781539880
    vdev_children: 1
    vdev_tree:
        type: 'disk'
        id: 0
        guid: 8510313443781539880
        path: '/dev/ada2p3'
        whole_disk: 1
        metaslab_array: 128
        metaslab_shift: 30
        ashift: 12
        asize: 115731857408
        is_log: 0
        DTL: 583
        create_txg: 4
    features_for_read:
        com.delphix:hole_birth
        com.delphix:embedded_data
    labels = 2
failed to unpack label 3

Точно такая же ситуация - только одна, третья (label2) метка, при этом с пулом все ок, здоров, ошибок нет.

root@NAS:~# zpool status
  pool: system
 state: ONLINE
  scan: scrub repaired 0B in 00:00:51 with 0 errors on Tue Aug 17 22:54:45 2021
config:

        NAME        STATE     READ WRITE CKSUM
        system      ONLINE       0     0     0
          ada2p3    ONLINE       0     0     0

errors: No known data errors

Вопрос - метки где?

pavel_l ★
(09.07.24 18:29:11 MSK) автор топика

Ответ на: комментарий от pavel_l 09.07.24 18:29:11 MSK

Кроме того, при обновлении данных в метках вначале обновляются первая и третья, а потом - вторая и четвёртая.

Как диски были подключены?

dsl ★★
(09.07.24 23:51:19 MSK)

Ответ на: комментарий от dsl 09.07.24 23:51:19 MSK

Напрямую к sata на плате

pavel_l ★
(10.07.24 05:36:01 MSK) автор топика

Ссылка

Ответ на: комментарий от pavel_l 09.07.24 18:29:11 MSK

Это разве не от того, что разделов 0 и 1 нету в пуле?

PS: простите за некропостинг.

Clockwork ★★★★★
(24.12.24 13:22:09 MSK)
Последнее исправление: Clockwork 24.12.24 13:25:36 MSK (всего исправлений: 1)

Так что в итоге-то? Починил пул, не?

anonymous
(24.12.24 14:23:46 MSK)

Ссылка

Ответ на: комментарий от Clockwork 24.12.24 13:22:09 MSK

Не совсем понял, каких разделов нет в пуле?

Так что в итоге-то? Починил пул, не?

Нет, восстановил что получилось, остальное кануло в лету.

pavel_l ★
(24.12.24 15:42:52 MSK) автор топика

Ответ на: комментарий от pavel_l 24.12.24 15:42:52 MSK

каких разделов

zdb -l /dev/ada2p3

Нет, восстановил что получилось, остальное кануло в лету.

Соболезную. Потеря данных это всегда боль

anonymous
(24.12.24 17:49:45 MSK)

Ссылка

/dev/ada1

Нельзя собирать массивы по именам дисков /dev/sdX, надо по /dev/disk/by-id или /dev/disk/by-uuid. Могла буква диска поменяться и всё, хана массиву.

~~Pohmetolog~~
(24.12.24 22:47:33 MSK)

Ответ на: комментарий от Pohmetolog 24.12.24 22:47:33 MSK

Полностью согласен и если посмотреть чуть внимательнее, том можно увидеть, что pool был собран не по именам дисков, а по gpt меткам. Именно по этой причине.

pavel_l ★
(25.12.24 08:07:26 MSK) автор топика

Ссылка

Ответ на: комментарий от pavel_l 24.12.24 15:42:52 MSK

А были ли попытки найти какой именно диск был проблемным (не совсем уверен на счет метки) и отсоединить его, затем проверить состояние - должно быть ок, потому что raid-z и один диск как раз должен использоваться для избыточности?

anonymous
(20.01.25 14:27:41 MSK)

Ответ на: комментарий от anonymous 20.01.25 14:27:41 MSK

Нет не пробовал, но по идее у меня был диск горячей замены в пуле, который должен автоматически подменяьтся в случае выхода из строя одного из дисков массива. Этого не произошло, так что вряд ли дело было в диске, хотя …

pavel_l ★
(20.01.25 14:31:59 MSK) автор топика

Ссылка

Похожие темы