OpenZFS 2.3.0

0

3

Привет, ЛОР!

Вышла новая версия замечательного проекта OpenZFS, реализующего файловую систему ZFS. Изначально ZFS была разработана компанией Sun под названием Zettabyte File System (позже название было сокращено до просто ZFS) и поставлялась в ОС Solaris начиная с 2005 года. После покупки Sun корпорацией Oracle, исходники Solaris были закрыты. Проект OpenZFS был основан как форк последней открытой версии кода от Sun. Начиная с OpenZFS 2.0, он был объединён с наработками ZFS-on-Linux и в настоящее время поддерживает системы Linux и FreeBSD. Энтузиастами также развиваются порты для ОС Windows, macOS, Illumos и NetBSD.

Изменения в версии 2.3.0:

поддержка расширения массивов RAIDZ новыми дисками;
переработан алгоритм дедупликации данных. Новый алгоритм показывает куда лучшую производительность;
поддержка прямого обращения к диску в обход ARC, что в некоторых случаях позволяет улучшить производительность, особенно с NVMe дисками;
большинству команд в консоли добавлена поддержка вывода данных в формате JSON;
максимальная длина имён файлов и каталогов увеличена с 255 до 1023 байт;
множество мелких исправлений и улучшений;
поддерживаемые версии ОС: Linux 4.18–6.12, FreeBSD 13.3, 14.0–14.2.

Помимо этого, в декабре вышли минорные версии 2.1.16 и 2.2.7 с исправлениями.

>>> Подробности

Ссылка

←	Rsync 3.4.0

PostgreSQL заняла второе место в мировом рейтинге роста популярности СУБД

→

← 1 2 →

Ответ на: комментарий от hateyoufeel 16.01.25 17:06:21 MSK

Засада не в ядре, а в ограничении на длину имени в каждой файловой системе. Если файловая система отдала длинный путь, то ядро его внутри сисколла прожует как-то.

Из ядра:

/*
 * Structure of a directory entry
 */
#define EXT4_NAME_LEN 255
/*
 * Base length of the ext4 directory entry excluding the name length
 */
#define EXT4_BASE_DIR_LEN (sizeof(struct ext4_dir_entry_2) - EXT4_NAME_LEN)

struct ext4_dir_entry {
	__le32	inode;			/* Inode number */
	__le16	rec_len;		/* Directory entry length */
	__le16	name_len;		/* Name length */
	char	name[EXT4_NAME_LEN];	/* File name */
};

gns ★★★★★
(16.01.25 17:10:43 MSK)
Последнее исправление: gns 16.01.25 17:13:12 MSK (всего исправлений: 1)

Ответ на: комментарий от liksys 16.01.25 15:43:51 MSK

Поздравляю, а на минте уже поезд ушёл. 🤡

Clockwork ★★★★★
(16.01.25 17:11:24 MSK)

Ссылка

Ответ на: комментарий от gns 16.01.25 17:10:43 MSK

Это не совсем так. В люнегзе для пользовательского API стоит лимит 255 символов.

https://github.com/torvalds/linux/blob/master/include/uapi/linux/limits.h#L12

Я особо не копал на тему, проверяется ли он где-то. Но судя по быстрому грепу, это число дофига где используется..

hateyoufeel ★★★★★
(16.01.25 17:13:51 MSK) автор топика
Последнее исправление: hateyoufeel 16.01.25 17:14:51 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 16.01.25 17:13:51 MSK

Ну, то есть, сверху имена длиннее 255 байт не пхать. Ну разумно, чо! Когда-то 16 байт что-ли было :)

Но судя по быстрому грепу, это число дофига где используется..

Мне пока только проверки на PATH_MAX попадались.

Да, я проверил по https://elixir.bootlin.com/linux/v6.12.6/A/ident/NAME_MAX

Это ограничение больше используется в драйверах файловых систем и на стыке VFS и драйвера. Оно ниже моих текущих ядерных потребностей. И то, далеко не везде. В NTFS-е том же имена длиннее. Походу, это какое-то наследие старых времен. Может где в libc и есть, и то не факт, NTFS бы не работал.

И да, ты ж сам написал:

Максимальная длина имён файлов и каталогов увеличена с 255 до 1023 байт;

Ну и где та константа NAME_MAX?

gns ★★★★★
(16.01.25 17:20:36 MSK)
Последнее исправление: gns 16.01.25 17:35:35 MSK (всего исправлений: 4)

Ответ на: комментарий от gns 16.01.25 17:20:36 MSK

И да, ты ж сам написал:

Максимальная длина имён файлов и каталогов увеличена с 255 до 1023 байт;

Я нигде не писал, что это гарантировано работает повсюду. Это вообще строчка из их релиза, не понимаю причём тут я.

Плюс, учти, что ZFS поддерживает не только Linux. В FreeBSD всё может быть чуть иначе, мне лень смотреть.

hateyoufeel ★★★★★
(16.01.25 17:38:58 MSK) автор топика
Последнее исправление: hateyoufeel 16.01.25 17:39:29 MSK (всего исправлений: 1)

Поддержка прямого обращения к диску в обход ARC

WAT? … а, O_DIRECT таки завезли, а раньше не было?.. интересно…

ei-grad ★★★★★
(16.01.25 17:44:11 MSK)

Ответ на: комментарий от gns 16.01.25 16:44:36 MSK

это потому что линукс - не TruЪ UNIX(TM)!

UNIX System V has a filename size limit of 14 characters. Ken Thompson thought is was an acceptable limit.

так что ZFS лишь продолжала традицию. И так по царски до 256 расиширила! ))))))

mumpster ★★★★★
(16.01.25 17:47:32 MSK)

Ответ на: комментарий от hateyoufeel 16.01.25 17:38:58 MSK

а Боромир увеличил бы сразу до 2046!

mumpster ★★★★★
(16.01.25 17:48:24 MSK)

Ссылка

Ответ на: комментарий от gns 16.01.25 17:20:36 MSK

Когда-то 16 байт что-ли было

14!

mumpster ★★★★★
(16.01.25 17:48:57 MSK)
Последнее исправление: mumpster 16.01.25 17:49:16 MSK (всего исправлений: 2)

Ответ на: комментарий от hateyoufeel 16.01.25 17:38:58 MSK

Ну так есть какое-то старое ограничение на длину имени. Эта константа не универсальная, кое-где осталась, но, судя по коду ядра, — именно, что «кое-где». А для dentry для каждой файловой системы действует свой лимит. В основном — 255 байт, но есть нюансы в обе стороны.

https://en.wikipedia.org/wiki/Comparison_of_file_systems#Limits

gns ★★★★★
(16.01.25 17:59:13 MSK)

Ссылка

Ответ на: комментарий от mumpster 16.01.25 17:47:32 MSK

Заезжай в гости, Venix (который System III) на Pro380 поставим, проверим! Если пятидерьмовые дискеты с дистрибутом еще не сдохли :)

gns ★★★★★
(16.01.25 18:01:42 MSK)

Ссылка

Прекрасно. Ждём в Proxmox. Надо тесты погонять - если с direct io нет просадки, то буду optane с lvm на zfs переводить.

Harliff ★★★★★
(16.01.25 18:15:06 MSK)

Ответ на: комментарий от mumpster 16.01.25 17:48:57 MSK

Ну, вон в одном известном ТруЪ-Unix с бумажкой до сих пор:

#define _POSIX_NAME_MAX 14

Только что проверил. А в ихнем яблочном HFSe таки 255, кстати.

gns ★★★★★
(16.01.25 18:25:50 MSK)

Ссылка

Ответ на: комментарий от Harliff 16.01.25 18:15:06 MSK

Помнится, имел я отношение к разработке некого российского аналога с идеологией OpenNAS, но размером с массив от «Ядра», там как раз использовались оптаны как раз с ZFS-томами. Мы сравнивали перформанс нашего поделия с чем-то китайским поэнтерпрайзнее Свинолоджи, но поменьше Хуавея, уж не помню как оно называлось, ну так наше поделие просасывало по перформансу, что называется «не нагибаясь» :(. Дело было довольно давно, то ли ZFS тогда такой был, то ли мы его готовить не умели, но что-то все грустные ходили. Вот на чем то же Ядро свои массивы строит я чот спросить не догадался, хоть и мог бы. Я тут недавно встретил своего бывшего коллегу случайно, он датацентрами какими-то рулит, так поделия от «Ядра» он хвалил очень.

gns ★★★★★
(16.01.25 18:44:10 MSK)
Последнее исправление: gns 16.01.25 19:06:15 MSK (всего исправлений: 1)

Ответ на: комментарий от gns 16.01.25 18:44:10 MSK

Да, интересно, что там под капотом.

И интересны бенчмарки zfs на optane.

Harliff ★★★★★
(16.01.25 19:46:07 MSK)

Ответ на: комментарий от Harliff 16.01.25 19:46:07 MSK

Вот этого я уже не помню, еще сильно до ковида дело было. Да и это была рабочая информация, была бы под рукой, все равно бы я поделиться не смог.

gns ★★★★★
(16.01.25 20:08:10 MSK)

Ссылка

Ответ на: комментарий от Harliff 16.01.25 19:46:07 MSK

И интересны бенчмарки zfs

… вечное out-of-tree

на optane.

… RIP

no-dashi-v2 ★★★
(16.01.25 20:59:21 MSK)

Ссылка

Ответ на: комментарий от ei-grad 16.01.25 17:44:11 MSK

WAT? … а, O_DIRECT таки завезли, а раньше не было?.. интересно…

O_DIRECT – это фикция. В половине случаев оно не работает, на самом деле.

Хуже того, в случае того же L2ARC, непонятно что вообще это O_DIRECT должно делать: писать мимо кэша страниц в памяти в кэш на промежуточном диске? Или писать сразу на целевой диск мимо промежуточного? Или и туда и туда? Как насчёт сетевых ФС?

В общем, нюансов просто вагон.

hateyoufeel ★★★★★
(16.01.25 21:00:38 MSK) автор топика

Ссылка

Ответ на: комментарий от ei-grad 16.01.25 17:44:11 MSK

Если бы все было так просто, так SPDK бы не придумали. Народ в основном в обход ядра через этот самый SPDK перформанса добивается. Та же история, что и с DPDK, только про диски.

gns ★★★★★
(16.01.25 21:03:22 MSK)

Ссылка

Это конечно все круто но как этот zfs в плане шифрования и загрузки с dracut норм? Он быстрее например связки luks2 btrfs на nvme мм? Ещё видел что можно создавать в нем же пулл с другой файловой системой это миф или как мм?

SPRATAY ★★
(16.01.25 22:14:12 MSK)

Ссылка

Ответ на: комментарий от hobbit 16.01.25 14:29:54 MSK

Стоит ли смотреть в сторону этой ФС домашнему десктопному линуксоиду

Дома - это даром не надо. В подавляющем большинстве случаев это и в конторе - не надо. Проще нормальный рейд купить, или уже схд внедрять, чем с этим вот голову морочить себе. Хотя, я могу допустить сценарии, где это вот может быть востребованно, но, как по мне лично, это сильно отдает колхозом на линуксе.

DrRulez ★★★★
(17.01.25 00:12:02 MSK)

Ответ на: комментарий от DrRulez 17.01.25 00:12:02 MSK

Проще нормальный рейд купить

АПХАХАХАХАХАХАХАХАХАХАХАХАХ адепты хардварных рейдов в чате! Все в машину!

hateyoufeel ★★★★★
(17.01.25 01:14:56 MSK) автор топика

Я правильно помню, что пользоваться этим невозможно, потому что его не принимают в ядро из-за лицензий?

Shushundr ★★★★
(17.01.25 01:16:44 MSK)

Ответ на: комментарий от Shushundr 17.01.25 01:16:44 MSK

Я правильно помню, что пользоваться этим невозможно, потому что его не принимают в ядро из-за лицензий?

Нет, неправильно.

hateyoufeel ★★★★★
(17.01.25 01:21:33 MSK) автор топика
Последнее исправление: hateyoufeel 17.01.25 01:21:42 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от hateyoufeel 17.01.25 01:14:56 MSK

но что интересно, у оракла (Sun HW) было поделие где из сервера делали схд и как раз на схд. возможно даже, что ещё до сих пор доступно. на самом деле схд имеет смысл, там все ваши проблемы типа разруливаются менеджерами среднего звена из вендора (читай, перекладываются на индусов из Бангалора).

mumpster ★★★★★
(17.01.25 05:05:10 MSK)

Ответ на: комментарий от hateyoufeel 16.01.25 16:38:35 MSK

Ну если тебе снапшоты нужны и месье понимает толк в извращениях, то в добрый путь, как грится…. :)

Инкрементальные бэкапы – это очень и очень круто и удобно

Снапшоты и инкрементальные бакапы - немного разные вещи.

qwe ★★★
(17.01.25 08:21:38 MSK)

Ссылка

Ответ на: комментарий от mumpster 17.01.25 05:05:10 MSK

С СХД всё норм, я над «купить нормальный рейд» ржу.

hateyoufeel ★★★★★
(17.01.25 08:26:51 MSK) автор топика

Ссылка

Ответ на: комментарий от hobbit 16.01.25 14:29:54 MSK

Или для него и ext4 выше крыши?

Плюсы:

встроенная проверка целостности данных, может спасти от хранения битых файлов в бэкапе.
снапшоты можно использовать для дополнительной подстраховки или как средство инкрементального бэкапа.
сжатие полезно, но не для фоточек с роликами.

Минусы:

усложнение конфигурации. Ничего необычного, но любая сложность увеличивает риск человеческой ошибки.
не получиться использовать свежие ядра на железке.
любит кушать память. Может потребоваться дополнительная настройка в некоторых случаях.

Предпочитаю использовать zfs на серваках и для рейдов с избыточностью, а на десктопах btrfs, когда нет рейда или избыточность не нужна.

Если не использовать фишки zfs, то и плюсов от неё особо для файлопомойки не будет. С другой стороны, у ext4 плюсов просто нет.

altwazar ★★★★★
(17.01.25 10:25:19 MSK)
Последнее исправление: altwazar 17.01.25 10:25:38 MSK (всего исправлений: 1)

Ссылка

Для того чтобы оставить комментарий войдите или зарегистрируйтесь.

← 1 2 →

←	Rsync 3.4.0

Open Source

PostgreSQL заняла второе место в мировом рейтинге роста популярности СУБД

→

Похожие темы