Ext4 и прозрачное сжатие директорий

0

3

Привет, ЛОР!

Скажи, а есть чо? Хочется прозрачного сжатия на уровне файловой системы для Ext4. Быстрый гугл не выдаёт ничего путного, но вдруг я не то ищу. В основном, гугл показывает всякие странные решения через FUSE с монтированием ZIP-архивов, что попахивает глюками и дикими тормозами.

Ситуация такая: есть старый хост с Ext4 вместо файловой системы, там база средней жирности (~300G) в PostgreSQL. Есть новый хост с ZFS и сжатием через lz4, там ровно та же база занимает ~70G реального места, то есть степень сжатия почти три раза. Хочется аналогичный результат на первом хосте без полного переформатирования диска.

Перемещено hobbit из general

←	не все дисковое пространство использовано при установке ubuntu 22.04 server

Как правильно очистить каталог .cache

→

← 1 2 3 4 5 6 →

Ответ на: комментарий от Anoxemian 20.05.24 21:40:10 MSK

Зачем БД фс

Хм, а как вы файлики без фс читать/писать планируете? Своего демона ещё запилить?

anc ★★★★★
(22.05.24 05:01:24 MSK)

Ответ на: комментарий от hateyoufeel 20.05.24 21:52:25 MSK

PostgreSQL на HDD в 2024 году – это для очень сильных духом, которые ну вообще никуда не торопятся.

Почему?

anc ★★★★★
(22.05.24 05:05:45 MSK)

Ответ на: комментарий от intelfx 21.05.24 23:17:35 MSK

Если номер прыгнул назад или чексумма не совпала — значит, запись невалидна и чтение журнала прекращается.

Если ты спроверяешь данные журнала по номерам, времени и контрольным суммам - это не атомарность.

А ещё журнал конечно хорошо, но есть ещё метаданные файла в инодах и они важнее. И получается главная польза журнала в дублировании метаданных как раз для проверки целостности если есть сбой. При желании точно так же можно дублировать метаданные вне журнала, писать одну копию до, вторую после операции, проверить их по контрольным суммам и это вряд ли можно назвать атомарностью записи, но будет достигнут тот же результат. И это не КоВ и не журнал, но иллюзия атомарности будет создана.

kirill_rrr ★★★★★
(22.05.24 06:02:02 MSK)

Ответ на: комментарий от anc 22.05.24 05:01:24 MSK

Хм, а как вы файлики без фс читать/писать планируете?

Размещению БД на RAW-устройствах , без ФС, сто лет в обед.

Psilocybe ★★★★
(22.05.24 06:19:59 MSK)

Ответ на: комментарий от intelfx 21.05.24 23:23:58 MSK

А я тебе о чём говорю?

А ты говоришь что данные будут полностью нечитаемы. Но если метаданные впорядке, то читаем старый набор блоков, новый отбрасываем.

Что такое «атомизировать операцию через запись метаданных»

Выбираем какой набор блоков надо перезаписать. Из индекса ФС выбираем место размещения новой версии. Пишем новые данные туда и запоминаем в оперативку новые метаданные. Когда данные записаны физически одной короткой комадой записываем новые метаданные, ссылающиеся на новые блоки. Т.к. записть данных на порядок дольше чем перезапись метаданных - на столько же падает шанс повреждений при внезапном крахе.

Допустим надо ещё снизить шанс сбоя, как раз на случай краха в момент записи метаданных. Можно вести журнал, а можно дублировать все метаданные, причём первую копию писать до записи данных а вторую после.

kirill_rrr ★★★★★
(22.05.24 06:40:32 MSK)

Ответ на: комментарий от intelfx 21.05.24 23:25:48 MSK

Описанный тобой способ называется CoW

КоВ это когда ты пишешь все операции логом на непрерывную ленту, а потом читаешь всё и по этим данным собираешь итоговый результат. Ну, с той разницей что лента не непрерывная, а пачка ленточек. А у меня предыдущая копия физически исчезает по окончании операции после записи метаданных.

kirill_rrr ★★★★★
(22.05.24 06:44:47 MSK)

Ответ на: комментарий от anc 22.05.24 04:39:50 MSK

Вы на спичках тоже экономите?

Может быть у его оператора VPS кусачие цены на дисковое пространство? Да и спички и кошельки быват разной степени жирности, кому то и пара БелАЗов - спички.

kirill_rrr ★★★★★
(22.05.24 06:47:34 MSK)

Ответ на: комментарий от anc 22.05.24 05:05:45 MSK

PostgreSQL на HDD в 2024 году – это для очень сильных духом, которые ну вообще никуда не торопятся.

Почему?

ахахахахахахахахахах

hateyoufeel ★★★★★
(22.05.24 10:08:42 MSK) автор топика

Ответ на: комментарий от Psilocybe 22.05.24 06:19:59 MSK

Размещению БД на RAW-устройствах , без ФС, сто лет в обед.

Примеры в студию.

anc ★★★★★
(22.05.24 15:05:29 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 06:47:34 MSK

Вроде речь не про vps.

anc ★★★★★
(22.05.24 15:07:20 MSK)

Ответ на: комментарий от anc 22.05.24 15:05:29 MSK

Размещению БД на RAW-устройствах , без ФС, сто лет в обед.

Примеры в студию.

Ну, оракел так умеет. Но мне кажется, это из времён когда FAT32 была новой прогрессивной ФС (оракловой базе скоро 50 лет стукнет!), и я сильно сомневаюсь, что в наши дни подобное даёт большой выигрыш.

PostgreSQL, к слову, без ФС не работает.

hateyoufeel ★★★★★
(22.05.24 15:08:41 MSK) автор топика
Последнее исправление: hateyoufeel 22.05.24 15:09:20 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 22.05.24 10:08:42 MSK

ахахахахахахахахахах

Я о вас был лучшего мнения.

anc ★★★★★
(22.05.24 15:10:08 MSK)

Ответ на: комментарий от anc 22.05.24 15:10:08 MSK

ахахахахахахахахахах

Я о вас был лучшего мнения.

Очень рад за тебя.

Тем не менее, вопрос «почему PostgreSQL на HDD для тех кто не торопится» довольно странен, учитывая скорости HDD. У меня тут ынтерпрайзный WD еле-еле 250 мегабайт/с из себя выжимает на чтение и это только по праздникам и только если его погладить по головке.

hateyoufeel ★★★★★
(22.05.24 15:11:55 MSK) автор топика
Последнее исправление: hateyoufeel 22.05.24 15:12:20 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 22.05.24 15:08:41 MSK

оракел
PostgreSQL

Это СУБД, а не БД.

anc ★★★★★
(22.05.24 15:12:03 MSK)

Ответ на: комментарий от hateyoufeel 22.05.24 15:11:55 MSK

Тем не менее, вопрос «почему PostgreSQL на HDD для тех кто не торопится» довольно странен, учитывая скорости HDD. У меня тут ынтерпрайзный WD еле-еле 250 мегабайт/с из себя выжимает.

И что? Вам мало 250 метров в секунду для работы СУБД?

anc ★★★★★
(22.05.24 15:17:51 MSK)

Ответ на: комментарий от anc 22.05.24 15:17:51 MSK

И что? Вам мало 250 метров в секунду для работы СУБД?

Да. Я тороплюсь.

hateyoufeel ★★★★★
(22.05.24 15:18:56 MSK) автор топика

Ответ на: комментарий от hateyoufeel 22.05.24 15:18:56 MSK

Да. Я тороплюсь.

Или говнокодите в виде select * from … outer join … outer join…

anc ★★★★★
(22.05.24 15:20:53 MSK)

Ответ на: комментарий от anc 22.05.24 15:20:53 MSK

А там не мой код крутится. Я его только запускаю.

Но это всё не важно, потому что нет смысла долбиться в HDD, когда можно поставить диск в 20 раз быстрее.

hateyoufeel ★★★★★
(22.05.24 15:22:29 MSK) автор топика

Ответ на: комментарий от anc 22.05.24 15:17:51 MSK

И что? Вам мало 250 метров в секунду для работы СУБД?

Ты не то меряешь, лол. Тебе важно сколько случайных операций может сделать HDD. HDD может ~200 IOPS, паршивенький SSD ~20k IOPS. HDD это как кривозубая шлюха на героине – сосет классно, но ты этому рад не будешь.

~~cumvillain~~
(22.05.24 15:22:59 MSK)

Ответ на: комментарий от cumvillain 22.05.24 15:22:59 MSK

О кривозубой шлюхе он вспомнит, когда гламурное ССДисо в лучшем случае умотает к любовнику-звиздецу со всеми данными, а вхудшем будет срать некорректными данными при чистом смарте и понторезных скоростях.

anonymous
(22.05.24 15:50:02 MSK)

Ответ на: комментарий от anonymous 22.05.24 15:50:02 MSK

у меня пока что только hdd сдыхали, ssd ещё не один, хотя первый завёлся ещё в 2012 году

anonymous
(22.05.24 15:51:56 MSK)

Ответ на: комментарий от anonymous 22.05.24 15:50:02 MSK

О кривозубой шлюхе он вспомнит, когда гламурное ССДисо в лучшем случае умотает к любовнику-звиздецу со всеми данными, а вхудшем будет срать некорректными данными при чистом смарте и понторезных скоростях.

В лужу, статистика говорит совершенно об обратном.

~~cumvillain~~
(22.05.24 16:06:23 MSK)

Ответ на: комментарий от anc 22.05.24 15:07:20 MSK

Даже если нет, серверные диски всё равно в разы дороже а контора не обязательно богатая и/или крупная. Можно найти тысячи причин экономить деньги и нет ни одной чтобы покупать более дорогое железо если есть более дешёвое решение.

А ещё там вроде бы упоминался прирост скорости работы...

kirill_rrr ★★★★★
(22.05.24 16:17:24 MSK)

Ответ на: комментарий от hateyoufeel 22.05.24 15:08:41 MSK

и я сильно сомневаюсь, что в наши дни подобное даёт большой выигрыш.

ФС в принципе не может дать выигрыша для работы БД - это лишний слой абстракции с дублированием одного и того же функционала и у разных ФС разное поведение. Но её используют для простоты, универсальности и надёжности.

kirill_rrr ★★★★★
(22.05.24 16:20:16 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:20:16 MSK

ФС в принципе не может дать выигрыша для работы БД

Шта? Прикинь я собрал ZPOOL из 16 дисков – у меня БД в 16 раз быстрее работает.

~~cumvillain~~
(22.05.24 16:21:51 MSK)

Ответ на: комментарий от anonymous 22.05.24 15:50:02 MSK

Серверные ССД сейчас весьма надёжны и не просто так стоят в 5 раз дороже бюджетных китайских tlc/qlc.

kirill_rrr ★★★★★
(22.05.24 16:22:41 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:22:41 MSK

Я тебе сейчас открою тайну, только тссс: tlc или qlc – это софтварная абстракция, которая настраивается контроллером. Флеш там один и тот же.

~~cumvillain~~
(22.05.24 16:24:10 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:21:51 MSK

А я собирал lvm-массив с черепичнм чередованием блоков по 1М из 2 древних дисков по 80Гб и получил прирост в 2 раза на ext2 и что? Это не заслуга ФС, это заслуга массива и железа.

kirill_rrr ★★★★★
(22.05.24 16:25:10 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:25:10 MSK

А я собирал lvm-массив с черепичнм чередованием блоков по 1М из 2 древних дисков по 80Гб и получил прирост в 2 раза на ext2 и что? Это не заслуга ФС, это заслуга массива и железа.

Какого массива? В ZFS все это внутри её делается. То что в лялексе у тебя есть возможность собирать софтварный рейд не означает, что эту же возможность нельзя принести в ФС (что и сделали в btrfs и bcachefs).

~~cumvillain~~
(22.05.24 16:26:06 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:24:10 MSK

Там требования точности в 4 раза выше. И это не софтвенный, это железный вопрос когда из за износа одна и та же ячейка получает одну и ту же абсолютную погрешность измерения или утечку заряда.

И нет, там разные флеши. В серверные ставят высококачественные чипы, а в бюджетку всё то, что было отбракованно из серверных.

kirill_rrr ★★★★★
(22.05.24 16:27:21 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:27:21 MSK

Там требования точности в 4 раза выше. И это не софтвенный, это железный вопрос когда из за износа одна и та же ячейка получает одну и ту же абсолютную погрешность измерения или утечку заряда.

Не, не железный. Это тупо настройка контроллера :D

~~cumvillain~~
(22.05.24 16:28:57 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:26:06 MSK

В ZFS все это внутри её делается.

А в lvm снаружи. Что это меняет? Массивы с чередованием кстати не рекомендованы для важных данных - там шанс отказа с потерей растёт по экспоненте, а без чередования при сбое одного диска файл с высокой вероятностью окажется целиком на одном устройстве и будет подлежать восстановлению.

kirill_rrr ★★★★★
(22.05.24 16:29:24 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:29:24 MSK

А в lvm снаружи. Что это меняет? Массивы с чередованием кстати не рекомендованы для важных данных - там шанс отказа с потерей растёт по экспоненте, а без чередования при сбое одного диска файл с высокой вероятностью окажется целиком на одном устройстве и будет подлежать восстановлению.

RAID6 не рекомендован для важных данных? Да ты же поехал!

~~cumvillain~~
(22.05.24 16:30:38 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:24:10 MSK

открою тебе еще более страшную тайну !!
у TLC и QLC еще количество записей в ячейку отличается на ~ порядок :)
физику в школе не надо было прогуливать…

pfg ★★★★★
(22.05.24 16:31:03 MSK)

Ответ на: комментарий от pfg 22.05.24 16:31:03 MSK

у TLC и QLC еще количество записей в ячейку отличается на ~ порядок :)

А ты понимаешь почему оно различается? :)

~~cumvillain~~
(22.05.24 16:31:28 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:31:28 MSK

конечно же :) я ж физику в школе хотя б не прогуливал…

pfg ★★★★★
(22.05.24 16:32:52 MSK)

Ответ на: комментарий от pfg 22.05.24 16:32:52 MSK

конечно же :) я ж физику в школе хотя б не прогуливал…

Молодец!

~~cumvillain~~
(22.05.24 16:33:59 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:30:38 MSK

Ты определись, тебе х16 скорости или надёжность? райд6 это про надёжность и он самый медленный из райдов.

kirill_rrr ★★★★★
(22.05.24 16:42:04 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:42:04 MSK

Ты определись, тебе х16 скорости или надёжность? райд6 это про надёжность и он самый медленный из райдов.

В mdraid? Да. В любой адекватной кешированной реализации? Нет.

~~cumvillain~~
(22.05.24 16:43:12 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:28:57 MSK

Зато нзинос ячейки - железный. И если ты прошил чип под qlc, то немного попользовавшись и словив ошибку ты не сможешь перешить его под mlc чтобы продолжить работу.

kirill_rrr ★★★★★
(22.05.24 16:43:58 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:43:58 MSK

Зато нзинос ячейки - железный. И если ты прошил чип под qlc, то немного попользовавшись и словив ошибку ты не сможешь перешить его под mlc чтобы продолжить работу.

Никто этого и не утверждал.

~~cumvillain~~
(22.05.24 16:44:32 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:43:12 MSK

Т.е. дело не в крутом массиве zfs, а в том, что ты прикрутил туда bcache? Одначе...

kirill_rrr ★★★★★
(22.05.24 16:45:33 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:45:33 MSK

Т.е. дело не в крутом массиве zfs, а в том, что ты прикрутил туда bcache? Одначе…

Ты просто мыслишь категориями блочного лялекса.

~~cumvillain~~
(22.05.24 16:46:01 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:44:32 MSK

Ну так а какой к чёрту софт, если железка сдохла и реанимации не подлежит?

kirill_rrr ★★★★★
(22.05.24 16:46:15 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:46:01 MSK

А неблочного лялекса как бы не существует.

kirill_rrr ★★★★★
(22.05.24 16:46:43 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:46:15 MSK

Ну так а какой к чёрту софт, если железка сдохла и реанимации не подлежит?

Речь про то, что TLC/QLC/MLC это все один и то же флеш, никакого «китайского флеша» специально для QLC нет.

~~cumvillain~~
(22.05.24 16:46:53 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:46:43 MSK

А неблочного лялекса как бы не существует.

zfs, btrfs, bcachefs. Они все реализуют рейды сами, без device mapper.

~~cumvillain~~
(22.05.24 16:47:35 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:46:53 MSK

Есть. Это то, что было отбракованно корейцами и тайваньцами и не пошло в серверные mlc, потом не пошло на mlc-кеш хороших десктопных ссд, а потом было забракованно в роли tlc/qlc массива в приличных дисках. Затем оно выкупается китайским подвалом, паяется к уценённому контроллеру и продаётся как топ рынка по соотношению цена/объём.

kirill_rrr ★★★★★
(22.05.24 16:50:18 MSK)

Ответ на: комментарий от kirill_rrr 22.05.24 16:50:18 MSK

Есть. Это то, что было отбракованно корейцами и тайваньцами и не пошло в серверные mlc, потом не пошло на mlc-кеш хороших десктопных ссд, а потом было забракованно в роли tlc/qlc массива в приличных дисках. Затем оно выкупается китайским подвалом, паяется к уценённому контроллеру и продаётся как топ рынка по соотношению цена/объём.

О господи…

~~cumvillain~~
(22.05.24 16:50:41 MSK)

Ответ на: комментарий от cumvillain 22.05.24 16:47:35 MSK

Они все как бы блочные ФС для блочных устройств...

А в каком именно модуле ядра реализован рейд не сказывается вот вообще ни на чём, а особенно на логике чередования блоков по дискам и следующему из этого ускорению.

kirill_rrr ★★★★★
(22.05.24 16:53:20 MSK)

← 1 2 3 4 5 6 →

←	не все дисковое пространство использовано при установке ubuntu 22.04 server

Admin

Как правильно очистить каталог .cache

→

Похожие темы