Ext4 и прозрачное сжатие директорий

0

3

Привет, ЛОР!

Скажи, а есть чо? Хочется прозрачного сжатия на уровне файловой системы для Ext4. Быстрый гугл не выдаёт ничего путного, но вдруг я не то ищу. В основном, гугл показывает всякие странные решения через FUSE с монтированием ZIP-архивов, что попахивает глюками и дикими тормозами.

Ситуация такая: есть старый хост с Ext4 вместо файловой системы, там база средней жирности (~300G) в PostgreSQL. Есть новый хост с ZFS и сжатием через lz4, там ровно та же база занимает ~70G реального места, то есть степень сжатия почти три раза. Хочется аналогичный результат на первом хосте без полного переформатирования диска.

Перемещено hobbit из general

Ссылка

←	не все дисковое пространство использовано при установке ubuntu 22.04 server

Как правильно очистить каталог .cache

→

← 1 2 3 4 5 6 →

купи постгрю про энтерпрайз, он умеет сжимать нативно )

anonymous
(21.05.24 06:51:51 MSK)

Ссылка

Ответ на: комментарий от Andrew-R 21.05.24 06:29:22 MSK

Кстати вот ещё, hfs+ под макОС 10.6+ умеет в сжатие:

https://github.com/RJVB/afsctool

Не знаю правда, открыта ли ядерная часть драйвера ….

Andrew-R ★★★★★
(21.05.24 07:45:04 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 20.05.24 23:12:03 MSK

Кстати, чем та Санта-Барбара закончилась? На Грега все наплевали?

GAMer ★★★★★
(21.05.24 07:56:00 MSK)

Ответ на: комментарий от GAMer 21.05.24 07:56:00 MSK

Кстати, чем та Санта-Барбара закончилась? На Грега все наплевали?

Ну, да? Как и на Лойнуса. Потому что а херли они сделают-то? В суд подадут? Хахахахахахахахахах!

hateyoufeel ★★★★★
(21.05.24 10:15:28 MSK) автор топика

Ссылка

Ответ на: комментарий от intelfx 20.05.24 22:37:52 MSK

в NTFS есть что-то вроде CoW, называется Shadow Copy

anonymous
(21.05.24 11:35:01 MSK)

Ответ на: комментарий от LINUX-ORG-RU 20.05.24 23:29:51 MSK

Прозрачное сжатие в «люниксе» прекрасно работает в btrfs, просто ТС - потужный клоун в амплуа «горлопанчик-обличитель», ему не проблему решить, а покрасоваться какой он молодец, облив говном тех, кто что-то делает, типичное поведение латентного педераста среднего возраста.

anonymous
(21.05.24 11:43:55 MSK)

Ссылка

Теоретически да. Нештатным патчем с шансами поработать бэта-тестером. На практике возьми лучше zfs или btrfs.

kirill_rrr ★★★★★
(21.05.24 16:00:57 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.05.24 20:09:01 MSK

Так CoW или дедупликация? Это разные вещи.

kirill_rrr ★★★★★
(21.05.24 16:02:54 MSK)

Ссылка

Ответ на: комментарий от rtxtxtrx 20.05.24 20:15:02 MSK

Вот кстати сложный вопрос. NTFS классическая, хорошо обкатана (причём и через ntfs-3g и по-другому) и под неёкуча софта восстановления данных.

kirill_rrr ★★★★★
(21.05.24 16:04:49 MSK)

Ссылка

Ответ на: комментарий от CrX 20.05.24 21:59:17 MSK

ext4 не поддерживает сжатие на уровне ФС. Как бы для того разные ФС и существуют, что у них набор фич разных. ... Если в ext4 добавить сжатие, она перестанет быть ext4

Ага, она станет ext5. Ext это внезапно он extended, т.е. расширяемая ФС. Сейчас в ней есть инструменты для ключения прозрачного шифрования, а алгоритм шифрования и алгоритм сжатия отличаются довольно мало.

kirill_rrr ★★★★★
(21.05.24 16:12:10 MSK)
Последнее исправление: kirill_rrr 21.05.24 16:12:20 MSK (всего исправлений: 1)

Ответ на: комментарий от kirill_rrr 21.05.24 16:12:10 MSK

Ага, она станет ext5. Ext это внезапно он extended, т.е. расширяемая ФС.

Да, возможно, но не ext4 ;)

алгоритм шифрования и алгоритм сжатия отличаются довольно мало

А вот тут не соглашусь. Алгоритмы как таковые, вне контекста ФС — да, имеют что-то общее. Но в контексте ФС, инод, экстентов, подсчёта занятого и свободного места, и всей вот этой фигни, разница огромная. Мало просто применить условный zstd к записываемым данным, это как раз легко (как и применить шифрование), важно здесь как раз запилить все окружающие это дело интерфейсы.

CrX ★★★★★
(21.05.24 16:15:25 MSK)

Ответ на: комментарий от intelfx 20.05.24 22:10:43 MSK

Потому что прозрачного сжатия без CoW/RoW (оно же «write anywhere») не бывает.

Легко, NTFS. Просто добавляешь флаг сжатия и если он есть прогоняешь данные через компрессор и забиваешь на то, что экономия будет только целыми блоками.

kirill_rrr ★★★★★
(21.05.24 16:15:26 MSK)

Ссылка

Ответ на: комментарий от CrX 21.05.24 16:15:25 MSK

Но в контексте ФС, инод, экстентов, подсчёта занятого и свободного места, и всей вот этой фигни, разница огромная.

Ладно, согласен, тут нужен не просто флаг, но ещё 1 дополнительное поле: размер файла реальный и сжатый. К сожалению с необходимостью провести декомпрессию при проверке ФС, но это того стоит.

kirill_rrr ★★★★★
(21.05.24 16:18:04 MSK)

Ссылка

Ответ на: комментарий от intelfx 20.05.24 22:14:50 MSK

Полноценного CoW не требуется. Атомарности можно достичь блокировкой ожидания доступа пока идёт запись нового блока/экстента и пометка старого как пустой. И можно сгладить всё это кешированием. Собственно как сейчас в ехт2-4 работает механизм изменения размера файла в середине без полной перезаписи?

kirill_rrr ★★★★★
(21.05.24 16:28:20 MSK)

Ответ на: комментарий от cumvillain 20.05.24 22:20:56 MSK

Сжатие предполагает изменение размера блока, а блочное шифрование специально гарантирует что шифрованный блок будет такой же длинны и его можно положить в тот же блок на диске. Причём это в первую очередь требование безопастности а не удобство для ФС.

kirill_rrr ★★★★★
(21.05.24 16:31:54 MSK)
Последнее исправление: kirill_rrr 21.05.24 16:32:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от intelfx 20.05.24 22:30:48 MSK

Если грамотно и вовремя писать метаданные, то всего лишь останешься с версией файла до перезаписи, а на ФС бразуются некорректно помеченные занятыми блоки, которые высвободятся в процессе проверки.

kirill_rrr ★★★★★
(21.05.24 16:36:43 MSK)

Ссылка

Ответ на: комментарий от intelfx 20.05.24 22:37:52 MSK

И тем не менее, это эффективно работает и многие хотели бы увидеть эту фишку в ext*. Хотя наверняка можно и лучше, но даже так хорошо.

kirill_rrr ★★★★★
(21.05.24 16:39:27 MSK)

Ссылка

Ответ на: комментарий от intelfx 20.05.24 22:41:01 MSK

но ещё и двойной оверхед на его журналирование

Да откуда ты вообще взял, что его нужно полностью журналировать?

kirill_rrr ★★★★★
(21.05.24 16:41:10 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 20.05.24 23:15:30 MSK

Ей богу, проще сервер передеплоить уже с ZFS. Займёт гораздо меньше времени.

Скорее всего именно так и стоит поступить. Это вроде даже очевидно, если бы вклчюаение сжатия было простым и доступным прямо на ехт4, то это было бы галочкой в инсталяторе каждого первого дистрибутива.

kirill_rrr ★★★★★
(21.05.24 16:50:36 MSK)
Последнее исправление: kirill_rrr 21.05.24 16:50:58 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от anonymous 21.05.24 11:35:01 MSK

это не в нтфс :)
Shadow Copy - сервис в операционке, надстройка «чуть повыше» файловой системы.
сама нтфс про CoW ничего не знает.

pfg ★★★★★
(21.05.24 17:06:07 MSK)
Последнее исправление: pfg 21.05.24 17:18:11 MSK (всего исправлений: 1)

Ссылка

тоноко намекаю: есть утилита прозрачной конвертации ext* в btrfs без перезаписи файлов на разделе.
при этом сколь помню ext* остается и можно както к чему даже вернутся.

pfg ★★★★★
(21.05.24 17:21:30 MSK)

Ссылка

Ответ на: комментарий от i-rinat 21.05.24 02:17:05 MSK

Если не соблюдать атомарность (без data=journal), то без сжатия ты получишь смесь старых и новых данных, а со сжатием — мусор.

kirill_rrr

Да откуда ты вообще взял, что его нужно полностью журналировать?

См. выше.

intelfx ★★★★★
(21.05.24 20:55:21 MSK)
Последнее исправление: intelfx 21.05.24 21:05:09 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 21.05.24 00:26:40 MSK

Ты тут ересь какую-то извергаешь

Да нет, ты. В предыдущем треде с «уязвимостью» run0 обосрался, теперь ещё и здесь пытаешься строить из себя умника 🙃

То есть, и правда не было, но непонятно как это к размеру кластера-то относится, потому что кластеры по 4к как раз были.

Я сделал предположение (одно из нескольких), что в NTFS это может работать за счёт атомарности записей по 4K. Предположение неверное, ошибся, бывает.

intelfx ★★★★★
(21.05.24 20:57:39 MSK)
Последнее исправление: intelfx 21.05.24 21:05:40 MSK (всего исправлений: 2)

Ответ на: комментарий от kirill_rrr 21.05.24 16:28:20 MSK

Полноценного CoW не требуется. Атомарности можно достичь блокировкой ожидания доступа пока идёт запись нового блока/экстента и пометка старого как пустой.

Ну то есть ты придумал CoW?

Собственно как сейчас в ехт2-4 работает механизм изменения размера файла в середине без полной перезаписи?

Это всё очень здорово, только extent splitting означает, что начало и конец старого экстента сами по себе остаются валидными экстентами. У FALLOC_FL_COLLAPSE_RANGE есть соответствующее ограничение на выравнивание границ операции. А если экстент сжат, то ты не можешь просто обрубить его в произвольном месте и сказать «теперь начало этого экстента здесь».

Для работы со сжатыми экстентами тебе нужна совсем другая структура данных, и ФС с этой структурой данных будет иметь совсем другие свойства. То есть это будет не ext4.

intelfx ★★★★★
(21.05.24 21:03:13 MSK)
Последнее исправление: intelfx 21.05.24 21:06:50 MSK (всего исправлений: 2)

Ответ на: комментарий от intelfx 21.05.24 21:03:13 MSK

Ну то есть ты придумал CoW?

Не, мы же не пишем все действия в виде лога с последующей сборкой мусора.

Это всё очень здорово, только extent splitting означает...

Или можно например отказаться от работы со сжатыми файлами с помощью экстентов и перейти на мелкоблочную разметку и прикрутить сверху ещё какую нибудь оптимизацию упаковки. Или не прикручивать и просто смириться что файлы меньше 1 блока сжиматься не будут. Блин, да даже этот примитивный метод ntfs доказал свою эффективность!

kirill_rrr ★★★★★
(21.05.24 21:40:15 MSK)

Ссылка

Ответ на: комментарий от intelfx 21.05.24 20:55:21 MSK

См. выше.

Я читал всё выше. Там «ну просто потому что», причём даже несмотря на «но вот смотри, ntfs». Достаточное подобие атомарности достигется и без CoW, и даже без журнала, и возможное изменение размера в середине файла это не непреодолимое препятствие. По кроайней мере не большая проблема, чем аналогичные операции над несжатыми классическими ФС со всей сопутствующей фрагментацией и перезаписью.

Если не соблюдать атомарность (без data=journal)

Запись данных в журнал точно так же не физически не атомарна. Будем журналировать журнал? Или всё таки ограничимся псевдоатомарностью через быстрые операции редактирования метаданных, никак не связанные с журналируемостью?

kirill_rrr ★★★★★
(21.05.24 21:47:05 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 21:47:05 MSK

ты точно понимаешь, что такое атомарность операций?

anonymous
(21.05.24 21:49:36 MSK)

Ответ на: комментарий от intelfx 21.05.24 20:55:21 MSK

Кстати, ехт* что так, что так просто выбрасывает огрызки файла, если сбой ФС произошёл прямо во время записи и метаданные оказались сильно повреждены. И эти огрызки совершенно точно не восстановятся в целый файл - где то там будут откушенные блоки. Сжатие не сильно усугубит ситуацию.

kirill_rrr ★★★★★
(21.05.24 21:53:07 MSK)

Ответ на: комментарий от intelfx 21.05.24 21:03:13 MSK

Млять, вместо того что бы выгуливать своё клоунское эго, лучше бы реально раскопал и притащил какую-нибудь ссылку на то, как NTFS пишет пожатые данные.

С твоим участием любая потенциально интересная дискуссия превращается в унылую клоунаду.

Послужи уже на благо экологии - забанься.

wandrien ★★
(21.05.24 21:54:18 MSK)

Ответ на: комментарий от anonymous 21.05.24 21:49:36 MSK

По определению - совершение всей операции либо целиком корректно, либо никак. Причём таким образом, что в логике системы это можно было считать мгновенным.

kirill_rrr ★★★★★
(21.05.24 21:55:15 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 21:55:15 MSK

По определению - совершение всей операции либо целиком корректно, либо никак

ну, и зачем тогда журналировать журнал?

anonymous
(21.05.24 22:02:11 MSK)

Ответ на: комментарий от wandrien 21.05.24 21:54:18 MSK

Из уже мелькавшей в треде ссылки https://www.ntfs.com/ntfs-compressed.htm только такое описание :

NTFS provides real-time access to a compressed file, decompressing the file when it is opened and compressing it when it is closed. When writing a compressed file, the system reserves disk space for the uncompressed size. The system gets back unused space as each individual compression buffer is compressed.

wandrien ★★
(21.05.24 22:02:35 MSK)

Ссылка

Ответ на: комментарий от kirill_rrr 21.05.24 21:47:05 MSK

Там «ну просто потому что», причём даже несмотря на «но вот смотри, ntfs»

Значит, у тебя проблемы с восприятием письменного текста.

Запись данных в журнал точно так же не физически не атомарна

А ты в курсе, что такое журнал?

intelfx ★★★★★
(21.05.24 22:35:22 MSK)

Ответ на: комментарий от wandrien 21.05.24 21:54:18 MSK

Ничё так тебя рвёт. Иди траву потрогай, что ли.

intelfx ★★★★★
(21.05.24 22:35:44 MSK)

Ссылка

Ответ на: комментарий от kirill_rrr 21.05.24 21:53:07 MSK

Кстати, ехт* что так, что так просто выбрасывает огрызки файла, если сбой ФС произошёл прямо во время записи и метаданные оказались сильно повреждены

А почему метаданные должны оказаться сильно повреждены?

Запись метаданных журналируется всегда.

если сбой ФС произошёл прямо во время записи

Я удивлён, что об этом нужно рассказывать человеку, который пытается участвовать в дискуссиях об ФС, но когда говорят об отказоустойчивости, имеют в виду не сбои самой ФС, а прерванные записи: сбой питания, сбой системы в целом. В этом случае без сжатия на диске окажется смесь старых и новых данных, а со сжатием (без CoW или журналирования данных) — мусор вместо перезаписываемого экстента/блока. Нужно объяснять, почему?

intelfx ★★★★★
(21.05.24 22:41:50 MSK)

Ответ на: комментарий от anonymous 21.05.24 22:02:11 MSK

А как вообще журнал связан с атомарностью?

kirill_rrr ★★★★★
(21.05.24 22:55:27 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 22:55:27 MSK

Журнал обеспечивает кажущуюся атомарность обновления метаданных.

wandrien ★★
(21.05.24 22:56:04 MSK)

Ответ на: комментарий от intelfx 21.05.24 22:35:22 MSK

А ты в курсе, что такое журнал?

Блоее менее да. Это (внезапно) журнал событий и операций, куда дублируются изменения метаданных. Очень помогает при восстановлении. Не уверен, но кажется сначала будущая операция записыватся в журнал и только потом производится, это помогает организации атомарности, но не является обязательным для неё.

Значит, у тебя проблемы с восприятием письменного текста.

А у тебя с аргументацией.

kirill_rrr ★★★★★
(21.05.24 23:00:26 MSK)

Ответ на: комментарий от wandrien 21.05.24 22:56:04 MSK

Так вроде и без него можно. ехт2 довольно близка к этому а жкрнал нужен чтобы ускорить восстановление сбоя.

kirill_rrr ★★★★★
(21.05.24 23:02:08 MSK)

Ссылка

Ответ на: комментарий от kirill_rrr 21.05.24 23:00:26 MSK

но не является обязательным для неё

да, вместо журнала можно использовать cow

anonymous
(21.05.24 23:13:40 MSK)

Ссылка

Ответ на: комментарий от kirill_rrr 21.05.24 23:00:26 MSK

Блоее менее да. Это (внезапно) журнал событий и операций

Это такая штука, запись в которую идёт строго подряд, и каждая операция сопровождается порядковым номером и чексуммой. Атомарность записи в журнал достигается тупо логически: если мы нашли там запись с подходящим номером и совпадающей чексуммой — значит, она целая. Если номер прыгнул назад или чексумма не совпала — значит, запись невалидна и чтение журнала прекращается.

intelfx ★★★★★
(21.05.24 23:17:35 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 23:00:26 MSK

А у тебя с аргументацией.

Да нет, с аргументацией всё норм: я привёл несколько способов реализовать прозрачное сжатие без CoW, и пояснил, почему каждый из них сосёт.

intelfx ★★★★★
(21.05.24 23:20:10 MSK)

Ответ на: комментарий от intelfx 21.05.24 22:41:50 MSK

А почему метаданные должны оказаться сильно повреждены?

Обрыв питания именно в момент их записи. Шансы 1 раз на 10 лет аптайма, но бывает же!

а со сжатием

...внезапно тоже смесь старых и новых данных, потому что даже если не атомизировать операцию через запись метаданных, никто со времён ФАТ (или даже раньше, потому что в ХР недозаписанные файлы часто выживали) не затирает данные прямо поверх старых блоков. А особенно это будет маразмом если блоки сжатые!

имеют в виду не сбои самой ФС

С питанием всё понятно, но что если крах в ядре, драйвере чего то, связанного с дисками, в оперативке или собственно в драйвере ФС - а я такое встречал на ntgs-3g, f2fs и btrfs.

Да и по отвалам дисков и сбоям питания - принципиальной разницы в атомарности и выживаемости файлов на ехт2 и ехт4 я не вижу, а ведь юсб2-сата хабы мегабренда dexp обеспечивают мне богатый опыт! ехт2 точно так же находит сбойный файл при прверке и утилизирует его. А ехт4 точно так же может потерять файл несмотря на журнал - просто проверится быстрее и легче вычистит мелкие огрехи.

kirill_rrr ★★★★★
(21.05.24 23:21:33 MSK)

Ответ на: комментарий от intelfx 21.05.24 23:20:10 MSK

Да нет, с аргументацией всё норм

Нет аргументации, нет проблем.

и пояснил, почему каждый из них сосёт.

Неа. И главное - ты не дал никаких аргументов против описанного мной очевидного способа, который не является CoW.

kirill_rrr ★★★★★
(21.05.24 23:23:51 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 23:21:33 MSK

Обрыв питания именно в момент их записи. Шансы 1 раз на 10 лет аптайма, но бывает же!

Естественно, в момент их записи. Любой другой обрыв питания рассматривать не имеет смысла.

В случае обрыва питания в момент записи метаданных они останутся в полном порядке, т. к. любое их изменение в ext3+ журналируется.

…внезапно тоже смесь старых и новых данных, потому что даже если не атомизировать операцию через запись метаданных, никто со времён ФАТ (или даже раньше, потому что в ХР недозаписанные файлы часто выживали) не затирает данные прямо поверх старых блоков. А особенно это будет маразмом если блоки сжатые!

А я тебе о чём говорю?

даже если не атомизировать операцию через запись метаданных

Что такое «атомизировать операцию через запись метаданных» (кроме того что это бессмысленный набор слов)?

intelfx ★★★★★
(21.05.24 23:23:58 MSK)

Ответ на: комментарий от kirill_rrr 21.05.24 23:23:51 MSK

Если ты не умеешь читать, проблем действительно нет.

против описанного мной очевидного способа, который не является CoW

Описанный тобой способ называется CoW (только ты ещё и предлагаешь выкинуть экстенты, что тоже сосёт по производительности).

intelfx ★★★★★
(21.05.24 23:25:48 MSK)
Последнее исправление: intelfx 21.05.24 23:27:00 MSK (всего исправлений: 1)

Ответ на: комментарий от intelfx 21.05.24 20:57:39 MSK

Я сделал предположение (одно из нескольких), что в NTFS это может работать за счёт атомарности записей по 4K. Предположение неверное, ошибся, бывает.

Процитирую тебя же:

обосрался, теперь ещё и здесь пытаешься строить из себя умника 🙃

hateyoufeel ★★★★★
(21.05.24 23:59:19 MSK) автор топика

Ссылка

От безысходности я начал пилить сжатие на базе ext2, правда с потерей совместимости…

timdorohin

greenman ★★★★★
(22.05.24 04:01:45 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 20.05.24 21:00:20 MSK

Лол у нас на бенчах тупо смена ext4 на zfs+lz4 увеличила производительность запросов почти в два раза. На одинаковом железе, одинаковой версии postgresql и так далее.

А базу бэкап-рестором переносили?

А уж из-за 300G городить всё это ещё более странно.
Схерали? Я за этот диск деньги плачу.

Вы на спичках тоже экономите?

anc ★★★★★
(22.05.24 04:39:50 MSK)

Ответ на: комментарий от rtxtxtrx 20.05.24 21:18:29 MSK

Ну в базе 95% операций - это чтение обычно.

1. «база» и «обычно» это крайне сферично.
2. Вы из какого гугла цифирку «95%» взяли?

anc ★★★★★
(22.05.24 04:49:09 MSK)

Ссылка

Для того чтобы оставить комментарий войдите или зарегистрируйтесь.

← 1 2 3 4 5 6 →

←	не все дисковое пространство использовано при установке ubuntu 22.04 server

Admin

Как правильно очистить каталог .cache

→

Похожие темы