Файловые системы со сжатием. Есть ли вообще выбор?

0

4

Есть задача - смигрировать зрелый корпоративный сервис с Windows на Linux. В самой процедуре миграции ничего сложного - там Java+Postgres и я уже тыщу раз так делал, но есть некоторые проблемы роста.

Понятно что логи сервера приложений, субд и пр. сервисов ротейтятся штатными средствами, сжимаются, удаляются и всё такое, но логи самого сервиса в силу его архитектуры должны быть доступны все и всегда. На Windows папка с логами сжималась средствами файловой системы и из 1.5TB получалось 500GB. Скорость работы, утилизация процессора - всех всё устраивало.

Сейчас в 2к25 на Linux я вижу простой способ - всё на EXT4, папка с логом на BTRFS со сжатием на отдельном диске/разделе.

Есть ли другие варианты? Решение нужно максимально простое, ванильное, без болтосвара и отхода от стандартного дебиана.

Отдельно повторю - logrotation не подходит - онлайн доступ к 1.5TB логов нужен сервису периодически.

Снапшоты, журналы, кеши… всё это не важно и не нужно. Просто поджать раза в три-пять холодно-тёплые текстовые данные.

←	spamassasin и задвоение писем

После апгрейда значительно выросло количество дропов на интерфейсах

→

Не указывать крайнюю точку удаления файлов в logrotate, тогда старые логи будут сжиматься, но не удаляться.
Смонтировать образ qcow2 и хранить в нём.
Хранить логи в systemd-journald, там уже всё есть.
Хранить логи в специально придуманных для этого БД, типа clickhouse.
…

Aceler ★★★★★
(02.04.25 14:00:25 MSK)

journald - https://habr.com/ru/articles/546368/

ALiEN175
(02.04.25 14:04:27 MSK)

сжатие есть и в zfs. по слухам, как бы более устойчивая фс чем бутер.

начни с одного, потом потестируешь альтернативы и настройки, допилишь на боевом.

pfg ★★★★★
(02.04.25 14:08:00 MSK)

fusecompress

anonymous
(02.04.25 14:15:04 MSK)

Что мешает всю систему на BTRFS держать?

anonymous
(02.04.25 14:22:05 MSK)

стандартного дебиана
btrfs

MoldAndLimeHoney ★
(02.04.25 15:13:26 MSK)

Исходя из того, что тебе logrotate якобы не подходит, у тебя отобрали zcat, zgrep и zless и забанили менеджер пакетов так что ты их установить не можешь? Ну тогда беда-горе-грусть

no-dashi-v2 ★★★
(02.04.25 17:17:43 MSK)

Ответ на: комментарий от MoldAndLimeHoney 02.04.25 15:13:26 MSK

Ну вот я лично предпочитаю использовать Btrfs с LTS-ядром, так что Debian подходит хорошо. Там была проблема с сопровождением btrfs-progs, но сейчас решена.

anonymous
(02.04.25 17:23:52 MSK)

А использовать агрегаторы логов типа loki с компрессией уже немондно?

bdrbt
(02.04.25 19:50:43 MSK)
Последнее исправление: bdrbt 02.04.25 19:51:06 MSK (всего исправлений: 1)

Можно Ext4 разместить в ZVOL на ZFS и для него включить сжатие :)

Да и xfs поддерживает сжатие.

vasya_pupkin ★★★★★
(02.04.25 22:07:27 MSK)
Последнее исправление: vasya_pupkin 02.04.25 22:13:19 MSK (всего исправлений: 2)

Есть ли другие варианты?

Накину ещё. bcachefs

NyXzOr ★★★★
(03.04.25 07:49:04 MSK)

Ответ на: комментарий от vasya_pupkin 02.04.25 22:07:27 MSK

Да и xfs поддерживает сжатие

Нет.

anonymous
(03.04.25 08:10:37 MSK)

Ответ на: комментарий от vasya_pupkin 02.04.25 22:07:27 MSK

Да и xfs поддерживает сжатие.

Ты из какого года пишешь?

greenman ★★★★★
(03.04.25 08:16:51 MSK)

Попробуй решения на базе FUSE, но нужно проверить производительность, еще есть fuse-archive от google.

https://packages.debian.org/bookworm/fuse-zip

MOPKOBKA ★★★★★
(03.04.25 08:35:42 MSK)
Последнее исправление: MOPKOBKA 03.04.25 08:36:40 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 03.04.25 08:10:37 MSK

пля, да, чутка попутал. В RHEL можно сделать через VDO, но тоже выходит что через анус.

https://www.redhat.com/en/blog/disk-compression-RHEL8

vasya_pupkin ★★★★★
(03.04.25 10:57:32 MSK)

Ответ на: комментарий от greenman 03.04.25 08:16:51 MSK

да чет тупанул, оно конечно делается, но через VDO.

vasya_pupkin ★★★★★
(03.04.25 11:02:30 MSK)

Сейчас в 2к25

‘К’ это тысяча, то есть 200025, а не 2025.

anonymous
(03.04.25 11:06:14 MSK)

Ответ на: комментарий от anonymous 03.04.25 11:06:14 MSK

+100500 этому комментатору

anonymous
(03.04.25 11:10:27 MSK)

папка с логом на BTRFS со сжатием

Я тут мимокрокодил... Недавно bcachefs в ядро добавили, в 6.7. Обещали плюшки btrfs+zfs в одном флаконе... Я пока не пользовался.

AS ★★★★★
(03.04.25 11:13:56 MSK)

Ответ на: комментарий от anonymous 03.04.25 11:06:14 MSK

2р25коп это 20025коп

ок

qulinxao3 ★☆
(03.04.25 11:23:45 MSK)

Ответ на: комментарий от qulinxao3 03.04.25 11:23:45 MSK

у него javascript, наверно

NyXzOr ★★★★
(03.04.25 11:57:34 MSK)

если всех все устраивает зачем тебе «другое решение»?

оно разумеется есть и не одно, но ты тут же скажешь «зачем все усложнять когда мой бтрфс всех устраивает»

antech ★
(03.04.25 12:33:19 MSK)

я бы запихал логи в БД там и сжатие можно устроить и копаться удобнее. но это уже другое решение.

antech ★
(03.04.25 12:34:56 MSK)

Ответ на: комментарий от AS 03.04.25 11:13:56 MSK

Пользоваться bcachefs пока явно рано, но выглядит скорее перспективно. Сможет ли она когда-нибудь вытеснить Btrfs — посмотрим, но здоровая конкуренция никому не повредит.

anonymous
(03.04.25 12:39:42 MSK)

Ответ на: комментарий от vasya_pupkin 03.04.25 10:57:32 MSK

VDO это страшное недоразумение, где на тебя ложится мониторинг использования места в томе. Собственно, на этом месте я прекратил читать документацию, потому что это тот же направленный в ногу пистолет, что и Stratis. Пользоваться таким могут разве что самые преданные фанаты RHEL, но и тут не уверен.

anonymous
(03.04.25 12:46:57 MSK)

Должно вполне себе взлететь.

Разумеется отдельный диск, лучше отдельный хост с десятком ядер.

Потести на разных алгоритмах на файлах до 500Мб, тк сжатие отложенное, результат будет через несколько минут.

Я вангую что победит zstd 7+.

!) Не вздумай включать одновременно с шифрованием, как обычные дурачки-неосиляторы.

hargard ★★★
(03.04.25 13:24:28 MSK)
Последнее исправление: hargard 03.04.25 13:26:44 MSK (всего исправлений: 1)

logrotate никак не мешает online доступу.

anonymous
(03.04.25 13:53:57 MSK)

Ответ на: комментарий от anonymous 03.04.25 12:46:57 MSK

VDO это страшное недоразумение, где на тебя ложится мониторинг использования места в томе.

Wtf?

vasya_pupkin ★★★★★
(03.04.25 15:10:20 MSK)

На уровне ФС две опции - BTRFS и ZFS. Из них BTRFS более изкоробочное решение, хотя если дебиан поменять на убунту, ZFS тоже нормальный вариант.

Также есть возможность использовать сжатие на уровне ниже ФС - LVM VDO. С этой опцией можно использовать Ext4.

В общем и целом плюсую предыдущих комментаторов, такие задачи эффективнрей решать на уровне выше ФС, хотя бы банальным сжатием отдельных файлов. Понятно, что для этого надо переписывать весь софт и админу это делать не дадут, но вопрос такой поставить стоит.

vbr ★★★★★
(03.04.25 15:12:43 MSK)
Последнее исправление: vbr 03.04.25 15:16:28 MSK (всего исправлений: 3)

Ответ на: комментарий от vasya_pupkin 03.04.25 15:10:20 MSK

Почитай, как оно работает. Если я правильно понял документацию, излишне оптимистичный выбор provisioned size может привести к ситуации, когда запись на ФС будет невозможна, потому что размер сжатых данных превышает размер LV. И это не ENOSPC, а EIO, потому что ошибку возвращает балочное устройство. Суть та же, что с Thin Pool, но там ты можешь просто не наглеть, и всё будет хорошо, а тут уже не прокатит.

anonymous
(03.04.25 15:24:35 MSK)

А зачеи сжимать? Диск маловат или тут забабахать тему?

anonymous
(03.04.25 16:20:42 MSK)

Ответ на: комментарий от anonymous 03.04.25 16:20:42 MSK

А зачеи сжимать?

Чтобы вывеска «плохая архитектура приложения» весила 500 Гб, а не 1.5 Тб. Меньше настроение портит.

anonymous
(03.04.25 17:21:16 MSK)

папка с логом на BTRFS со сжатием на отдельном диске/разделе

Выглядит как приемлемый вариант. Только бэкапами озаботься (в прочем ими в любом случае надо озаботиться). Ну а вообще Aceler правильно сказал, переписывать надо на какую-то специализированную СУБД

MrClon ★★★★★
(04.04.25 22:42:50 MSK)

В Линуксе до сих пор нет поддержки сжатия NTFS?

Tigger ★★★★★
(04.04.25 23:01:16 MSK)

Итого:

logrotate мне правда не подходит. То что я назвал логами сервиса и что ими в общем является - это файловая база данных в самом плохом смысле этого слова. Взять и переписать? Спасибо за предложение.

Один большой системный интегратор уже переписывал то ПО что мы используем для одного крупного заказчика - получили терабайт в постгре…. в итоге, через пару лет я откатывал там всё на ванильное решение.

Я не программист, и в общем даже не сильный админ - устанавливаю сервис по мануалу, эксплуатирую десятилетиями. Да, кое что кое где устарело архитектурно, да есть проблемы роста определённые, красиво их решить - очень комплексно. БТРФС со сжатием вроде выглядит довольно просто.

Операторам гипервизора в общем пофиг, они не против такой активности на сторадже.

Будем пробовать бтрфс с определёнными ограничениями в выборе ОС.

IdeaFix
(06.04.25 13:20:12 MSK) автор топика

Ответ на: комментарий от IdeaFix 06.04.25 13:20:12 MSK

Один большой системный интегратор уже переписывал то ПО что мы используем для одного крупного заказчика - получили терабайт в постгре…. в итоге, через пару лет я откатывал там всё на ванильное решение.

Я не программист, и в общем даже не сильный админ

ничего не трогайте, наймите специалиста

gagarin0
(06.04.25 13:21:59 MSK)

Ответ на: комментарий от IdeaFix 06.04.25 13:20:12 MSK

То что я назвал логами сервиса и что ими в общем является - это файловая база данных в самом плохом смысле этого слова

Будем пробовать бтрфс

Тогда стоит потестировать на разных алгоритмах сжатия сначала, начать с lzo и стандартного уровня zstd .

anonymous
(06.04.25 13:47:17 MSK)

Ответ на: комментарий от anonymous 06.04.25 13:47:17 MSK

Пока пробую как раз lzo vs zstd (без параметров уровня сжатия) и не вижу разницы. На стенде две одинаковые VM показывают очень близкие результаты. Просто думал мало ли… вдруг есть какие-то «хорошие практики» для «плохих программ».

Процессора в общем не жалко, его в избытке, а вот с памятью могут быть проблемы. Там ява - она любит всю память. Но пока, запуская боевые задачи на боевом объёме «логов» я вижу какую-то совсем уж идеальную картину.

IdeaFix
(06.04.25 16:52:20 MSK) автор топика

Ответ на: комментарий от IdeaFix 06.04.25 16:52:20 MSK

Остановился на zstd (уровень 3). Логи, характер которых довольно постоянен, жмутся аккурат в 10 раз. И при чтении и при записи один тред загружен на 100% и есть небольшая нагрузка на остальные треды, памяти система ест при этом не больше, чем с EXT4. Всё в общем работает как ожидается.

Нагрузку дал, всякие нештатности воспроизвёл - вроде бы всё хорошо. Совсем развалить ФС не удалось так, чтоб её прям чекать и восстанавливать пришлось (ДДшить рандом в производьные адреса - не спортивно).

Собственно, остался вопрос, можно ли заставить zstd сжатие использовать 2 треда и более, и… что бы еще проверить.

IdeaFix
(08.04.25 11:34:33 MSK) автор топика

Ответ на: комментарий от IdeaFix 08.04.25 11:34:33 MSK

можно ли заставить zstd сжатие использовать 2 треда и более

Параметр thread_pool при монтировании. Хотя он по дефолту должен быть больше единицы.

vbr ★★★★★
(08.04.25 11:43:38 MSK)
Последнее исправление: vbr 08.04.25 11:44:13 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 08.04.25 11:43:38 MSK

Может быть на тестовой зоне просто было мало тредов. Попробую.

IdeaFix
(08.04.25 12:34:58 MSK) автор топика

Ответ на: комментарий от IdeaFix 08.04.25 12:34:58 MSK

После некоторого времени эксплуатации в общем известного и хорошо изученного мной как админом сервиса в новой среде сформировались определённые выводы:

Переиначть софт может даже админ без разработчиков. Разработчикам никто пистолет к башке не приставлял и они сильно не разбирались с log4j, а админу пришлось. В итоге размер лога удалось сократить в два раза. И нет, дело не в изменении INFO на WARN.
От некоторых логов удалось отказаться настроив ротацию средствами log4j, т.к. оказалось что они хранят что-то странное, о нужности чего даже разработчик в течении недели не нашелся с внятным ответом. Жаль, что это было несколько процентов от объёма.
Примерно 50% логов изначальных никуда не деть. BTRFS с штатным zstd:3 жмёт это всё в 10 раз и это просто работает. Как-то так звезды встали что проца и памяти в достатке, а места нет. Вернее, базовые сервисники совершенно адекватно говорят, ну дадим мы тебе 4TB, а у тебя 500GB годовой прирост. Придумай что-нибудь.
Параллельно оказалось что SOLR, которого в зрелом корпоративном решении в избытке, оптимизирует свои индексы типа… копированием что ли. Это уже не логи. Т.е. было у него 100GB индексов, процедура оптимизации постепенно догоняет объём до 200GB а потом роняет до 95GB. Разработчик говорит «вы всё равно не поймёте», а индексы SOLR на чуть более соевом сжатии чем из коробки вообще не демонстрируют никакого падения производительности и позволяют сгладить изначальные скачки потребления места х2 во время процедур, которые не рекомендовались как регулярные, но теперь вполне могут исполняться регулярно.

Плохая архитектура приложения - это да. Ничего не надо говорить, тут и так всё ясно. Но пока BTRFS выглядит нормальным решением для минимизации определённых проблем во время использования «зрелых корпоративных программных решений». А то как это всё работает в ситуации когда нужно только сжатие - вообще приятно меня удивило. Пока оно просто работает и не требует отдельного хоста с кучей ядер и большой кучей памяти.

IdeaFix
(18.04.25 23:55:27 MSK) автор топика

←	spamassasin и задвоение писем

Admin

После апгрейда значительно выросло количество дропов на интерфейсах

→

Похожие темы