zfs тормоза при копировании в виртуалках

Поставил оффтопики

Контроллер диска virtio -> драйвера virtio

~~King_Carlo~~ ★★★★★
(01.03.16 21:00:35 MSK)

рамы то на борту скока

vxzvxz ★★★
(01.03.16 21:04:47 MSK)

Ссылка

Ответ на: комментарий от King_Carlo 01.03.16 21:00:35 MSK

Да, все так и есть везде virtio драйвера стоят

Рамы 64 гб, под arc 8 гб выделил, свопа нет

Ien_Shepard ★★★
(01.03.16 21:23:02 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 01.03.16 21:23:02 MSK

Попробуй локализовать проблему: попробуй копировать не внутри виртуалки, а просто на zfs, внутри ОС с proxmox.

DALDON ★★★★★
(01.03.16 21:45:29 MSK)

Ссылка

Выравнивание разделов по границе блоков есть?

iZEN ★★★★★
(01.03.16 22:19:48 MSK)

Ответ на: комментарий от King_Carlo 01.03.16 21:00:35 MSK

а можно как то убрать thin provision, что бы уже существующий диск занял должный размер?

Ien_Shepard ★★★
(01.03.16 22:22:24 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 01.03.16 22:22:24 MSK

preallocation даже на hdd почти ничего не даёт, а на ssd ничего не даст точно.

~~King_Carlo~~ ★★★★★
(01.03.16 22:34:55 MSK)

Ответ на: комментарий от iZEN 01.03.16 22:19:48 MSK

это как ? Я просто создал zfs pool

Ien_Shepard ★★★
(01.03.16 22:35:37 MSK) автор топика

Ответ на: комментарий от King_Carlo 01.03.16 22:34:55 MSK

ну вот решил скопировать файл внутри виртуалки 20 гиговый, и все сразу зависло, что же за беда (

Ien_Shepard ★★★
(01.03.16 22:48:50 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 01.03.16 22:35:37 MSK

Команду создания в студию. Делал: ashift=12, при создании? Создавал по wiki proxmox?

DALDON ★★★★★
(01.03.16 22:57:41 MSK)

Ответ на: комментарий от Ien_Shepard 01.03.16 22:48:50 MSK

Как хранятся виртуалки на zfs, в файлах или на zvol? Если на zvol, то нужно размер volblocksize делать больше значений по-умолчанию.
И, как выше уже сказали, надо понять какой ashift пригоден для твоих ssd, по-умолчанию ashift=9.

~~King_Carlo~~ ★★★★★
(01.03.16 23:06:10 MSK)

Ответ на: комментарий от King_Carlo 01.03.16 23:06:10 MSK

На форуме proxmox - я спрашивал. Собственно с каким размером создаётся zvol. Ответа не получил. Надо поглядеть это в свойствах zvol.

DALDON ★★★★★
(01.03.16 23:22:00 MSK)

Ссылка

Ответ на: комментарий от King_Carlo 01.03.16 23:06:10 MSK

Посмотрел. Вот так эти засранцы создают zvol:

volblocksize 8K

Надо 128K?

DALDON ★★★★★
(01.03.16 23:27:15 MSK)

Ответ на: комментарий от Ien_Shepard 01.03.16 22:48:50 MSK

На, погляди: https://github.com/zfsonlinux/zfs/issues/824

Говорят пофиксили одно, но есть другая проблема:

ARC space utilisation is still a problem with 8k zvols, but that is a separate matter.
«Thank you» to everyone who has contributed in the meantime for fixing this issue :)

DALDON ★★★★★
(01.03.16 23:28:04 MSK)
Последнее исправление: DALDON 01.03.16 23:32:14 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от DALDON 01.03.16 22:57:41 MSK

да, по wiki proxmox, ashift 12

Ien_Shepard ★★★
(01.03.16 23:30:41 MSK) автор топика

Ссылка

Ответ на: комментарий от DALDON 01.03.16 23:27:15 MSK

Надо 128K?

Я 128К делаю, при таком значении, по моим наблюдениям, iowait минимальный. Но от 32К уже нормально.

~~King_Carlo~~ ★★★★★
(01.03.16 23:31:52 MSK)

Ответ на: комментарий от King_Carlo 01.03.16 23:31:52 MSK

Ссучий proxmox, делает 8к. Блин, без пересоздания zvol это не фиксится же?

DALDON ★★★★★
(01.03.16 23:32:57 MSK)

А какая ОС? Solaris / Linux / FreeBSD ?

Если соляра, то у нее нет поддержки virtio

~~int13h~~ ★★★★★
(01.03.16 23:33:52 MSK)

Ответ на: комментарий от int13h 01.03.16 23:33:52 MSK

linux debian 8

Ien_Shepard ★★★
(01.03.16 23:34:26 MSK) автор топика

Ответ на: комментарий от King_Carlo 01.03.16 23:31:52 MSK

так что, пересоздавать ?

Ien_Shepard ★★★
(01.03.16 23:38:29 MSK) автор топика

Ссылка

Ответ на: комментарий от DALDON 01.03.16 23:32:57 MSK

Цитата из доков:


VOLBLOCKSIZE указывает размер блока для томов. После записи
тома изменить размер блока невозможно, поэтому
его необходимо устанавливать при создании тома.
Стандартный размер блока для томов составляет 8
КБ. Допустимым является любой размер от 512 байт
до 128 КБ, соответствующий степени двойки.

~~King_Carlo~~ ★★★★★
(01.03.16 23:39:09 MSK)
Последнее исправление: King_Carlo 01.03.16 23:39:52 MSK (всего исправлений: 1)

Ответ на: комментарий от Ien_Shepard 01.03.16 23:34:26 MSK

ядро там какой версии?

smilessss ★★★★★
(01.03.16 23:39:54 MSK)

Ответ на: комментарий от smilessss 01.03.16 23:39:54 MSK

4.2.8

Ien_Shepard ★★★
(01.03.16 23:42:42 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 01.03.16 23:42:42 MSK

zfs там модулем ядра?

smilessss ★★★★★
(01.03.16 23:44:56 MSK)

Ответ на: комментарий от int13h 01.03.16 23:33:52 MSK

proxmox же, это linux + zfsonlinux

~~King_Carlo~~ ★★★★★
(01.03.16 23:45:45 MSK)

Ответ на: комментарий от smilessss 01.03.16 23:44:56 MSK

да, модулем

Ien_Shepard ★★★
(01.03.16 23:59:45 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 01.03.16 23:59:45 MSK

рейд софтовый?

виртуалки в файлах/разделах/?

smilessss ★★★★★
(02.03.16 00:04:57 MSK)

Ответ на: комментарий от King_Carlo 01.03.16 23:39:09 MSK

Да вот я понимаю это... Нужно править исходники proxmox. Или надеяться найти команды создания zfs в php скриптах.

DALDON ★★★★★
(02.03.16 00:09:31 MSK)

Ссылка

Ответ на: комментарий от smilessss 02.03.16 00:04:57 MSK

да, рейд средствами zfs зеркальный, виртуалки на zvolume

Ien_Shepard ★★★
(02.03.16 00:33:31 MSK) автор топика

Ответ на: комментарий от King_Carlo 01.03.16 23:45:45 MSK

так получается, делать бекап и переразбивать диски ?

P.S: компрессию есть смысл включать ?

Ien_Shepard ★★★
(02.03.16 00:57:13 MSK) автор топика

Ответ на: комментарий от Ien_Shepard 02.03.16 00:57:13 MSK

На оба вопроса: да. :)

DALDON ★★★★★
(02.03.16 07:57:12 MSK)

Ответ на: комментарий от DALDON 02.03.16 07:57:12 MSK

ой спасибо за помощь большое, в воскресенье забекаплюсь и сделаю, отпишу по результату.

А какой метод сжатия лучше будет для виртуалок ? Вот например нагугли л lzjb только статья старовата будет

Ien_Shepard ★★★
(02.03.16 08:15:34 MSK) автор топика

Ответ на: комментарий от DALDON 01.03.16 23:27:15 MSK

нет, все зависит от того как организовано зеркало, для единичного диска или реда1 из двух дисков да блоксайз должен быть 128k

vxzvxz ★★★
(02.03.16 09:07:32 MSK)

Ответ на: комментарий от Ien_Shepard 02.03.16 08:15:34 MSK

lz4

vxzvxz ★★★
(02.03.16 09:09:10 MSK)

Ссылка

Ответ на: комментарий от King_Carlo 01.03.16 23:39:09 MSK

Допустимым является любой размер от 512 байт до 128 КБ

Вроде ж проскакивали откровения какого-то хостера видео, что у них 1Мб блоки работают.

GAMer ★★★★★
(02.03.16 09:33:36 MSK)

Ответ на: комментарий от GAMer 02.03.16 09:33:36 MSK

для zvol ограничение в 128к

anonymous
(02.03.16 09:37:34 MSK)

Ссылка

Кто объяснит?

Virtual machine images on ZFS should be stored using either zvols or raw files to avoid unnecessary overhead. The recordsize/volblocksize and guest filesystem should be configured to match to avoid overhead from partial record modification. This would typically be 4K. If raw files are used, a separate dataset should be used to make it easy to configure recordsize independently of other things stored on ZFS.

http://open-zfs.org/wiki/Performance_tuning

anonymous
(02.03.16 09:47:38 MSK)

Ответ на: комментарий от vxzvxz 02.03.16 09:07:32 MSK

зависит от размера в/в от ОС, в случае экспорта zvol под вирт. диски оптимальным является 64к

anonymous
(02.03.16 09:48:21 MSK)

Ответ на: комментарий от anonymous 02.03.16 09:47:38 MSK

в теории: если ты хочешь поиметь максимальный iops, то recordsize=FSClusterSize который обычно 4к,

в реале: т.к. драйвера ОС могут (и делают) группировать запросы в/в в большие блоки (винда например 64к-1м, фря 64к, линукс хз) то имеем компромисс в 64к.

вот для БД как правило теория совпадает с практикой

еще нюанс для zfs - чем меньше размер recordsize тем больше оверхед по метаданным (их изменять надо синхронно, места больше занимают в том же ARC)

anonymous
(02.03.16 10:31:56 MSK)

Ответ на: комментарий от anonymous 02.03.16 10:31:56 MSK

Группировать-то могут, но если запрошенная группа 4к блоков принадлежит разным файлам в разных местах диска, то как 64к volblocksize поможет, только хуже будет.

anonymous
(02.03.16 10:50:17 MSK)

Ответ на: комментарий от GAMer 02.03.16 09:33:36 MSK

Да точно, я старую солярисную доку процитировал. В ZoL с версии 0.6.5 запилили large_blocks up to 16Mb.

~~King_Carlo~~ ★★★★★
(02.03.16 11:24:02 MSK)

Ответ на: комментарий от anonymous 02.03.16 10:50:17 MSK

я про другую группировку

например, фс надо считать 16х4к блоков подряд, в контроллер идет запрос на чтение 1х64к блока. файлы обычно читаются последовательно.

anonymous
(02.03.16 12:22:37 MSK)

Ответ на: комментарий от Ien_Shepard 02.03.16 00:33:31 MSK

про volblocksize здесь сказано

http://forum.ixbt.com/print/0011/045837.html

http://forum.ixbt.com/topic.cgi?id=11:45837:2409#2409

а сколько лучше делать для NTFS ? по размеру кластера - 4к или лучше размер кластера подогнать под размер volblocksize ? На самом деле это очень хороший вопрос И ответ на него будет зависеть от конфигурации vdev входящих в пул.

В качестве примера возьмём весьма распространённый vdev - raidz2 4+2. Механизм распределения Full Stripe (терминология традиционных RAID-систем) по дискам vdev всех типов raidz описан в заметке (http://uadmin.blogspot.ru/2006/07/raid-and-raidz-details.html) создателя zfs Джефа Бонвика. В ней же, попутно, раскрыт смысл термина динамический размер сегмента (https://blogs.oracle.com/bonwick/entry/raid_z_russian) zfs. В нашем примере запрос к vdev на запись 128КБ-го блока zfs вызовет запись 32КБ на 4 (четыре) data-диска + запись двух parity. Кстати, ИМХО во многом именно этим вызвана рекомендация о кратности степени 2 для data-дисков, преформат каждого диска vdev на блоки размером [128/кол-во data-дисков] КБ происходит при создании vdev. А вся «динамичность» размера сегмента (т.е. Full Stripe) в нашем случае будет заключаться в том, что без потери скорости и объёма на vdev будут записаны блоки объёмом 32, 64, 96 и 128КБ - и то хлеб в сравнении с записью только Full Stripe в традиционных RAID. Поэтому, очевидно, что наиболее релевантными размерами volblocksize для zvol и кластера NTFS в нашем случае будут 32 и 64КБ.

axelroot ★
(02.03.16 15:14:54 MSK)
Последнее исправление: axelroot 02.03.16 15:16:36 MSK (всего исправлений: 1)

Ответ на: комментарий от axelroot 02.03.16 15:14:54 MSK

А для «raid10», в терминологии zfs? Какой размер кластера NTFS? 64/64?

DALDON ★★★★★
(02.03.16 15:21:37 MSK)

Ответ на: комментарий от anonymous 02.03.16 12:22:37 MSK

Да понятно, не дурнее других. Но для мелкого рандома будет оверхед

anonymous
(02.03.16 15:27:31 MSK)

Ответ на: комментарий от anonymous 02.03.16 15:27:31 MSK

мелкий рандом производят СУБД, а для них правило recordsize=pagesizeDB подходит хорошо, я же упоминал об этом

anonymous
(02.03.16 15:44:59 MSK)

Ссылка

Ответ на: комментарий от DALDON 02.03.16 15:21:37 MSK

смотря какой юзкейс

если системный диск - 64к/4к

если БД - общее правило: volblocksize<=clustersize<=pagesizeDB

anonymous
(02.03.16 15:58:43 MSK)

Ссылка

Ответ на: комментарий от axelroot 02.03.16 15:14:54 MSK

преформат каждого диска vdev на блоки размером [128/кол-во data-дисков] КБ происходит при создании vdev.

И где-же это ты такую ерунду вычитал?

А вся «динамичность» размера сегмента (т.е. Full Stripe) в нашем случае будет заключаться в том, что без потери скорости и объёма на vdev будут записаны блоки объёмом 32, 64, 96 и 128КБ - и то хлеб в сравнении с записью только Full Stripe в традиционных RAID

И ведь кто-то этот бред прочитает и примет за чистую монету.

anonymous
(02.03.16 18:55:10 MSK)

Ответ на: комментарий от anonymous 02.03.16 09:48:21 MSK

отдохни мальчик, при выборе блоксайза нужно исходить из структуры массива, если это рейд10 на 4-х дисках то 64k, если на 8-и дисках (4-х зеркалах) то 32k

vxzvxz ★★★
(02.03.16 19:54:40 MSK)

Ответ на: комментарий от DALDON 02.03.16 15:21:37 MSK

для 10-ки на 4-х дисках 64k

vxzvxz ★★★
(02.03.16 19:55:53 MSK)

Ссылка

Похожие темы