дисковый асинхронный ввод-вывод

1

5

здравствуйте, обдумываю сейчас реализацию eventloop-а и для сетевых сокетов и для дискового I/O... я так понял, что epoll для, например, текстовых файлов не предназначен совсем. можно использовать либо posix aio либо aio уровня ядра...

1) posix aio реально используется в 2017 году? я думал что создавать каждый раз поток для каждого файла чисто для I/O это слишком накладно

2) aio уровня ядра, все ли нормально с ним в linux? толком так и не понял: то ли не доделали его, то ли косячный какой-то он

Ссылка

←	Инициализация отричательным числом

Выделить строку в QTableView по значению поля в модели (id)

→

posix aio реально используется в 2017 году?

А какие существуют кроссплатформенные альтернативы? Пазикс наше всё.

anonymous
(24.10.17 22:27:35 MSK)

Ответ на: комментарий от anonymous 24.10.17 22:27:35 MSK

я просто думал что поток на соединение это такое костыльное решение... типа на коленке набросанное

xperious ★★
(24.10.17 23:01:48 MSK) автор топика

Глянь реализацию sendfile в FreeBSD. Там как раз асинхронный вывод из файла в сокет, может чего полезного накопаешь.

~~Minona~~ ★★☆
(24.10.17 23:53:47 MSK)

libuv на Linux для дискового IO использует thread-pool. Сетевые сокеты мониторятся epoll. В нем же мониторятся и сигналы от пула тредов (которые отправляются когда операция завершается)

dvetutnev ★
(25.10.17 01:34:45 MSK)

обдумываю сейчас реализацию eventloop-а и для сетевых сокетов и для дискового I/O...

А что мешает заюзать готовые реализации?

Deleted
(25.10.17 04:52:06 MSK)

Ссылка

Ответ на: комментарий от xperious 24.10.17 23:01:48 MSK

Да, есть реализация AIO на уровне ядра Linux, в которой не требуется треды создавать, но оно не портабельно

см. https://cebka.blogspot.com/2012/05/aio-linux.html

SZT ★★★★★
(25.10.17 06:54:57 MSK)

тебе нужно не на каждый файл, а создавать примерно в районе 20-80 потоков на каждое устройство и пропускать запросы через них.

Никакого асинхронного дискового IO не существует нигде. Есть какие-то попытки сделать асинхронное чтение/запись, но это лишь часть большой задачи, потому что есть ещё open, stat, а по моему опыту забитый шпиндель может отдать ответ на stat где-нибудь через 30-40 секунд. Весь твой event loop летит к черту.

Короче, thread pool, потом потыкайся в libuv когда наиграешься, а затем бери эрланг и расслабься. Там всё есть и сделано гораздо лучше.

max_lapshin ★★★★★
(25.10.17 08:23:36 MSK)

Ответ на: комментарий от max_lapshin 25.10.17 08:23:36 MSK

Весь твой event loop летит к черту.

потом потыкайся в libuv когда наиграешься

вот libuv и вдохновил свой цикл сделать чтоб разобраться с нуля... в libuv для сетевого ввода/вывода используется epoll, а для дискового posix aio + thread pool? если так, то почему все говорят что node.js все делает в один поток?

xperious ★★
(25.10.17 13:24:58 MSK) автор топика

Ответ на: комментарий от SZT 25.10.17 06:54:57 MSK

эту ссылку видел... т.е. нужно самому обертки писать до сих пор? просто думал может уже реализовали все и устаканили

xperious ★★
(25.10.17 13:26:18 MSK) автор топика

Ссылка

Ответ на: комментарий от xperious 25.10.17 13:24:58 MSK

потому что тредпул только для дисков. Всё остальное нода обречена делать в один поток

max_lapshin ★★★★★
(25.10.17 14:29:51 MSK)

Ответ на: комментарий от max_lapshin 25.10.17 14:29:51 MSK

а сколько потоков в тредпуле там?

xperious ★★
(25.10.17 14:56:59 MSK) автор топика

Ответ на: комментарий от xperious 25.10.17 14:56:59 MSK

это очень сложный вопрос, потому что по идее надо иметь порядка 20-80 (it depends) на один девайс. Но рейд всё поменяет

max_lapshin ★★★★★
(25.10.17 15:54:04 MSK)

Ответ на: комментарий от dvetutnev 25.10.17 01:34:45 MSK

libuv на Linux для дискового IO использует thread-pool. Сетевые сокеты мониторятся epoll. В нем же мониторятся и сигналы от пула тредов

нет сейчас возможности смотреть код libuv... я так понимаю пул тредов «пишет» в какой-то unix-сокет который тоже опрашивается в epoll? или как тогда

xperious ★★
(25.10.17 16:14:53 MSK) автор топика

Ссылка

Нафиг тебе epoll? Чем обычный select не устраивает?

anonymous
(25.10.17 16:28:06 MSK)

Ответ на: комментарий от anonymous 25.10.17 16:28:06 MSK

эффективней же

xperious ★★
(25.10.17 16:35:50 MSK) автор топика

Ответ на: комментарий от max_lapshin 25.10.17 15:54:04 MSK

по идее надо иметь порядка 20-80 (it depends) на один девайс

пытаюсь понять: а зачем так много? вот вызвали read - один поток для этого read... вызвали write - 1 поток для write и т.д.

xperious ★★
(25.10.17 17:51:55 MSK) автор топика

Ответ на: комментарий от xperious 25.10.17 16:35:50 MSK

С какого перепугу? select — простая штука, а с epoll ты будешь вынужден сношаться...

anonymous
(25.10.17 17:57:13 MSK)

Ссылка

Ответ на: комментарий от xperious 25.10.17 17:51:55 MSK

в зависимости от конкретной модели диска до N одновременных запросов проходят за одинаковое время, т.е. диск выходит на свою максимальную скорость при наличии забитой очереди задач на чтение

max_lapshin ★★★★★
(25.10.17 20:23:35 MSK)

Ответ на: комментарий от max_lapshin 25.10.17 20:23:35 MSK

спасибо, надо будет просветиться

xperious ★★
(25.10.17 21:31:46 MSK) автор топика

Ссылка

Ответ на: комментарий от max_lapshin 25.10.17 08:23:36 MSK

тебе нужно не на каждый файл, а создавать примерно в районе 20-80 потоков на каждое устройство и пропускать запросы через них.

Я знаю пример с прошлой работы, когда эта замечательная идея выродилась в 18 тысяч тредов в одном-единственном процессе.

mv ★★★★★
(26.10.17 03:56:47 MSK)

Ответ на: комментарий от mv 26.10.17 03:56:47 MSK

зачем так много?

max_lapshin ★★★★★
(26.10.17 16:13:14 MSK)

В Linux нет асинхронного ввода/вывода для дисковой подсистемы, только для прямого (некешируемого) ввода/вывода (DIRECT IO). posix эмулирует его с помощью потоков. Если такая задача возникнет, то лучше всего это реализовать самому на пуле потоков (как это сделали nginx).

anonymous
(26.10.17 16:24:54 MSK)

Ответ на: комментарий от Minona 24.10.17 23:53:47 MSK

Глянь реализацию sendfile в FreeBSD.

Во FreeBSD асинхронные дисковые операции реализовали Netflix специально для себя (очень недавно). В Linux такого нет.

anonymous
(26.10.17 16:26:24 MSK)

Ответ на: комментарий от anonymous 26.10.17 16:26:24 MSK

Ну я и написал же — посмотри как реализовано, может что-то полезное увидишь. Можно ещё в стрекозе покопаться на предмет идей полезных :)

~~Minona~~ ★★☆
(26.10.17 17:34:08 MSK)

Ссылка

Ответ на: комментарий от anonymous 26.10.17 16:24:54 MSK

Если такая задача возникнет, то лучше всего это реализовать самому на пуле потоков

в смысле реализовать на posix aio + пул потоков?

xperious ★★
(26.10.17 18:47:33 MSK) автор топика

Ответ на: комментарий от xperious 26.10.17 18:47:33 MSK

в смысле реализовать на posix aio + пул потоков?

Вообще без posix AIO. Очередь, в которую ставятся заявки на чтение/запись + пул потоков, который исполняет запросы и уведомляет заказчика. Более того, если это не библиотека для неопределенного круга пользователей, а решение для конкретной задачи, то с учетом того, что запись всегда делается в кеш ОС, ее имеет смысл делать асинхронной только для случая, когда есть шанс, что оперативки будет не хватать для кеширования. Однако, в этом случае все приложение целиком начнет тормозить, вместе с операционкой из-за нехватки памяти и забитого на 100% ввода/вывода (у компа есть три основных ресурса - CPU, размер RAM и производительность IO из них 2 будут забиты на 100%).

anonymous
(27.10.17 14:39:57 MSK)

Ответ на: комментарий от anonymous 27.10.17 14:39:57 MSK

Вообще без posix AIO

а чем это лучше чем posix AIO? тоже самое ж имхо

xperious ★★
(27.10.17 17:12:06 MSK) автор топика

Ссылка

Ответ на: комментарий от max_lapshin 26.10.17 16:13:14 MSK

зачем так много?

Начали 25 лет назад, когда нагрузка сильно меньше была и треды дешевле, а сейчас, без изменения архитектуры, бегемот вырос.

mv ★★★★★
(28.10.17 06:25:37 MSK)

Ответ на: комментарий от anonymous 26.10.17 16:24:54 MSK

В Linux нет асинхронного ввода/вывода для дисковой подсистемы, только для прямого (некешируемого) ввода/вывода (DIRECT IO).

Подсистема, которая в каталоге block в исходниках ядра, та вся асинхронная. В файловой семантике POSIX асинхронности нет, да.

mv ★★★★★
(28.10.17 06:27:43 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 25.10.17 20:23:35 MSK

а кстати как параллельно на диске может осуществляться ввод/вывод если читающая головка одна?

xperious ★★
(28.10.17 16:32:10 MSK) автор топика

Ответ на: комментарий от xperious 28.10.17 16:32:10 MSK

читающая головка одна

Нет. И вообще, чтение не так примитивно.

anonymous
(30.10.17 10:43:37 MSK)

Ссылка

Ответ на: комментарий от mv 28.10.17 06:25:37 MSK

Начали 25 лет назад, когда нагрузка сильно меньше была и треды дешевле

Это в каком плане треды были дешевле 25 лет назад?

tailgunner ★★★★★
(30.10.17 11:01:22 MSK)

Ответ на: комментарий от tailgunner 30.10.17 11:01:22 MSK

Это в каком плане треды были дешевле 25 лет назад?

Ну потери на свитч стали дороже и в софте, и в самом железе. А тогда там вообще юниксоподобное ядро без юзерспейса было.

mv ★★★★★
(31.10.17 05:12:03 MSK)

Ответ на: комментарий от mv 31.10.17 05:12:03 MSK

Это в каком плане треды были дешевле 25 лет назад?
Ну потери на свитч стали дороже и в софте, и в самом железе

В абсолютном времени они стали меньше и в железе, и в софте (по крайней мере, в ОС).

А тогда там вообще юниксоподобное ядро без юзерспейса было.

Хотя, если раньше всё было в едином адресном пространстве ядра, а потом перешло в Unix-процесс, тогда расходы могли и возрасти.

tailgunner ★★★★★
(31.10.17 09:44:00 MSK)

Ответ на: комментарий от tailgunner 31.10.17 09:44:00 MSK

В абсолютном времени они стали меньше и в железе, и в софте (по крайней мере, в ОС).

В тактах больше.

mv ★★★★★
(01.11.17 06:16:38 MSK)

Ответ на: комментарий от mv 01.11.17 06:16:38 MSK

Почему это важно?

tailgunner ★★★★★
(01.11.17 10:23:31 MSK)

Ответ на: комментарий от tailgunner 01.11.17 10:23:31 MSK

Почему это важно?

Кусок кода от переключения до переключения стал выполняться быстрее, а само переключение только прямо измеряемого времени - почти в 10 раз больше (по сравнению с юниксоподобным ядром). И, глядя на perf, прямо неизмеряемых потерь ещё прилично есть: кэш, TLB, ступор pipeline.

mv ★★★★★
(01.11.17 14:44:56 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Инициализация отричательным числом

Development

Выделить строку в QTableView по значению поля в модели (id)

→

Похожие темы